企业级 Background Agent 实践:从概念框架到 Ramp/Stripe 落地
Core Idea “Agents running in the background” ≠ “Background Agents”。Background Agent 是一个有隔离计算 + 事件路由 + 治理体系的自主交付系统。Ramp 30% PR、Stripe 1300+ PR/周的数据证明:关键不是模型能力,而是 MicroVM 沙箱 + 确定性反馈循环 + 已有基础设施复用 的工程化落地。 零、什么是 Background Agent — 概念框架 在讨论具体实现之前,需要先厘清定义。background-agents.com 给出了一个重要区分: 你可以开多个终端、用 git worktree、甚至在角落放个 Mac Mini 跑 Agent——但那只是 agents running in the background。Background Agent 是一个有完整基础设施和治理体系的自主交付系统。 三层基础设施模型 Background Agent 不是一个工具,而是一个系统。它需要三层基础设施协同: 层 职责 对应实现 隔离计算环境 按需启动沙箱,Agent 在其中安全执行 Ramp: Modal VM / Stripe: EC2 Devbox 事件路由系统 基于触发条件调度 Agent PR 事件、安全漏洞、Slack 消息、定时任务 治理层 权限、审计、故障隔离(blast radius 控制) 人类 PR review、MCP 工具权限控制 Background Agent vs CI/CD 维度 CI/CD Pipeline Background Agent 执行内容 预定义步骤(build → test → deploy) 自主决策(分析问题 → 生成代码 → 验证 → 提 PR) 代码生成 不生成新代码 核心能力就是生成代码 决策能力 无,纯确定性执行 有,能根据上下文选择方案 失败处理 终止或重试 分析原因、自动修复、迭代 高价值落地场景 Agent 最先产生价值的不是"写新功能",而是大规模重复性工程任务(消灭 toil): ...