放手让 Agent 跑:分解、上下文与记忆
前三章你还是坐在 Agent 前面一问一答。规约写好了,验证体系搭好了,单任务的闭环合上了。很自然的下一步是:让 Agent 自己跑。打开 YOLO mode,给它一个大任务,去喝杯咖啡,回来收代码。
现实往往是灾难性的。社区里大量 YOLO mode 翻车案例:Agent 跑了两个小时,产出了几千行代码,但前半段的架构决策在后半段被无声推翻,接口定义前后不一致,同一个问题用了三种不同的解法。你花在修复上的时间比自己写还多。阿里巴巴和中山大学的研究也验证了这一点:Agent 在超长期任务中的表现会系统性恶化,任务越长、上下文越膨胀,产出质量下降越严重。[citation]
问题在于上下文的墙。Agent 的有效处理容量有硬上限,执行时间一长就会撞上去。但这堵墙可以翻过去。任务分解将大任务切成 Agent 能消化的块,知识持久化让关键信息在会话边界存活,而 Session 这一执行单元把运行状态、上下文和资源绑定成一个可调度的整体。掌握了这些,Agent 可以跨会话、跨天地持续推进一个项目。你从 Agent 的实时对话伙伴变成了任务的设计者和验收者。