Multi-Agent 系统:协调才是真正的难点

Multi-Agent 系统:协调才是真正的难点

Multi-Agent 架构很有诱惑力,因为它映射到人类组织工作的方式:专家、协调者、交接协议。第一次把复杂任务在”研究员”Agent 和”作者”Agent 之间拆分时,结果确实更好。第三次的时候,你在调一个单 Agent 版本根本不会有的协调 bug。

协调税在哪里出现

Agent 对”已经做过什么”产生分歧。Agent 互相踩对方的工作,因为共享状态被异步更新、被不一致地读取。Agent 进入循环,因为两个 Agent 不停把同一步互相委托回去。每个团队第二个月引入的协调者 Agent 解决了一部分问题,并加上了它自己的失效模式:一个单点路由逻辑,模型必须每次都做对。

这个代价什么时候值

对子任务真正异质的任务——比如创意写作步加事实核查步加格式化步——专精能抵得上协调开销。对均匀但很长的任务,单 Agent 循环通常胜出。诚实的检验:一个人类独立操作员会和一个小团队做这件任务的方式不同吗?如果答案是”不会”,那 multi-agent 版本可能只是装成架构的开销。

Multi-Agent 系统默认情况下不比单 Agent 循环更快、更简单或更可靠。它们有时值得这份协调成本——能上线它们的团队,已经学会了对”什么时候值”保持怀疑。

相关文章

多自主才算太自主

多自主才算太自主

Agent 的自主性是一根滑杆,不是一个开关,正确档位由任务决定的多过由技术决定的。把滑杆推到"完全 ...

Agent 记忆:情景、语义,以及该留下什么

Agent 记忆:情景、语义,以及该留下什么

你建的第一个 Agent 没有当前对话之外的任何记忆,这能撑大约一周。然后用户回来,期望连续性,你开 ...

Planner-Executor 拆分:什么时候该拆,什么时候该合

Planner-Executor 拆分:什么时候该拆,什么时候该合

第一天,让单个模型同时做规划和执行,看起来很优雅。三个月后,trace 日志会讲一个不同的故事:Pr ...

生产环境的 ReAct:经得起跑题的推理循环

生产环境的 ReAct:经得起跑题的推理循环

ReAct 是一个干净的想法:思考、行动、观察、循环。在生产环境里,循环本身才是最容易崩的部分。模型 ...