Agent 框架速览
Agent 与主流框架速览
「Agent 不稀奇,能自己想、自己干、自己复盘的才是好 Agent。」但在落地时,常见问题是:Workflow 与 Agent 怎么选?哪些框架适合哪类场景?这页把关键判断与主流框架做成一份可快速上手的对比清单。
1. Workflow 和 Agent 的区别

先搞清楚一个基本问题:不是所有场景都需要 Agent。
- Workflow:步骤确定、分支有限、可提前穷举路径。比如「用户提交表单 → 校验 → 生成报告 → 发邮件」,每一步都是确定的。
- Agent:需要在对话中澄清、动态决策、跨系统协作,路径不可完全预设。比如「帮我查一下这个客户的退款进度」——要查哪个系统、需不需要额外信息、最终怎么处理,都要 AI 自己判断。
我们在实际项目中的经验是:80% 的场景用 Workflow 就够了,只有那些路径真正不可预测的场景才需要 Agent。很多团队一上来就想做 Agent,结果发现调试困难、成本高、可控性差,最后退回来用 Workflow 反而更稳定。
判断标准很简单:
- 步骤确定 → Workflow 更稳、更便宜、更好控。
- 长尾多变 → Agent 更能处理"问一句 → 查一下 → 再决定"。
2. 框架选择(基于热度与生态)

综合社区热度与生态成熟度,常见的 5 个框架如下:
| 框架 | 生态特点 | 适用倾向 |
|---|---|---|
| AutoGPT | 高自治、工具丰富 | 通用任务自动执行 |
| LangGraph | 图结构、可控流程 | 可拆解步骤的流程型任务 |
| Dify | 低代码、平台化 | 中等复杂度业务应用 |
| CrewAI | 多智能体编排 | 角色协作、任务探索 |
| AutoGen | 多代理对话 | 多角色协作与可观察性 |
3. 框架对比结论

下面这个对比表是基于我们团队在实际项目中使用这些框架后的总结,不是纯粹看文档得出的:
| 框架 | 适用场景 | 优势 | 不足 | 我们的选型建议 |
|---|---|---|---|---|
| AutoGPT | 通用复杂任务 | 高自主、任务拆解、工具丰富 | 成本高、可控性偏弱 | 适合探索和原型,不建议直接用于生产 |
| LangGraph | 可拆解流程 | 可观测、易调试、可控 | 自主性有限 | 生产首选——可控性和可调试性是生产环境的刚需 |
| Dify | 中等复杂度应用 | 低门槛、上手快 | 功能广而不精 | 适合快速验证 MVP,团队没有专职 AI 工程师时的好选择 |
| CrewAI | 角色协作型 | 工具生态强、灵活 | 特定能力需补齐 | 多 Agent 协作场景值得尝试 |
| AutoGen | 多代理对话 | 多代理原生支持 | 社区生态仍在成长 | 微软背书,长期看好,但目前文档和案例偏少 |
4. 什么时候应该用 Agent?
满足以下特征,Agent 通常更合适:
- 问题不可完全穷举、路径不确定。
- 需要跨多个系统查证并动态组合。
- 对话中需要澄清、协商与决策。
反过来说,如果你能画出一张完整的流程图,所有分支都能穷举出来——那就用 Workflow,别折腾 Agent。
5. 真实场景:客服链路的分支爆炸
这是我们在一个电商项目中遇到的实际情况,很有代表性。
Workflow 在"长尾问题"容易出现分支爆炸:同一条"包裹没到"可能要综合物流状态、政策时段、用户等级、地址异常、促销规则等多个因素,固定流程会变得复杂且难维护。我们最初用规则引擎做这个场景,写了 200+ 条规则,每次改一条都担心影响其他的。
后来切换到 Agent 模式,像团队协作一样拆分职责:
- Planner 拆意图并澄清(「你是要查物流还是申请退款?」)
- 工具 Agent 查物流/支付/CRM(各自调自己的 API)
- Policy Agent 推理合规政策(「这个订单在 7 天无理由退货期内吗?」)
- 执行 Agent 操作工单与闭环
切换后的效果:规则维护成本降了 70%,长尾问题的解决率从 45% 提升到 82%。但 API 调用成本增加了约 3 倍——这个 trade-off 需要根据业务价值来判断。
6. 主流框架速览
6.1 AutoGPT

定位:高自治 Agent 框架,擅长任务拆解与多步执行。
优势:
- 目标驱动、自动拆解子任务
- 工具接口丰富,适合复杂链式任务
不足:
- 任务越长越容易偏离上下文——我们测试过一个 10 步任务,到第 7 步时模型已经「忘了」最初的目标
- 成本与执行效率需控制,一个复杂任务动辄消耗 10K+ tokens

6.2 LangGraph

定位:图结构编排框架,强调可控流程与可观察性。
优势:
- 结构清晰、流程可控——每个节点做什么、怎么跳转都是明确的
- 易调试、支持持久化状态——生产环境出了问题能快速定位到哪个节点
不足:
- 自主性偏弱——如果你的场景需要 Agent 自己决定下一步做什么,LangGraph 需要额外设计
- 预构建模式灵活度有限
6.3 Dify

定位:低代码 AI 应用平台,强调快速交付。
优势:
- 上手快、集成模型与工具方便——拖拽就能搭出一个 RAG 应用
- 适合中等复杂度应用
不足:
- 重量级应用需要权衡复杂度
- 深度定制场景需二次开发——比如自定义检索策略或复杂的 Agent 协作逻辑

6.4 CrewAI

定位:多智能体协作框架,强调角色分工。
优势:
- 生态集成丰富
- 适合任务探索与协作——「研究员」收集信息,「分析师」做总结,「编辑」润色输出
不足:
- 特定能力(如代码沙盒)需额外补齐

6.5 AutoGen

定位:微软开源的多代理对话框架,强调协作与可观察。
优势:
- 多代理原生支持
- 灵活对话流程控制
不足:
- 生态仍在成长,文档与案例不如成熟框架——但微软在持续投入,2025 年的更新频率明显加快
7. 总结
选框架之前先回答一个问题:你的场景是 Workflow 还是 Agent?
Workflow 适合"可穷举、可预测、可控"的流程;Agent 适合"动态决策、跨系统协作、需澄清与协商"的复杂问题。
如果是生产环境的 Agent,我们的建议是 LangGraph 优先——可控性和可调试性在生产中比灵活性更重要。如果是快速验证想法,Dify 上手最快。如果是多 Agent 协作的研究项目,CrewAI 和 AutoGen 都值得尝试。
最终选择要综合三个因素:任务形态(Workflow vs Agent)、团队能力(有没有 AI 工程师)、和运行成本(Agent 的 API 调用费用通常是 Workflow 的 3-5 倍)。
📚 相关资源
❓ 常见问题
关于本章主题最常被搜索的问题,点击展开答案
我的项目到底该用 Workflow 还是 Agent?怎么判断?
经验法则:80% 的场景用 Workflow 就够了。判断标准 —— 步骤是否能完全穷举?路径分支是否有限?能否提前画完整的流程图?如果都是 yes,用 Workflow(更稳、更便宜、更好控)。只有当问题路径无法预设、需要在对话中澄清、需要跨多系统动态组合(如 "帮我查这个客户的退款进度")时,才上 Agent。很多团队一上来就做 Agent 结果调试困难、成本高、可控性差,最后退回 Workflow 才稳定。
AutoGPT、LangGraph、Dify、CrewAI、AutoGen 这五个框架生产环境该选哪个?
生产首选 LangGraph —— 图结构编排、流程可观测、可调试、支持持久化状态,每个节点做什么和怎么跳转都明确。AutoGPT 高自治但成本高、可控性弱,适合探索原型不建议直接生产。Dify 低代码上手快,适合快速验证 MVP 或团队没专职 AI 工程师。CrewAI 适合多 Agent 角色协作场景。AutoGen 微软背书长期看好,但 2025 年文档和案例还在追赶。本章作者团队的实战经验:可控性和可调试性在生产中比灵活性更重要。
Agent 比 Workflow 贵多少?什么时候这个成本值得?
Agent 的 API 调用费用通常是 Workflow 的 3-5 倍。本章一个真实案例:电商客服从规则引擎(200+ 条规则)切到 Agent 模式(Planner + 工具 Agent + Policy Agent + 执行 Agent),规则维护成本降 70%、长尾问题解决率从 45% 升到 82%,但 API 调用成本增加约 3 倍。trade-off 取决于业务价值 —— 长尾覆盖 + 维护省人力能否覆盖多出来的 token 费?标准流程显然不值,复杂客服 / 多系统协查这类场景才值。
AutoGPT 跑长任务为什么容易跑歪?
上下文管理跟不上。本章作者测试一个 10 步任务,AutoGPT 到第 7 步时模型已经 "忘了" 最初的目标 —— 因为每一步的 reasoning + tool output 都堆进 context window,越往后越稀释最初的指令。一个复杂任务动辄消耗 10K+ tokens 也是这原因。解决要么换 LangGraph 这种有显式 state 管理的框架,要么定期 summarize 已完成步骤、释放 context 空间,要么把任务拆成多个独立 agent run(每次都从干净 context 开始)。
客服系统从规则引擎切到多 Agent 协作具体怎么拆?
本章电商客服真实案例分四个角色:(1) Planner —— 拆意图并澄清("你是要查物流还是申请退款?");(2) 工具 Agent —— 各自调物流 / 支付 / CRM 的 API;(3) Policy Agent —— 推理合规政策("这单在 7 天无理由退货期内吗?");(4) 执行 Agent —— 操作工单与闭环。这种拆分的核心是按 "决策性质" 而不是 "功能模块" 划分 —— 每个 Agent 拿到的 context 干净、职责单一,比单 Agent 塞 200+ 规则可维护得多。