AI智能体工作流，突破LLM代际差异，GPT-3.5干出4.0的效果-唐霜

事件背景

今天一篇“吴恩达：AI智能体工作流……超转载请注明出处：www.tangshuang.net转载请注明出处：www.tangshuang.net过下一代基础模型”的文章刷屏，随后我去看著作权归作者所有，禁止商业用途转载。原创内容，盗版必究。了原文，觉得现在的媒体有点脑残夸张，用标题取胜【版权所有】唐霜 www.tangshuang.net本文版权归作者所有，未经授权不得转载。。实际上吴的意思是通过agent wor原创内容，盗版必究。【关注微信公众号：wwwtangshuangnet】kflows可以大幅提高LLMs的输出表【关注微信公众号：wwwtangshuangnet】本文版权归作者所有，未经授权不得转载。现（performance），因此，他猜【本文首发于唐霜的博客】【转载请注明来源】测今年构建agent工作流会是一个比基础本文版权归作者所有，未经授权不得转载。【转载请注明来源】模型建设更重要的趋势，他自己也会投入更多【原创内容，转载请注明出处】本文版权归作者所有，未经授权不得转载。注意力在这件事上。

【本文受版权保护】【访问 www.tangshuang.net 获取更多精彩内容】本文版权归作者所有，未经授权不得转载。【原创不易，请尊重版权】

通过吴的实验，在相同的一个任务目标中，“GPT-3.5 (zero shot) 转载请注明出处：www.tangshuang.net著作权归作者所有，禁止商业用途转载。正确率为48.1%。GPT-4 (zer本文版权归作者所有，未经授权不得转载。【本文首发于唐霜的博客】o shot) 的表现更好，为67.0%【转载请注明来源】著作权归作者所有，禁止商业用途转载。。然而，从GPT-3.5到GPT-4的提本文作者：唐霜，转载请注明出处。【访问 www.tangshuang.net 获取更多精彩内容】升与合并迭代智能体工作流相比显得微不足道【版权所有】唐霜 www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】。实际上，在智能体循环里运行，GPT-3本文版权归作者所有，未经授权不得转载。【原创内容，转载请注明出处】.5可以达到95.1%的正确率”。这说明一个非常关键的问题，以前我们会认为GPT-4会被GPT-3.【关注微信公众号：wwwtangshuangnet】【关注微信公众号：wwwtangshuangnet】5强很多，但是在agent workfl著作权归作者所有，禁止商业用途转载。【未经授权禁止转载】ows的加持下，两者的差别却几乎没有，可【本文受版权保护】【访问 www.tangshuang.net 获取更多精彩内容】见，在面对具体问题的时候，AI的智能程度未经授权，禁止复制转载。【版权所有，侵权必究】，并不能绝对的决定它的最终表现，而通过好【关注微信公众号：wwwtangshuangnet】著作权归作者所有，禁止商业用途转载。的软件架构，也能明显提升目标效果。

有了这样的一个认识基础，我们有理由相信，【原创内容，转载请注明出处】本文版权归作者所有，未经授权不得转载。通过应用层面的模式运用和架构设计，可以更未经授权，禁止复制转载。未经授权，禁止复制转载。好的解决实际问题，而非在基础模型建设上，本文作者：唐霜，转载请注明出处。本文作者：唐霜，转载请注明出处。拼命的持续投入。这对我们现在业界的情况冲【原创不易，请尊重版权】原创内容，盗版必究。击还是挺大的，因为包括openAI在内的原创内容，盗版必究。【原创内容，转载请注明出处】厂商，现在都在做基础模型的竞赛，GPT-转载请注明出处：www.tangshuang.net【原创不易，请尊重版权】4之后，很快就会出GPT-5，其他厂商也本文作者：唐霜，转载请注明出处。转载请注明出处：www.tangshuang.net在宣称自己的模型比GPT-4更优秀。然而【版权所有】唐霜 www.tangshuang.net原创内容，盗版必究。，如果这些基础模型的表现和通过agent转载请注明出处：www.tangshuang.net著作权归作者所有，禁止商业用途转载。 workflows优化后的应用相比，结【原创不易，请尊重版权】原创内容，盗版必究。果就会差强人意。这也就是为什么吴说自己会本文作者：唐霜，转载请注明出处。【版权所有，侵权必究】在今年更加专注智能体工作流这件事。

智能体设计模式

吴在同篇推送中提出了基于工作流思路，有4本文版权归作者所有，未经授权不得转载。转载请注明出处：www.tangshuang.net种智能体的设计模式，可以帮助我们实现利用本文作者：唐霜，转载请注明出处。【本文首发于唐霜的博客】workflow来优化LLMs表现。这4原创内容，盗版必究。本文作者：唐霜，转载请注明出处。种模式分别是：

转载请注明出处：www.tangshuang.net【关注微信公众号：wwwtangshuangnet】【原创内容，转载请注明出处】【原创内容，转载请注明出处】

Reflection：LLM审查自己的工原创内容，盗版必究。本文版权归作者所有，未经授权不得转载。作，提出改进的方法。

【转载请注明来源】

Tool use：LLM被赋予工具，如网【访问 www.tangshuang.net 获取更多精彩内容】【版权所有】唐霜 www.tangshuang.net络搜索，代码执行，或任何其他功能，以帮助【本文首发于唐霜的博客】【本文首发于唐霜的博客】它收集信息，采取行动，或处理数据。

著作权归作者所有，禁止商业用途转载。

【未经授权禁止转载】

【关注微信公众号：wwwtangshuangnet】

Planning：LLM提出并执行一个多【关注微信公众号：wwwtangshuangnet】本文版权归作者所有，未经授权不得转载。步骤计划来实现一个目标（例如，编写一篇文【转载请注明来源】本文作者：唐霜，转载请注明出处。章的大纲，然后进行在线研究、编写草稿，等未经授权，禁止复制转载。转载请注明出处：www.tangshuang.net等）。

转载请注明出处：www.tangshuang.net

未经授权，禁止复制转载。

Multi-agent collabor【原创不易，请尊重版权】【版权所有】唐霜 www.tangshuang.netation：多个AI智能体一起工作，分解【版权所有】唐霜 www.tangshuang.net【本文受版权保护】任务、讨论和辩论想法，提出比单个智能体更【版权所有】唐霜 www.tangshuang.net【原创内容，转载请注明出处】好的解决方案。

转载请注明出处：www.tangshuang.net

未经授权，禁止复制转载。

【本文受版权保护】

其实，从我个人的角度来看，前3种模式基本本文作者：唐霜，转载请注明出处。转载请注明出处：www.tangshuang.net都out了。目前业界的发展很快，前3种都原创内容，盗版必究。著作权归作者所有，禁止商业用途转载。是古早的方法，人工也可以操作，其中too【本文首发于唐霜的博客】【本文受版权保护】l use就包括了RAG知识库模式。就目【本文受版权保护】【版权所有】唐霜 www.tangshuang.net前来看，主流的趋势是第4种，即multi【访问 www.tangshuang.net 获取更多精彩内容】【本文受版权保护】-agent模式，这在我上一篇博客中已经【本文首发于唐霜的博客】著作权归作者所有，禁止商业用途转载。解释过了，这里就不再过多解释。目前市面上【访问 www.tangshuang.net 获取更多精彩内容】【访问 www.tangshuang.net 获取更多精彩内容】能够出来令人感到一点惊艳的，大部份都是采转载请注明出处：www.tangshuang.net转载请注明出处：www.tangshuang.net用这种模式，例如Devin，它作为一个用未经授权，禁止复制转载。转载请注明出处：www.tangshuang.net来编程的程序员AI，本质上它自己并不只完【本文首发于唐霜的博客】【本文首发于唐霜的博客】成程序员的工作，它还要完成研发流程上各个本文版权归作者所有，未经授权不得转载。转载请注明出处：www.tangshuang.net角色的工作，例如任务理解和拆分（研发PM【关注微信公众号：wwwtangshuangnet】【访问 www.tangshuang.net 获取更多精彩内容】）、测试（QA）、质量评估、部署上线（D著作权归作者所有，禁止商业用途转载。【作者：唐霜】evOps）等等，最终在一个工作流生命周【原创不易，请尊重版权】本文作者：唐霜，转载请注明出处。期中生产产物（而非代码碎片），从而给人非本文作者：唐霜，转载请注明出处。未经授权，禁止复制转载。常惊艳的感觉。另外，从概念上讲multi转载请注明出处：www.tangshuang.net未经授权，禁止复制转载。-agent模式不是智能体本身的设计模式【未经授权禁止转载】未经授权，禁止复制转载。，而是构建AI智能系统的模式，当然，如果【未经授权禁止转载】【未经授权禁止转载】把一个具有复杂设计的系统也作为智能体，也著作权归作者所有，禁止商业用途转载。【版权所有】唐霜 www.tangshuang.net是可以的，那就是一个包含了内部agent【本文首发于唐霜的博客】原创内容，盗版必究。的big agent。

著作权归作者所有，禁止商业用途转载。【原创不易，请尊重版权】著作权归作者所有，禁止商业用途转载。著作权归作者所有，禁止商业用途转载。

多智能体工作流

工作流可以有效的帮我们提升工作的成果质量【未经授权禁止转载】本文作者：唐霜，转载请注明出处。，本质上是因为系统论原理。就像人类社会的生产一样，独立一个人的生本文作者：唐霜，转载请注明出处。转载请注明出处：www.tangshuang.net产能力是有限的，但是如果形成一个组织（如【版权所有，侵权必究】【原创内容，转载请注明出处】公司）来进行生产，通过系统化的分工和管理【作者：唐霜】【访问 www.tangshuang.net 获取更多精彩内容】，提升效率，就可以达到1+1>2的【版权所有】唐霜 www.tangshuang.net著作权归作者所有，禁止商业用途转载。效果。因此，工作流模式解决实际问题，我也【本文受版权保护】未经授权，禁止复制转载。认为是目前为止最好的应用路径。从AI的发本文版权归作者所有，未经授权不得转载。著作权归作者所有，禁止商业用途转载。展来看，智能程度的提升就像人脑智力水平高未经授权，禁止复制转载。未经授权，禁止复制转载。，然而实际要干活，还是得靠智力水平一般，【本文受版权保护】转载请注明出处：www.tangshuang.net但是勤奋努力的个体来实现。所以，未来当我【本文受版权保护】【本文首发于唐霜的博客】们拥有足够智力水平的LLM底座之后，发展本文作者：唐霜，转载请注明出处。【访问 www.tangshuang.net 获取更多精彩内容】的方向一定是基于系统论的应用层构建。

【访问 www.tangshuang.net 获取更多精彩内容】【未经授权禁止转载】未经授权，禁止复制转载。

以LangGraph为例，它已经是按mu本文版权归作者所有，未经授权不得转载。【原创内容，转载请注明出处】lti-agent模式设计好的框架，开发转载请注明出处：www.tangshuang.net【转载请注明来源】者只需要按照它的使用方法，完成下面3件事【原创内容，转载请注明出处】未经授权，禁止复制转载。，就可以开发出自己的AI工作流：

【作者：唐霜】【访问 www.tangshuang.net 获取更多精彩内容】

工具定义

【未经授权禁止转载】

【本文受版权保护】

LLM接入

【原创不易，请尊重版权】

【关注微信公众号：wwwtangshuangnet】

【本文受版权保护】

本文作者：唐霜，转载请注明出处。

流程定义

本文作者：唐霜，转载请注明出处。

原创内容，盗版必究。

工具是最终干实事的部分，可以调用网络接口【原创不易，请尊重版权】【版权所有】唐霜 www.tangshuang.net，也可以是驱动本地软件、硬件等，通过这些转载请注明出处：www.tangshuang.net【未经授权禁止转载】工具，agent才能产生实际的生产效果。原创内容，盗版必究。【版权所有】唐霜 www.tangshuang.net流程定义部分比较复杂，这里面就需要定义做【本文首发于唐霜的博客】【原创内容，转载请注明出处】这件事应该如何去划分职责，如何规划阶段，【关注微信公众号：wwwtangshuangnet】【关注微信公众号：wwwtangshuangnet】每个阶段不同角色应该做什么事，达到什么样本文版权归作者所有，未经授权不得转载。转载请注明出处：www.tangshuang.net的条件，如何去执行动作等等。它在设计上提【原创不易，请尊重版权】【本文受版权保护】供了3中模式：

【本文首发于唐霜的博客】【转载请注明来源】著作权归作者所有，禁止商业用途转载。本文版权归作者所有，未经授权不得转载。

多智能体协同模式

【未经授权禁止转载】【原创不易，请尊重版权】【访问 www.tangshuang.net 获取更多精彩内容】

【原创内容，转载请注明出处】本文作者：唐霜，转载请注明出处。

监督人模式

【访问 www.tangshuang.net 获取更多精彩内容】原创内容，盗版必究。【访问 www.tangshuang.net 获取更多精彩内容】

分层次团队模式

转载请注明出处：www.tangshuang.net原创内容，盗版必究。【原创内容，转载请注明出处】

可以看出，一方面，我们需要让分工更加明确【作者：唐霜】【版权所有，侵权必究】，一件事由一个agent完成，这样可以更【版权所有】唐霜 www.tangshuang.net转载请注明出处：www.tangshuang.net高效；另一方面，我们需要让这些agent【版权所有，侵权必究】【版权所有】唐霜 www.tangshuang.net协同起来，通过有效的组织、联系、反馈，来未经授权，禁止复制转载。原创内容，盗版必究。让整套工作流运作更加高效。

结语

从本文中，你肯定可以发现一些规律，即ag原创内容，盗版必究。未经授权，禁止复制转载。ents以workflow的模式来进行工【作者：唐霜】著作权归作者所有，禁止商业用途转载。作，可能会是将来AI应用的主要开发模式。转载请注明出处：www.tangshuang.net转载请注明出处：www.tangshuang.net在这样的体系中，分工会越来越细，每一个a【原创不易，请尊重版权】【转载请注明来源】gent都可以在单独某个方面具备更优秀的【版权所有】唐霜 www.tangshuang.net【版权所有】唐霜 www.tangshuang.net能力，这也意味着在一套系统中，我们可能需著作权归作者所有，禁止商业用途转载。原创内容，盗版必究。要多个领域的小模型或者经过微调的LLM。同时，我们也可以看到，由于分工很细，有【版权所有，侵权必究】【未经授权禁止转载】不少agent的功能愈发单一，我们就可以【原创不易，请尊重版权】【本文首发于唐霜的博客】采用耗能更小的技术架构来实现这类agen【版权所有，侵权必究】转载请注明出处：www.tangshuang.nett，只有那种需要非常高智能的agent，【本文受版权保护】【版权所有】唐霜 www.tangshuang.net我们才可能需要比GPT-4更高智能的大模转载请注明出处：www.tangshuang.net【原创内容，转载请注明出处】型，这就显得更加环保，对当下芯片资源、电力资源紧张感有一定的【未经授权禁止转载】本文作者：唐霜，转载请注明出处。缓解作用。另外一方面，由于这种越来越细的本文版权归作者所有，未经授权不得转载。【转载请注明来源】分工，我们需要一个agent market来随时扩展系统能力，当用户在平台上准备让【转载请注明来源】【未经授权禁止转载】AI完成自己的任务，但是又没有在当前系统【版权所有】唐霜 www.tangshuang.net转载请注明出处：www.tangshuang.net中看到可以实现自己需要的能力的agent原创内容，盗版必究。【未经授权禁止转载】时，可以便捷的在market上载入新的a【未经授权禁止转载】【原创不易，请尊重版权】gent。基于这一思考，我们就会豁然开朗【本文首发于唐霜的博客】未经授权，禁止复制转载。，为什么吴恩达会认为智能体工作流会是今年【版权所有】唐霜 www.tangshuang.net本文作者：唐霜，转载请注明出处。一个重要的课题了。

原创内容，盗版必究。【版权所有】唐霜 www.tangshuang.net【本文受版权保护】【版权所有，侵权必究】【转载请注明来源】【版权所有】唐霜 www.tangshuang.net【版权所有】唐霜 www.tangshuang.net【未经授权禁止转载】转载请注明出处：www.tangshuang.net转载请注明出处：www.tangshuang.net未经授权，禁止复制转载。【关注微信公众号：wwwtangshuangnet】【版权所有】唐霜 www.tangshuang.net未经授权，禁止复制转载。转载请注明出处：www.tangshuang.net【未经授权禁止转载】【本文受版权保护】【版权所有】唐霜 www.tangshuang.net未经授权，禁止复制转载。本文版权归作者所有，未经授权不得转载。【转载请注明来源】著作权归作者所有，禁止商业用途转载。【原创内容，转载请注明出处】未经授权，禁止复制转载。【原创不易，请尊重版权】本文版权归作者所有，未经授权不得转载。

2024-03-28 3319

唐霜

AI智能体工作流，突破LLM代际差异，GPT-3.5干出4.0的效果

事件背景

智能体设计模式

多智能体工作流

结语

为价值买单，打赏一杯咖啡

声明

关于

生态