AI智能体工作流,突破LLM代际差异,GPT-3.5干出4.0的效果

广告位招租
扫码页面底部二维码联系

事件背景

今天一篇“吴恩达:AI智能体工作流……超【原创内容,转载请注明出处】本文作者:唐霜,转载请注明出处。过下一代基础模型”的文章刷屏,随后我去看【本文首发于唐霜的博客】【未经授权禁止转载】原文,觉得现在的媒体有点脑残夸张,用标题取胜【转载请注明来源】转载请注明出处:www.tangshuang.net。实际上吴的意思是通过agent wor本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。kflows可以大幅提高LLMs的输出表未经授权,禁止复制转载。【本文首发于唐霜的博客】现(performance),因此,他猜【原创不易,请尊重版权】【未经授权禁止转载】测今年构建agent工作流会是一个比基础【访问 www.tangshuang.net 获取更多精彩内容】原创内容,盗版必究。模型建设更重要的趋势,他自己也会投入更多【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】注意力在这件事上。

原创内容,盗版必究。【版权所有,侵权必究】【未经授权禁止转载】【本文受版权保护】

通过吴的实验,在相同的一个任务目标中,“GPT-3.5 (zero shot) 【本文受版权保护】【版权所有】唐霜 www.tangshuang.net正确率为48.1%。GPT-4 (zer本文版权归作者所有,未经授权不得转载。【访问 www.tangshuang.net 获取更多精彩内容】o shot) 的表现更好,为67.0%【转载请注明来源】【版权所有,侵权必究】。然而,从GPT-3.5到GPT-4的提转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】升与合并迭代智能体工作流相比显得微不足道【关注微信公众号:wwwtangshuangnet】【版权所有】唐霜 www.tangshuang.net。实际上,在智能体循环里运行,GPT-3【访问 www.tangshuang.net 获取更多精彩内容】原创内容,盗版必究。.5可以达到95.1%的正确率”。这说明一个非常关键的问题,以前我们会认为GPT-4会被GPT-3.未经授权,禁止复制转载。转载请注明出处:www.tangshuang.net5强很多,但是在agent workfl著作权归作者所有,禁止商业用途转载。【转载请注明来源】ows的加持下,两者的差别却几乎没有,可【未经授权禁止转载】【关注微信公众号:wwwtangshuangnet】见,在面对具体问题的时候,AI的智能程度【转载请注明来源】本文版权归作者所有,未经授权不得转载。,并不能绝对的决定它的最终表现,而通过好本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.net的软件架构,也能明显提升目标效果

【版权所有】唐霜 www.tangshu转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】ang.net【版权所有】唐霜 www.tangshu未经授权,禁止复制转载。【未经授权禁止转载】ang.net【作者:唐霜】

著作权归作者所有,禁止商业用途转载。【原创内容,转载请注明出处】

有了这样的一个认识基础,我们有理由相信,【关注微信公众号:wwwtangshuangnet】本文作者:唐霜,转载请注明出处。通过应用层面的模式运用和架构设计,可以更原创内容,盗版必究。【本文受版权保护】好的解决实际问题,而非在基础模型建设上,未经授权,禁止复制转载。【转载请注明来源】拼命的持续投入。这对我们现在业界的情况冲转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】击还是挺大的,因为包括openAI在内的【原创内容,转载请注明出处】【本文受版权保护】厂商,现在都在做基础模型的竞赛,GPT-著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。4之后,很快就会出GPT-5,其他厂商也【转载请注明来源】【原创不易,请尊重版权】在宣称自己的模型比GPT-4更优秀。然而【版权所有,侵权必究】【原创内容,转载请注明出处】,如果这些基础模型的表现和通过agent本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.net workflows优化后的应用相比,结【版权所有,侵权必究】【版权所有】唐霜 www.tangshuang.net果就会差强人意。这也就是为什么吴说自己会原创内容,盗版必究。【本文首发于唐霜的博客】在今年更加专注智能体工作流这件事。

【关注微信公众号:wwwtangshua【未经授权禁止转载】原创内容,盗版必究。ngnet】【访问 www.tangshuang.n本文版权归作者所有,未经授权不得转载。【访问 www.tangshuang.net 获取更多精彩内容】et 获取更多精彩内容】转载请注明出处:www.tangshua本文版权归作者所有,未经授权不得转载。【本文受版权保护】ng.net【原创不易,请尊重版权】

智能体设计模式

吴在同篇推送中提出了基于工作流思路,有4本文版权归作者所有,未经授权不得转载。【版权所有】唐霜 www.tangshuang.net种智能体的设计模式,可以帮助我们实现利用未经授权,禁止复制转载。【关注微信公众号:wwwtangshuangnet】workflow来优化LLMs表现。这4【原创不易,请尊重版权】【本文首发于唐霜的博客】种模式分别是:

【本文受版权保护】【访问 www.tangshuang.n著作权归作者所有,禁止商业用途转载。【作者:唐霜】et 获取更多精彩内容】
  • Reflection:LLM审查自己的工【本文首发于唐霜的博客】转载请注明出处:www.tangshuang.net作,提出改进的方法。
  • 【版权所有】唐霜 www.tangshu【关注微信公众号:wwwtangshuangnet】本文作者:唐霜,转载请注明出处。ang.net转载请注明出处:www.tangshua【访问 www.tangshuang.net 获取更多精彩内容】【原创不易,请尊重版权】ng.net【版权所有】唐霜 www.tangshu【版权所有,侵权必究】【原创不易,请尊重版权】ang.net【原创不易,请尊重版权】
  • Tool use:LLM被赋予工具,如网本文版权归作者所有,未经授权不得转载。【本文首发于唐霜的博客】络搜索,代码执行,或任何其他功能,以帮助本文版权归作者所有,未经授权不得转载。转载请注明出处:www.tangshuang.net它收集信息,采取行动,或处理数据。
  • 本文版权归作者所有,未经授权不得转载。本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】著作权归作者所有,禁止商业用途转载。
  • Planning:LLM提出并执行一个多原创内容,盗版必究。【本文首发于唐霜的博客】步骤计划来实现一个目标(例如,编写一篇文【原创内容,转载请注明出处】【未经授权禁止转载】章的大纲,然后进行在线研究、编写草稿,等著作权归作者所有,禁止商业用途转载。【本文受版权保护】等)。
  • 【版权所有,侵权必究】著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshua原创内容,盗版必究。【本文受版权保护】ng.net
  • Multi-agent collabor【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。ation:多个AI智能体一起工作,分解【版权所有】唐霜 www.tangshuang.net【关注微信公众号:wwwtangshuangnet】任务、讨论和辩论想法,提出比单个智能体更【转载请注明来源】本文版权归作者所有,未经授权不得转载。好的解决方案。
  • 【关注微信公众号:wwwtangshua【本文首发于唐霜的博客】本文版权归作者所有,未经授权不得转载。ngnet】本文作者:唐霜,转载请注明出处。【关注微信公众号:wwwtangshua【本文受版权保护】转载请注明出处:www.tangshuang.netngnet】著作权归作者所有,禁止商业用途转载。

其实,从我个人的角度来看,前3种模式基本未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.net都out了。目前业界的发展很快,前3种都著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。是古早的方法,人工也可以操作,其中too未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。l use就包括了RAG知识库模式。就目著作权归作者所有,禁止商业用途转载。著作权归作者所有,禁止商业用途转载。前来看,主流的趋势是第4种,即multi本文版权归作者所有,未经授权不得转载。未经授权,禁止复制转载。-agent模式,这在我上一篇博客中已经【版权所有】唐霜 www.tangshuang.net【未经授权禁止转载】解释过了,这里就不再过多解释。目前市面上原创内容,盗版必究。【版权所有,侵权必究】能够出来令人感到一点惊艳的,大部份都是采【版权所有,侵权必究】原创内容,盗版必究。用这种模式,例如Devin,它作为一个用未经授权,禁止复制转载。【原创不易,请尊重版权】来编程的程序员AI,本质上它自己并不只完本文版权归作者所有,未经授权不得转载。本文作者:唐霜,转载请注明出处。成程序员的工作,它还要完成研发流程上各个【版权所有】唐霜 www.tangshuang.net本文作者:唐霜,转载请注明出处。角色的工作,例如任务理解和拆分(研发PM著作权归作者所有,禁止商业用途转载。【作者:唐霜】)、测试(QA)、质量评估、部署上线(D【访问 www.tangshuang.net 获取更多精彩内容】【转载请注明来源】evOps)等等,最终在一个工作流生命周【转载请注明来源】本文版权归作者所有,未经授权不得转载。期中生产产物(而非代码碎片),从而给人非【版权所有】唐霜 www.tangshuang.net转载请注明出处:www.tangshuang.net常惊艳的感觉。另外,从概念上讲multi【版权所有,侵权必究】【原创内容,转载请注明出处】-agent模式不是智能体本身的设计模式【版权所有】唐霜 www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】,而是构建AI智能系统的模式,当然,如果本文作者:唐霜,转载请注明出处。【作者:唐霜】把一个具有复杂设计的系统也作为智能体,也原创内容,盗版必究。原创内容,盗版必究。是可以的,那就是一个包含了内部agent未经授权,禁止复制转载。【原创不易,请尊重版权】的big agent。

【本文首发于唐霜的博客】原创内容,盗版必究。

多智能体工作流

工作流可以有效的帮我们提升工作的成果质量著作权归作者所有,禁止商业用途转载。【本文首发于唐霜的博客】,本质上是因为系统论原理。就像人类社会的生产一样,独立一个人的生【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.net产能力是有限的,但是如果形成一个组织(如著作权归作者所有,禁止商业用途转载。【本文受版权保护】公司)来进行生产,通过系统化的分工和管理【转载请注明来源】转载请注明出处:www.tangshuang.net,提升效率,就可以达到1+1>2的【版权所有,侵权必究】未经授权,禁止复制转载。效果。因此,工作流模式解决实际问题,我也【版权所有,侵权必究】【原创不易,请尊重版权】认为是目前为止最好的应用路径。从AI的发著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】展来看,智能程度的提升就像人脑智力水平高本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.net,然而实际要干活,还是得靠智力水平一般,【本文首发于唐霜的博客】未经授权,禁止复制转载。但是勤奋努力的个体来实现。所以,未来当我转载请注明出处:www.tangshuang.net【原创不易,请尊重版权】们拥有足够智力水平的LLM底座之后,发展【原创内容,转载请注明出处】转载请注明出处:www.tangshuang.net的方向一定是基于系统论的应用层构建。

本文版权归作者所有,未经授权不得转载。未经授权,禁止复制转载。【未经授权禁止转载】【访问 www.tangshuang.n【原创内容,转载请注明出处】【转载请注明来源】et 获取更多精彩内容】

以LangGraph为例,它已经是按mu【本文首发于唐霜的博客】著作权归作者所有,禁止商业用途转载。lti-agent模式设计好的框架,开发【版权所有,侵权必究】【版权所有】唐霜 www.tangshuang.net者只需要按照它的使用方法,完成下面3件事转载请注明出处:www.tangshuang.net【原创内容,转载请注明出处】,就可以开发出自己的AI工作流:

【作者:唐霜】【作者:唐霜】【关注微信公众号:wwwtangshua转载请注明出处:www.tangshuang.net【版权所有,侵权必究】ngnet】【版权所有】唐霜 www.tangshu【本文首发于唐霜的博客】未经授权,禁止复制转载。ang.net
  • 工具定义
  • 转载请注明出处:www.tangshua本文版权归作者所有,未经授权不得转载。【未经授权禁止转载】ng.net著作权归作者所有,禁止商业用途转载。
  • LLM接入
  • 【未经授权禁止转载】原创内容,盗版必究。
  • 流程定义
  • 本文版权归作者所有,未经授权不得转载。【本文受版权保护】

工具是最终干实事的部分,可以调用网络接口【转载请注明来源】原创内容,盗版必究。,也可以是驱动本地软件、硬件等,通过这些本文版权归作者所有,未经授权不得转载。原创内容,盗版必究。工具,agent才能产生实际的生产效果。本文作者:唐霜,转载请注明出处。【转载请注明来源】流程定义部分比较复杂,这里面就需要定义做著作权归作者所有,禁止商业用途转载。【访问 www.tangshuang.net 获取更多精彩内容】这件事应该如何去划分职责,如何规划阶段,转载请注明出处:www.tangshuang.net【本文受版权保护】每个阶段不同角色应该做什么事,达到什么样原创内容,盗版必究。【关注微信公众号:wwwtangshuangnet】的条件,如何去执行动作等等。它在设计上提原创内容,盗版必究。【关注微信公众号:wwwtangshuangnet】供了3中模式:

原创内容,盗版必究。原创内容,盗版必究。

多智能体协同模式

本文作者:唐霜,转载请注明出处。【访问 www.tangshuang.n【原创不易,请尊重版权】【原创不易,请尊重版权】et 获取更多精彩内容】【作者:唐霜】

也就是吴恩达所指出的Multi-agen【关注微信公众号:wwwtangshuangnet】著作权归作者所有,禁止商业用途转载。t collaboration,这种模式本文作者:唐霜,转载请注明出处。未经授权,禁止复制转载。通过将多个智能体囊括在一个工作流中,协同【本文首发于唐霜的博客】【版权所有,侵权必究】工作来提升产出的质量。

【原创内容,转载请注明出处】【访问 www.tangshuang.n【转载请注明来源】【本文受版权保护】et 获取更多精彩内容】【本文首发于唐霜的博客】

原创内容,盗版必究。【版权所有】唐霜 www.tangshu【版权所有,侵权必究】【版权所有,侵权必究】ang.net

监督人模式

【版权所有】唐霜 www.tangshu【本文首发于唐霜的博客】未经授权,禁止复制转载。ang.net【访问 www.tangshuang.n本文版权归作者所有,未经授权不得转载。【原创内容,转载请注明出处】et 获取更多精彩内容】

这种模式下,agent之间不再共享同一个本文版权归作者所有,未经授权不得转载。【版权所有】唐霜 www.tangshuang.net暂存器,各自独立工作,通过监督人(Sup本文作者:唐霜,转载请注明出处。本文版权归作者所有,未经授权不得转载。ervisor)来进行协调和最终的输出。

原创内容,盗版必究。原创内容,盗版必究。【版权所有,侵权必究】【原创内容,转载请注明出处】

【版权所有,侵权必究】原创内容,盗版必究。【关注微信公众号:wwwtangshua【转载请注明来源】【本文首发于唐霜的博客】ngnet】转载请注明出处:www.tangshua【版权所有】唐霜 www.tangshuang.net本文版权归作者所有,未经授权不得转载。ng.net

分层次团队模式

本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】本文作者:唐霜,转载请注明出处。转载请注明出处:www.tangshua【访问 www.tangshuang.net 获取更多精彩内容】【原创不易,请尊重版权】ng.net

在监督人模式的基础上,不同agent被分【原创不易,请尊重版权】【转载请注明来源】为多个team,在一个team内的age【版权所有】唐霜 www.tangshuang.net转载请注明出处:www.tangshuang.netnts可以更高效的协作。最终,多个tea【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。m通过监督人进行协调和最终输出。

本文版权归作者所有,未经授权不得转载。【未经授权禁止转载】

本文作者:唐霜,转载请注明出处。【转载请注明来源】【版权所有】唐霜 www.tangshu【本文受版权保护】本文作者:唐霜,转载请注明出处。ang.net未经授权,禁止复制转载。

可以看出,一方面,我们需要让分工更加明确【访问 www.tangshuang.net 获取更多精彩内容】著作权归作者所有,禁止商业用途转载。,一件事由一个agent完成,这样可以更本文作者:唐霜,转载请注明出处。本文版权归作者所有,未经授权不得转载。高效;另一方面,我们需要让这些agent【访问 www.tangshuang.net 获取更多精彩内容】【访问 www.tangshuang.net 获取更多精彩内容】协同起来,通过有效的组织、联系、反馈,来本文版权归作者所有,未经授权不得转载。未经授权,禁止复制转载。让整套工作流运作更加高效。

【作者:唐霜】【关注微信公众号:wwwtangshua著作权归作者所有,禁止商业用途转载。本文版权归作者所有,未经授权不得转载。ngnet】【未经授权禁止转载】

结语

从本文中,你肯定可以发现一些规律,即ag本文作者:唐霜,转载请注明出处。【未经授权禁止转载】ents以workflow的模式来进行工著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】作,可能会是将来AI应用的主要开发模式。【版权所有,侵权必究】【版权所有】唐霜 www.tangshuang.net在这样的体系中,分工会越来越细,每一个a【未经授权禁止转载】本文作者:唐霜,转载请注明出处。gent都可以在单独某个方面具备更优秀的转载请注明出处:www.tangshuang.net本文作者:唐霜,转载请注明出处。能力,这也意味着在一套系统中,我们可能需【未经授权禁止转载】【关注微信公众号:wwwtangshuangnet】要多个领域的小模型或者经过微调的LLM。同时,我们也可以看到,由于分工很细,有原创内容,盗版必究。转载请注明出处:www.tangshuang.net不少agent的功能愈发单一,我们就可以转载请注明出处:www.tangshuang.net著作权归作者所有,禁止商业用途转载。采用耗能更小的技术架构来实现这类agen本文版权归作者所有,未经授权不得转载。【本文首发于唐霜的博客】t,只有那种需要非常高智能的agent,转载请注明出处:www.tangshuang.net【版权所有,侵权必究】我们才可能需要比GPT-4更高智能的大模著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】型,这就显得更加环保,对当下芯片资源、电力资源紧张感有一定的原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。缓解作用。另外一方面,由于这种越来越细的【原创内容,转载请注明出处】【未经授权禁止转载】分工,我们需要一个agent market来随时扩展系统能力,当用户在平台上准备让【版权所有】唐霜 www.tangshuang.net转载请注明出处:www.tangshuang.netAI完成自己的任务,但是又没有在当前系统【原创内容,转载请注明出处】【访问 www.tangshuang.net 获取更多精彩内容】中看到可以实现自己需要的能力的agent本文作者:唐霜,转载请注明出处。【本文首发于唐霜的博客】时,可以便捷的在market上载入新的a【转载请注明来源】本文作者:唐霜,转载请注明出处。gent。基于这一思考,我们就会豁然开朗【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.net,为什么吴恩达会认为智能体工作流会是今年本文版权归作者所有,未经授权不得转载。【未经授权禁止转载】一个重要的课题了。

原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。【转载请注明来源】【原创不易,请尊重版权】

2024-03-28 2983

为价值买单,打赏一杯咖啡

本文价值29.83RMB