面向AI编程:Agent式开发

广告位招租
扫码页面底部二维码联系

我在【版权所有,侵权必究】公众号文章本文版权归作者所有,未经授权不得转载。中提出了“面向AI编程”的说法,与“面向未经授权,禁止复制转载。【本文首发于唐霜的博客】对象编程”对应,以完成AI基础单元为编程【版权所有,侵权必究】【访问 www.tangshuang.net 获取更多精彩内容】目标,按照AI特性来设计代码结构,通过A著作权归作者所有,禁止商业用途转载。【原创内容,转载请注明出处】I能力来实现具体功能。同时,面向AI的另未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。外一方面是,与传统面向机器编程相比,我们【未经授权禁止转载】未经授权,禁止复制转载。生产的代码不再提供给机器消费,而是主要提转载请注明出处:www.tangshuang.net【本文受版权保护】供给AI进行消费,或者说让AI在机器上按著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshuang.net照我们的预设进行工作。再有,面向AI的再【关注微信公众号:wwwtangshuangnet】【关注微信公众号:wwwtangshuangnet】一方面是,与传统的面向需求编程相比,我们【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】编码的目标是通过调动AI来完成目标需求,【访问 www.tangshuang.net 获取更多精彩内容】【转载请注明来源】而非直接写代码完成需求,这个过程中,只要转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】能满足需求,可以让AI自由选择实现方式,著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshuang.net不一定是编程方式。随着LLM逐渐成熟,过【转载请注明来源】著作权归作者所有,禁止商业用途转载。往我们只能通过代码实现人机,而现在我们可转载请注明出处:www.tangshuang.net原创内容,盗版必究。以通过自然语言实现人机,这对于技术的发展未经授权,禁止复制转载。【原创内容,转载请注明出处】有着巨大的意义,因为原本不会编码的人也可【转载请注明来源】【作者:唐霜】以指挥机器按照其创意进行生产。那么,在当【关注微信公众号:wwwtangshuangnet】【本文受版权保护】下这个阶段,我们如何才能让不会编程的人指转载请注明出处:www.tangshuang.net【未经授权禁止转载】挥机器呢?本文就来具体聊一聊,2024年【原创内容,转载请注明出处】【本文受版权保护】的今天,开发者们是如何解决这个问题的。

著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】【本文首发于唐霜的博客】

LLM驱动的Agent本文作者:唐霜,转载请注明出处。

【关注微信公众号:wwwtangshuangnet】【作者:唐霜】【作者:唐霜】【未经授权禁止转载】【作者:唐霜】

由复旦NLP和米哈游调查完成的文献综述《The Rise and Potenti转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】al of Large Language【版权所有】唐霜 www.tangshuang.net【本文受版权保护】 Model Based Agents:【本文受版权保护】【版权所有】唐霜 www.tangshuang.net A Survey》详细阐述了LLM-based Agen著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshuang.nett的相关理论、实践模型和深度思考,知乎上有大神做了详细的解读【本文受版权保护】,我下面基于此再做白话版总结。【转载请注明来源】

本文作者:唐霜,转载请注明出处。【原创不易,请尊重版权】著作权归作者所有,禁止商业用途转载。

首先,为什么是“Agent”这一概念?因【未经授权禁止转载】转载请注明出处:www.tangshuang.net为它是一个人工智能领域延续至今的设定,随未经授权,禁止复制转载。原创内容,盗版必究。着时代的推移,它的概念内涵在扩大,但是无本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。论再哪个时代,它都能一针见血的概括人工智【原创内容,转载请注明出处】著作权归作者所有,禁止商业用途转载。能的终极目标——自主思考和行动的机器体。【版权所有】唐霜 www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】很多人一听到“自主思考和行动”就会担心将转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.net来机器人会灭了人类。这是因为普通人并不了【关注微信公众号:wwwtangshuangnet】【未经授权禁止转载】解人工智能领域的覆盖范围,里面有一个方向【本文首发于唐霜的博客】本文版权归作者所有,未经授权不得转载。是研究智能的社会性,任何智能都需要具备社著作权归作者所有,禁止商业用途转载。【原创内容,转载请注明出处】会性,那么就会有其行为准则。总之,在人工本文版权归作者所有,未经授权不得转载。著作权归作者所有,禁止商业用途转载。智能领域,Agent不是这两年冒出来的新原创内容,盗版必究。【访问 www.tangshuang.net 获取更多精彩内容】概念,而是始终贯穿人工智能领域研究的核心【本文受版权保护】【未经授权禁止转载】概念之一,过去、现在和将来都将作为一个核转载请注明出处:www.tangshuang.net转载请注明出处:www.tangshuang.net心词汇存在。人工智能的代际,从Agent原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。的角度来看,可以分为:Symbolic Agents ->【未经授权禁止转载】转载请注明出处:www.tangshuang.net; Reactive Agents -&【本文受版权保护】本文作者:唐霜,转载请注明出处。gt; RL-based Agents 【未经授权禁止转载】【原创内容,转载请注明出处】-> Agent with tra【作者:唐霜】著作权归作者所有,禁止商业用途转载。nsfer learning and m【转载请注明来源】著作权归作者所有,禁止商业用途转载。eta learning -> L【版权所有】唐霜 www.tangshuang.net转载请注明出处:www.tangshuang.netLM-based Agent。其中AlphaGo和DQN是RL-ba【本文首发于唐霜的博客】转载请注明出处:www.tangshuang.netsed时代的产物。“学习如何学习”则是在本文版权归作者所有,未经授权不得转载。【转载请注明来源】LLM出现之前的重要课题。知道GPT引爆【关注微信公众号:wwwtangshuangnet】【原创内容,转载请注明出处】业界,才标志着新一代Agent时代的到来【关注微信公众号:wwwtangshuangnet】【本文首发于唐霜的博客】

【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】【作者:唐霜】【作者:唐霜】

Agent的构成模块著作权归作者所有,禁止商业用途转载。

【原创内容,转载请注明出处】转载请注明出处:www.tangshuang.net转载请注明出处:www.tangshuang.net

Agent由大脑模块、感知模块、行动模块未经授权,禁止复制转载。本文版权归作者所有,未经授权不得转载。构成。作为人工智能工程的最小单位,Age【本文首发于唐霜的博客】未经授权,禁止复制转载。nt的功能可以不同,但构成模块的设计完全转载请注明出处:www.tangshuang.net【本文首发于唐霜的博客】符合了人类的认知,因此,三模块结构缺一不本文作者:唐霜,转载请注明出处。【转载请注明来源】可。

【转载请注明来源】【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。

未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.net未经授权,禁止复制转载。【版权所有,侵权必究】

中枢大脑【版权所有,侵权必究】

【本文首发于唐霜的博客】【未经授权禁止转载】著作权归作者所有,禁止商业用途转载。

在2024年的今天,因为我们已经有了LL【本文首发于唐霜的博客】【未经授权禁止转载】M,因此,当我们再去思考一个Agent的原创内容,盗版必究。【版权所有,侵权必究】大脑应该具备哪些能力时,和前面代际的思考【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。方式完全不同。LLM-based时代下,【版权所有】唐霜 www.tangshuang.net【转载请注明来源】Agent的大脑主要包含:

【本文受版权保护】【版权所有,侵权必究】原创内容,盗版必究。
  • 自然语言交互,包含自然语言理解、多轮对话【版权所有,侵权必究】【访问 www.tangshuang.net 获取更多精彩内容】、自然语言(高质量)生成、意图和含义理解
  • 本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】著作权归作者所有,禁止商业用途转载。
  • 知识,包括语言知识、常识知识、专业领域知【原创内容,转载请注明出处】著作权归作者所有,禁止商业用途转载。识,当然这里需要考虑赋予Agent通过外【作者:唐霜】【原创内容,转载请注明出处】部知识库实时获取知识的能力
  • 转载请注明出处:www.tangshuang.net【本文受版权保护】【关注微信公众号:wwwtangshuangnet】【关注微信公众号:wwwtangshuangnet】
  • 记忆,提高记忆能力的方法有提高Trran【作者:唐霜】【版权所有】唐霜 www.tangshuang.netsformer的输入长度限制、总结记忆、【本文首发于唐霜的博客】【访问 www.tangshuang.net 获取更多精彩内容】用向量或数据结构压缩记忆,同时需要注意记【作者:唐霜】【未经授权禁止转载】忆检索的最近性、相关性和重要性
  • 【未经授权禁止转载】【原创内容,转载请注明出处】【本文受版权保护】【本文受版权保护】【转载请注明来源】
  • 推理和规划,推理依赖LLM本身的训练程度转载请注明出处:www.tangshuang.net【作者:唐霜】,规划包括两个阶段:计划制定和计划反思。
  • 【关注微信公众号:wwwtangshuangnet】未经授权,禁止复制转载。【关注微信公众号:wwwtangshuangnet】转载请注明出处:www.tangshuang.net【本文受版权保护】
  • 可迁移性和通用性,我个人理解主要是指可以【关注微信公众号:wwwtangshuangnet】【本文首发于唐霜的博客】把发生过的事自己再学习为模型本身的一部分【原创不易,请尊重版权】著作权归作者所有,禁止商业用途转载。,从而越来越接近人类的思考水平
  • 原创内容,盗版必究。原创内容,盗版必究。本文作者:唐霜,转载请注明出处。

【原创内容,转载请注明出处】本文作者:唐霜,转载请注明出处。【关注微信公众号:wwwtangshuangnet】

感知转载请注明出处:www.tangshuang.net

【未经授权禁止转载】【访问 www.tangshuang.net 获取更多精彩内容】【访问 www.tangshuang.net 获取更多精彩内容】

Agent本身作为一个最小单位,必然需要本文版权归作者所有,未经授权不得转载。【转载请注明来源】根据环境做出反应,对环境的感知能力往往意【原创内容,转载请注明出处】【未经授权禁止转载】味着这个Agent的功能主要是什么,就像本文作者:唐霜,转载请注明出处。【未经授权禁止转载】人类的各个器官,感知痛觉和味觉,往往意味著作权归作者所有,禁止商业用途转载。【关注微信公众号:wwwtangshuangnet】着它的功能。从LLM的角度,Agent的【版权所有】唐霜 www.tangshuang.net本文作者:唐霜,转载请注明出处。感知对象主要为:

转载请注明出处:www.tangshuang.net原创内容,盗版必究。著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】
  • 文本输入【关注微信公众号:wwwtangshuangnet】
  • 【转载请注明来源】【访问 www.tangshuang.net 获取更多精彩内容】【访问 www.tangshuang.net 获取更多精彩内容】
  • 视觉输入,包含静态图片和连续图帧(视频、【本文受版权保护】著作权归作者所有,禁止商业用途转载。gif等)
  • 未经授权,禁止复制转载。【作者:唐霜】【版权所有,侵权必究】本文版权归作者所有,未经授权不得转载。【原创不易,请尊重版权】
  • 听觉输入,主要指音频,包含已有的音频文件未经授权,禁止复制转载。【原创不易,请尊重版权】和实时的声音收录
  • 著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】【作者:唐霜】【作者:唐霜】
  • 其他输入,我个人认为主要包含各类智能硬件本文作者:唐霜,转载请注明出处。【关注微信公众号:wwwtangshuangnet】传感器、软件触发、结合各类信息综合计算结【未经授权禁止转载】原创内容,盗版必究。果、其他关联Agent的输出信息、中枢大【访问 www.tangshuang.net 获取更多精彩内容】未经授权,禁止复制转载。脑的指令。
  • 【版权所有,侵权必究】转载请注明出处:www.tangshuang.net著作权归作者所有,禁止商业用途转载。

行动转载请注明出处:www.tangshuang.net

未经授权,禁止复制转载。【原创不易,请尊重版权】转载请注明出处:www.tangshuang.net

Agent的真正发挥作用的部分,从编程的本文版权归作者所有,未经授权不得转载。著作权归作者所有,禁止商业用途转载。角度,中枢大脑的功能可以富余,但感知和行未经授权,禁止复制转载。【作者:唐霜】动定义了该Agent的边界,决定了该Ag【关注微信公众号:wwwtangshuangnet】【转载请注明来源】ent的实际功能。从LLM的角度,Age原创内容,盗版必究。【版权所有,侵权必究】nt的行动主要包括:

转载请注明出处:www.tangshuang.net【版权所有,侵权必究】著作权归作者所有,禁止商业用途转载。
  • 输出文本【未经授权禁止转载】
  • 转载请注明出处:www.tangshuang.net未经授权,禁止复制转载。著作权归作者所有,禁止商业用途转载。【原创内容,转载请注明出处】
  • 输出图片、音频、视频【原创内容,转载请注明出处】
  • 【转载请注明来源】【作者:唐霜】【本文首发于唐霜的博客】未经授权,禁止复制转载。【访问 www.tangshuang.net 获取更多精彩内容】
  • 使用工具,如Functional cal未经授权,禁止复制转载。【原创内容,转载请注明出处】l等,同时,Agent需要反馈工具的处理【原创内容,转载请注明出处】【原创不易,请尊重版权】结果,此处需要考虑是将工具处理结果作为另【版权所有,侵权必究】【版权所有,侵权必究】外一个Agent的输入,再由另外一个Ag转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】ent将其作为输入再给当前这个Agent【版权所有,侵权必究】未经授权,禁止复制转载。,这种模式使得架构设计上更容易理解,但是著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。Agent的数量会变多
  • 【转载请注明来源】【版权所有】唐霜 www.tangshuang.net【作者:唐霜】【访问 www.tangshuang.net 获取更多精彩内容】
  • 具身行动,Agent的智能来源于与环境的【本文首发于唐霜的博客】【访问 www.tangshuang.net 获取更多精彩内容】持续互动和反馈,而不是仅仅依赖于精心编辑著作权归作者所有,禁止商业用途转载。本文版权归作者所有,未经授权不得转载。的预训练数据,它们应该能够主动感知、理解著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。物理环境并与之互动,根据 LLM 丰富的【未经授权禁止转载】转载请注明出处:www.tangshuang.net内部知识做出决策并产生特定行为来改变环境未经授权,禁止复制转载。【关注微信公众号:wwwtangshuangnet】,这个和我上面提到的把发生过的事自己再学【本文受版权保护】【转载请注明来源】习为模型本身的一部分有类似的意思
  • 【转载请注明来源】【本文首发于唐霜的博客】【作者:唐霜】本文作者:唐霜,转载请注明出处。

从具身行动的角度看,Agent本身不是静【版权所有】唐霜 www.tangshuang.net转载请注明出处:www.tangshuang.net态的,它应该像人的细胞一样,具有新陈代谢【本文受版权保护】【版权所有】唐霜 www.tangshuang.net的能力,当Agent本身能够感知环境,学本文版权归作者所有,未经授权不得转载。著作权归作者所有,禁止商业用途转载。习和互动,沉淀为模型本身的部分,并基于此【版权所有,侵权必究】【未经授权禁止转载】来做出适应环境的决策,那么这也就意味着,【原创内容,转载请注明出处】【本文首发于唐霜的博客】大脑部分需要新增内容,从编程的角度看,可【未经授权禁止转载】【原创不易,请尊重版权】能就是动态训练模型,并在训练后热替换当前本文版权归作者所有,未经授权不得转载。本文版权归作者所有,未经授权不得转载。模型,如此反复循环。

【原创内容,转载请注明出处】转载请注明出处:www.tangshuang.net本文版权归作者所有,未经授权不得转载。

Agent的治理模式【原创不易,请尊重版权】

【版权所有,侵权必究】【版权所有,侵权必究】【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。

在之前的文章中,我有详细介绍过Agent转载请注明出处:www.tangshuang.net本文版权归作者所有,未经授权不得转载。的治理模式,不过在这篇文章中,它的提法更【版权所有】唐霜 www.tangshuang.net本文版权归作者所有,未经授权不得转载。加全面。就2024年的今天,可见的模式主【版权所有】唐霜 www.tangshuang.net未经授权,禁止复制转载。要包含3种:Single Agent、M原创内容,盗版必究。【原创内容,转载请注明出处】ulti-Agents、Human-Ag【作者:唐霜】未经授权,禁止复制转载。ent。

转载请注明出处:www.tangshuang.net原创内容,盗版必究。【本文首发于唐霜的博客】【原创内容,转载请注明出处】

Single Agent本文作者:唐霜,转载请注明出处。

原创内容,盗版必究。著作权归作者所有,禁止商业用途转载。【作者:唐霜】

简单讲就是,一个Agent就是一个应用,原创内容,盗版必究。著作权归作者所有,禁止商业用途转载。直接给到用户去使用。这类Agent往往是【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.net一个软件,接收用户输入,按照其功能设定,转载请注明出处:www.tangshuang.net【未经授权禁止转载】返回给用户结果。例如现在的ChatGPT【原创内容,转载请注明出处】【未经授权禁止转载】、GPTs、RGA知识库等应用,其中最值【未经授权禁止转载】【版权所有,侵权必究】得一提的是LangChain和AutoG【关注微信公众号:wwwtangshuangnet】【版权所有】唐霜 www.tangshuang.netPT。

【本文首发于唐霜的博客】【原创内容,转载请注明出处】【本文受版权保护】【原创不易,请尊重版权】【作者:唐霜】

虽然Single这个词听上去让人感觉很单转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.net薄,觉得好像做不出什么特别的产品,但是我【转载请注明来源】【转载请注明来源】们可以通过合理的架构,使得Agent具备【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。优秀的创意。例如现在figma上面有非常【原创不易,请尊重版权】著作权归作者所有,禁止商业用途转载。多的智能插件,它们的出现可以快速帮助我们【本文首发于唐霜的博客】【原创不易,请尊重版权】解决一些场景,而这些插件,虽然本身入口很【本文受版权保护】【本文受版权保护】单薄,但是它们背后可能由一整家公司和庞大【版权所有,侵权必究】本文版权归作者所有,未经授权不得转载。的技术支撑。从这种设计的角度讲,Sing【未经授权禁止转载】转载请注明出处:www.tangshuang.netle Agent可以按下方的角度分类:

【本文受版权保护】【访问 www.tangshuang.net 获取更多精彩内容】本文作者:唐霜,转载请注明出处。
  • 面向任务的,用以完成人们提出的任务,以提【转载请注明来源】本文作者:唐霜,转载请注明出处。升生产效率
  • 著作权归作者所有,禁止商业用途转载。【转载请注明来源】【原创不易,请尊重版权】转载请注明出处:www.tangshuang.net【转载请注明来源】
  • 面向创新的,用以在特定领域进行快速验证,【访问 www.tangshuang.net 获取更多精彩内容】【本文首发于唐霜的博客】以极大的缩减实验时间,例如在蛋白质构型编原创内容,盗版必究。【访问 www.tangshuang.net 获取更多精彩内容】排上,今天1分钟就可以完成过去10年的编【本文受版权保护】本文作者:唐霜,转载请注明出处。排发现
  • 转载请注明出处:www.tangshuang.net【转载请注明来源】转载请注明出处:www.tangshuang.net本文作者:唐霜,转载请注明出处。
  • 面向生命周期的,简单将就是这类Agent【原创不易,请尊重版权】【版权所有,侵权必究】设计出来没有具体目标,就是让它自己在开放转载请注明出处:www.tangshuang.net转载请注明出处:www.tangshuang.net自由的环境中自生自灭,自己生长,看它能长原创内容,盗版必究。转载请注明出处:www.tangshuang.net成什么样子,我们从之吸取有益的部分
  • 著作权归作者所有,禁止商业用途转载。【版权所有,侵权必究】【转载请注明来源】原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。

现阶段而言,上面三种类型都已经是被实现了未经授权,禁止复制转载。未经授权,禁止复制转载。的,只不过从大规模应用、对现实工作影响最本文版权归作者所有,未经授权不得转载。【本文首发于唐霜的博客】大、可以马上立竿见影的,主要是第一种。

【作者:唐霜】著作权归作者所有,禁止商业用途转载。【访问 www.tangshuang.net 获取更多精彩内容】

Multi-Agents原创内容,盗版必究。

【关注微信公众号:wwwtangshuangnet】【原创内容,转载请注明出处】转载请注明出处:www.tangshuang.net

早在 1986 年,马文-明斯基就做出了未经授权,禁止复制转载。【本文受版权保护】前瞻性的预测。他在《心灵社会》一书中提出本文作者:唐霜,转载请注明出处。著作权归作者所有,禁止商业用途转载。了一种新颖的智能理论,认为智能产生于许多具有特定功能的小型Agen本文版权归作者所有,未经授权不得转载。【未经授权禁止转载】t的相互作用。例如,某些Agent可能负【本文首发于唐霜的博客】本文版权归作者所有,未经授权不得转载。责模式识别,而其他Agent可能负责决策转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.net或生成解决方案。简单讲,从人类已知的系统论角度去看,分工未经授权,禁止复制转载。未经授权,禁止复制转载。可以解决非常多问题。让不同功能的Agen【原创不易,请尊重版权】本文版权归作者所有,未经授权不得转载。t由系统协调来完成目标,可以使得该系统更【未经授权禁止转载】【访问 www.tangshuang.net 获取更多精彩内容】具有未来的持续可前瞻性。也就是说,一个系著作权归作者所有,禁止商业用途转载。【未经授权禁止转载】统(如公司)比一个封闭的个体(如个体户)未经授权,禁止复制转载。【未经授权禁止转载】更有发展前景。

【作者:唐霜】【本文受版权保护】【关注微信公众号:wwwtangshuangnet】

不同的Agents之间,它们的分工固然重【作者:唐霜】未经授权,禁止复制转载。要,然而,相互联系才能形成系统,因此,我【本文首发于唐霜的博客】【本文受版权保护】们更多的是探讨它们的联系方式。

【未经授权禁止转载】【作者:唐霜】【本文受版权保护】【关注微信公众号:wwwtangshuangnet】
  • 互补性合作 转载请注明出处:www.tangshuang.net
    • 无序合作,agents之间没有顺序,每个【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。agent都是对环境(把其他agent当【未经授权禁止转载】本文作者:唐霜,转载请注明出处。作环境因素)做出响应,所有agent的行未经授权,禁止复制转载。原创内容,盗版必究。为结果总和起来就是我们需要的结果
    • 本文版权归作者所有,未经授权不得转载。【未经授权禁止转载】【本文受版权保护】
    • 有序合作,当前agent只接收上一个ag【未经授权禁止转载】本文作者:唐霜,转载请注明出处。ent的输出作为输入,所有agents串著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。联在一起
    • 【关注微信公众号:wwwtangshuangnet】【转载请注明来源】【未经授权禁止转载】著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。
  • 转载请注明出处:www.tangshuang.net【版权所有,侵权必究】【未经授权禁止转载】【本文受版权保护】原创内容,盗版必究。
  • 对抗性互动,agents之间有监督、对抗【原创不易,请尊重版权】【本文受版权保护】关系,例如有一些扮演测试、评审等角色的a转载请注明出处:www.tangshuang.net【未经授权禁止转载】gent
  • 【版权所有】唐霜 www.tangshuang.net【转载请注明来源】著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。

微软的AutoGen和LangChain【原创内容,转载请注明出处】未经授权,禁止复制转载。的LangGraph都是multi-ag本文作者:唐霜,转载请注明出处。【本文首发于唐霜的博客】ents的构建框架,在这些框架中,把不同【版权所有】唐霜 www.tangshuang.net【关注微信公众号:wwwtangshuangnet】功能的agent进行分工,扮演特定角色,【未经授权禁止转载】转载请注明出处:www.tangshuang.net并对多个agent进行分组,使agent原创内容,盗版必究。【本文受版权保护】s可以像一个系统中的各个角色一样工作,从本文版权归作者所有,未经授权不得转载。【本文首发于唐霜的博客】而从一个系统的角度完成用户交给的工作。

【本文受版权保护】【作者:唐霜】【未经授权禁止转载】【原创不易,请尊重版权】

【版权所有】唐霜 www.tangshuang.net【本文受版权保护】【本文受版权保护】

Human-Agent【转载请注明来源】

转载请注明出处:www.tangshuang.net【版权所有,侵权必究】本文作者:唐霜,转载请注明出处。

由人来指导和监督Agent的工作过程,以【作者:唐霜】著作权归作者所有,禁止商业用途转载。确保更高质量的产出。人与Agent交互来本文版权归作者所有,未经授权不得转载。【作者:唐霜】完成工作,里面涉及到交互的方式、关系等,【原创不易,请尊重版权】著作权归作者所有,禁止商业用途转载。例如人和Agent的地位是否是平等的?A著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。gent给出的反馈是定性的还是定量的?人转载请注明出处:www.tangshuang.net【本文首发于唐霜的博客】参与的程度究竟有多大,是关键节点还是每一转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.net个节点都需要人的参与?如何确保人的输入是本文作者:唐霜,转载请注明出处。著作权归作者所有,禁止商业用途转载。准确的,不会给agent增加额外的负担?本文作者:唐霜,转载请注明出处。著作权归作者所有,禁止商业用途转载。等等。

【原创内容,转载请注明出处】【原创内容,转载请注明出处】【未经授权禁止转载】【原创内容,转载请注明出处】转载请注明出处:www.tangshuang.net

我们都知道AI的智能程度依赖于LLM本身著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。的智能程度,AI的理解和规划能力,目前来转载请注明出处:www.tangshuang.net【本文首发于唐霜的博客】看还是受限的,还没有达到我们普通成年人的【作者:唐霜】【本文首发于唐霜的博客】水平。另外,Agents之间的互动解释性【版权所有,侵权必究】著作权归作者所有,禁止商业用途转载。弱,需要人的参与来确保解释是按照人的意志【作者:唐霜】【作者:唐霜】执行的。而且,由于这种解释偏差,很可能会【未经授权禁止转载】原创内容,盗版必究。带来严重的恶劣后果,人的参与也可能在一定【版权所有】唐霜 www.tangshuang.net【关注微信公众号:wwwtangshuangnet】程度上规避。

【关注微信公众号:wwwtangshuangnet】【访问 www.tangshuang.net 获取更多精彩内容】【本文首发于唐霜的博客】【本文首发于唐霜的博客】

人类参与互动,可以是1对1的人-Agen【未经授权禁止转载】本文作者:唐霜,转载请注明出处。t互动,也可以是1对多的人-Agents【本文首发于唐霜的博客】【版权所有,侵权必究】互动,也可以是人类作为一个Agent参与【访问 www.tangshuang.net 获取更多精彩内容】【本文受版权保护】到Agents间有序合作的链条中。

本文版权归作者所有,未经授权不得转载。【本文首发于唐霜的博客】【作者:唐霜】原创内容,盗版必究。【访问 www.tangshuang.net 获取更多精彩内容】

Agent社会性本文作者:唐霜,转载请注明出处。

【本文首发于唐霜的博客】著作权归作者所有,禁止商业用途转载。著作权归作者所有,禁止商业用途转载。【本文受版权保护】转载请注明出处:www.tangshuang.net

社会的本质,是“规则下的团体”,没有规则【访问 www.tangshuang.net 获取更多精彩内容】【本文首发于唐霜的博客】就没有社会,有了规矩往往形成社会。在一套著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。系统中,Agents可能是由不同的服务商本文作者:唐霜,转载请注明出处。【原创不易,请尊重版权】提供,基于AI的训练,Agent表现出自原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。己的认知、情感、个性,这些抽象的表现定性著作权归作者所有,禁止商业用途转载。【本文首发于唐霜的博客】,是我们对它社会行为的总结。

著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。【作者:唐霜】【未经授权禁止转载】本文版权归作者所有,未经授权不得转载。

当一个Agent总是表现的很积极,无论输转载请注明出处:www.tangshuang.net著作权归作者所有,禁止商业用途转载。入简单还是详细,它都尽可能做出规划,我们【未经授权禁止转载】本文作者:唐霜,转载请注明出处。就认为它具有开放人格;当一个Agent总【版权所有,侵权必究】【原创不易,请尊重版权】是表现的消极,总是在输入简单的时候,反馈【未经授权禁止转载】【作者:唐霜】出不愿意做规划,打回让上有重新发出指令时【本文受版权保护】未经授权,禁止复制转载。,我们认为它具有较为封闭的人格。而作为系【版权所有,侵权必究】未经授权,禁止复制转载。统,需要制定社会性规则,以在Agent的【关注微信公众号:wwwtangshuangnet】【原创不易,请尊重版权】个性和达成目标之间实现平衡。

【转载请注明来源】【未经授权禁止转载】本文作者:唐霜,转载请注明出处。转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.net

AI编程转载请注明出处:www.tangshuang.net

本文版权归作者所有,未经授权不得转载。【版权所有】唐霜 www.tangshuang.net转载请注明出处:www.tangshuang.net【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。

通过驱动AI来完成某些任务,以编程的方式原创内容,盗版必究。【版权所有】唐霜 www.tangshuang.net安排细节与逻辑,由AI来解释任务和完成规【访问 www.tangshuang.net 获取更多精彩内容】本文版权归作者所有,未经授权不得转载。划。我们只需要验收结果,或者再在关键环节【原创不易,请尊重版权】未经授权,禁止复制转载。参与交互。那么,我们应该如何来设计一套系【关注微信公众号:wwwtangshuangnet】【版权所有】唐霜 www.tangshuang.net统,实现这样的诉求呢?

【访问 www.tangshuang.net 获取更多精彩内容】【作者:唐霜】【本文首发于唐霜的博客】

Agent功能分类本文作者:唐霜,转载请注明出处。

【作者:唐霜】转载请注明出处:www.tangshuang.net【转载请注明来源】原创内容,盗版必究。著作权归作者所有,禁止商业用途转载。

我们按照最小职责原则,将所有的功能进行划著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。分,尽可能的把功能拆分开,每一个功能,都【版权所有,侵权必究】未经授权,禁止复制转载。有一个Agent与之对应。我们可以从不同原创内容,盗版必究。转载请注明出处:www.tangshuang.net的角度进行分类,以覆盖我们的功能需求:

本文作者:唐霜,转载请注明出处。【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.net原创内容,盗版必究。
  • 推理解释类,对输入进行理解以按照某种规则【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】输出理解后的DSL,例如输入一张流程图,【原创不易,请尊重版权】本文作者:唐霜,转载请注明出处。获得该图对应的DSL
  • 【本文受版权保护】本文作者:唐霜,转载请注明出处。【作者:唐霜】
  • 数据转化类,对输入进行数据理解和提炼,例【本文受版权保护】【转载请注明来源】如输入一篇年鉴文章返回所需数据的JSON转载请注明出处:www.tangshuang.net【原创不易,请尊重版权】格式
  • 【版权所有,侵权必究】本文版权归作者所有,未经授权不得转载。【访问 www.tangshuang.net 获取更多精彩内容】原创内容,盗版必究。
  • 工具执行类,按DSL调用工具,传入参数,未经授权,禁止复制转载。【关注微信公众号:wwwtangshuangnet】执行完获得结果
  • 【版权所有,侵权必究】本文版权归作者所有,未经授权不得转载。本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.net
  • 人机互动类,也就是上面Human-Age【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。nt所提到的
  • 【版权所有】唐霜 www.tangshuang.net【本文首发于唐霜的博客】原创内容,盗版必究。【转载请注明来源】

这里需要注意,我没有把传感器类作为一类A未经授权,禁止复制转载。本文版权归作者所有,未经授权不得转载。gent,下文会提到,我们的硬件传感器本【关注微信公众号:wwwtangshuangnet】未经授权,禁止复制转载。质上只是信号的输入端,基于某种协议,千奇【本文首发于唐霜的博客】【访问 www.tangshuang.net 获取更多精彩内容】百怪的传感器,最终给到AI的输入,都可以本文版权归作者所有,未经授权不得转载。【本文首发于唐霜的博客】是统一标准的数据结构,这个部分需要传感器【访问 www.tangshuang.net 获取更多精彩内容】【本文首发于唐霜的博客】的开发者去做,作为AI系统的开发人员,无【作者:唐霜】【转载请注明来源】法触达这个部分。同样的道理,我们会让用于【未经授权禁止转载】【本文受版权保护】执行任务的硬件也与系统本身解耦,不过由于著作权归作者所有,禁止商业用途转载。【本文首发于唐霜的博客】执行硬件是被调用方,因此,这部分封装需要【访问 www.tangshuang.net 获取更多精彩内容】【作者:唐霜】我们AI系统的开发者来完成。

【未经授权禁止转载】本文版权归作者所有,未经授权不得转载。本文作者:唐霜,转载请注明出处。【作者:唐霜】【访问 www.tangshuang.net 获取更多精彩内容】

AI系统设计【版权所有,侵权必究】

【版权所有,侵权必究】【作者:唐霜】【关注微信公众号:wwwtangshuangnet】

现在,让我们想象,我们已经有了一台机器人本文作者:唐霜,转载请注明出处。【转载请注明来源】,现在它需要完成一个炒鸡蛋的任务,那么,【转载请注明来源】【版权所有,侵权必究】从我们编程的角度,这里面都由哪些东西构成原创内容,盗版必究。【本文首发于唐霜的博客】呢?数据和指令的流动是怎样的呢?

【关注微信公众号:wwwtangshuangnet】【关注微信公众号:wwwtangshuangnet】【本文首发于唐霜的博客】

首先是指令的接收和理解,我们通过麦克风接未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。收指令,此时麦克风接收的是音频信息,我们【未经授权禁止转载】未经授权,禁止复制转载。通过一个agent将其转化为文本信息;接【本文首发于唐霜的博客】【本文首发于唐霜的博客】着,我们将该文本输入到一个用于理解指令的【未经授权禁止转载】【转载请注明来源】agent,该agent从自身支撑的所有【访问 www.tangshuang.net 获取更多精彩内容】著作权归作者所有,禁止商业用途转载。功能中,理解了该指令的意图,并将指令以固【本文受版权保护】【版权所有,侵权必究】定协议文本发送给中枢agent;中枢ag著作权归作者所有,禁止商业用途转载。【转载请注明来源】ent的主要能力是理解和规划,它在接收指未经授权,禁止复制转载。【关注微信公众号:wwwtangshuangnet】令之后,正确理解了该指令,并发通过fun原创内容,盗版必究。转载请注明出处:www.tangshuang.netctional call功能,创建了一个原创内容,盗版必究。未经授权,禁止复制转载。任务,并将该任务id保持在记忆中;接下来【版权所有】唐霜 www.tangshuang.net【转载请注明来源】,它开始规划该任务,第一步是确认自身所处本文版权归作者所有,未经授权不得转载。【未经授权禁止转载】环境,第二步是确认炒鸡蛋的条件是否满足,本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】第三步是准备食材,第四步是烹饪……;完成原创内容,盗版必究。本文作者:唐霜,转载请注明出处。规划后,将该规划进行进一步细化,把所有关【未经授权禁止转载】本文版权归作者所有,未经授权不得转载。联的agent都挑选出来,并建立了任务地未经授权,禁止复制转载。本文版权归作者所有,未经授权不得转载。图;之后开始执行任务,它通过打开摄像头和【版权所有】唐霜 www.tangshuang.net【作者:唐霜】毫米波雷达全屋扫描设备,这些设备在被打开【关注微信公众号:wwwtangshuangnet】本文版权归作者所有,未经授权不得转载。后,会将信息通过响应的agent层层上报【关注微信公众号:wwwtangshuangnet】著作权归作者所有,禁止商业用途转载。,最终被中枢确认;之后再发送执行履带滚动【原创内容,转载请注明出处】【本文受版权保护】的指令,控制电机运转,实现移动和各种硬件【未经授权禁止转载】本文版权归作者所有,未经授权不得转载。设备的控制;最终完成炒鸡蛋,并通知主人任【本文受版权保护】【版权所有】唐霜 www.tangshuang.net务完成。

【本文受版权保护】【作者:唐霜】本文版权归作者所有,未经授权不得转载。本文作者:唐霜,转载请注明出处。【原创不易,请尊重版权】

我们可以看到,这是一个非常复杂的细节超多【访问 www.tangshuang.net 获取更多精彩内容】【关注微信公众号:wwwtangshuangnet】的系统,虽然难度大,但是也不是不可能对吧【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。

【原创内容,转载请注明出处】未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。未经授权,禁止复制转载。【访问 www.tangshuang.net 获取更多精彩内容】

AI系统设计示意图(注意,这里的中枢层和【关注微信公众号:wwwtangshuangnet】转载请注明出处:www.tangshuang.netAgent的中枢大脑是两个概念)

【关注微信公众号:wwwtangshuangnet】【转载请注明来源】本文版权归作者所有,未经授权不得转载。【作者:唐霜】

对于我们开发者,主要是在软件侧做一些事情本文作者:唐霜,转载请注明出处。原创内容,盗版必究。,不同的硬件传感器它的数据结构是不同的,原创内容,盗版必究。转载请注明出处:www.tangshuang.net因此,我们需要有一个针对性的agent来【访问 www.tangshuang.net 获取更多精彩内容】【未经授权禁止转载】处理这类传感器的信号。同样,行动端的逻辑【本文受版权保护】【未经授权禁止转载】是一样的。有些硬件本身即是传感器也是执行【原创内容,转载请注明出处】原创内容,盗版必究。器,我们需要把这些硬件拆开来看,在概念上著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】它和现实是不同的。

本文版权归作者所有,未经授权不得转载。【原创不易,请尊重版权】【访问 www.tangshuang.net 获取更多精彩内容】

在平台端,我们用“事件代理层”来实现具体【转载请注明来源】未经授权,禁止复制转载。agent和平台的解耦。我们的平台会对接【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。无数的agent,通过解耦,我们不需要针未经授权,禁止复制转载。【原创内容,转载请注明出处】对不同的agent进行设计,而是提供统一【关注微信公众号:wwwtangshuangnet】本文作者:唐霜,转载请注明出处。的协议,agent通过协议订阅或发布事件【版权所有】唐霜 www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】,无需关心自己的所处环境。在信号的传输上【版权所有】唐霜 www.tangshuang.net【本文受版权保护】,我们设计为单向信息流,这样可以让每一个本文版权归作者所有,未经授权不得转载。【转载请注明来源】agent都只有一个输入和一个输出,以让【版权所有,侵权必究】本文作者:唐霜,转载请注明出处。实现更加简单。由于一项工作具有时间延续性本文作者:唐霜,转载请注明出处。【关注微信公众号:wwwtangshuangnet】,因此,我们设计任务调度层来维持一个任务转载请注明出处:www.tangshuang.net本文作者:唐霜,转载请注明出处。队列,通过中枢层来为任务调度提供方案。而【关注微信公众号:wwwtangshuangnet】【版权所有】唐霜 www.tangshuang.net且,我考虑到有一种情况是任务在执行过程中本文作者:唐霜,转载请注明出处。【作者:唐霜】,由于传感器发现了新的环境变量,此时我们原创内容,盗版必究。著作权归作者所有,禁止商业用途转载。可能需要插入新任务或者立即停止当前任务。

【作者:唐霜】【未经授权禁止转载】【原创内容,转载请注明出处】未经授权,禁止复制转载。

另外,我们没有让行动端端反馈直接返回给任【访问 www.tangshuang.net 获取更多精彩内容】原创内容,盗版必究。务,因为这样就会导致数据流向不再是单向的著作权归作者所有,禁止商业用途转载。原创内容,盗版必究。。我们需要将硬件执行器的反馈转换为感知端【本文受版权保护】著作权归作者所有,禁止商业用途转载。的信号,重新发送事件给中枢,由中枢来决定【本文首发于唐霜的博客】【访问 www.tangshuang.net 获取更多精彩内容】当前的执行是否符合预期。

著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】

AI应用架构【原创不易,请尊重版权】

【关注微信公众号:wwwtangshuangnet】【转载请注明来源】未经授权,禁止复制转载。

如果我们需要将AI应用进行部署,就需要考本文版权归作者所有,未经授权不得转载。【关注微信公众号:wwwtangshuangnet】虑如何在我们现有的条件下去充分利用好各种【未经授权禁止转载】【转载请注明来源】资源。随着LLM的基座越来越出色,我们将【访问 www.tangshuang.net 获取更多精彩内容】【作者:唐霜】来必然出现完全智能化的应用。

【版权所有】唐霜 www.tangshuang.net【作者:唐霜】【原创内容,转载请注明出处】【原创不易,请尊重版权】【本文首发于唐霜的博客】

【关注微信公众号:wwwtangshuangnet】未经授权,禁止复制转载。【转载请注明来源】著作权归作者所有,禁止商业用途转载。本文版权归作者所有,未经授权不得转载。

通过这一架构,我们可以让Agent被无限【原创内容,转载请注明出处】【版权所有,侵权必究】扩展,而无需调整已有代码。随着agent【关注微信公众号:wwwtangshuangnet】【版权所有,侵权必究】s的数量越来越多,系统能支持的能力也越来【本文受版权保护】未经授权,禁止复制转载。越强。我们只需要利用这些agents来进【版权所有】唐霜 www.tangshuang.net【作者:唐霜】行调用编排,即可实现让系统按需完成我们的原创内容,盗版必究。【版权所有,侵权必究】任务,例如:

【版权所有,侵权必究】原创内容,盗版必究。【关注微信公众号:wwwtangshuangnet】著作权归作者所有,禁止商业用途转载。
当 @agent1 发生xx时,且 @agent2 状态为xx时,@agent3 执行xxx

基于该指令,平台层可以基于已有的agen【版权所有】唐霜 www.tangshuang.net【原创不易,请尊重版权】ts被无限的设计出特定的功能。

【本文受版权保护】转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.net【版权所有,侵权必究】本文作者:唐霜,转载请注明出处。

结语【版权所有】唐霜 www.tangshuang.net

转载请注明出处:www.tangshuang.net【本文受版权保护】【本文首发于唐霜的博客】

随着我们对人工智能的研究,我们越来越开始【原创内容,转载请注明出处】【本文受版权保护】理解人类大脑的工作原理。本文通过对复旦论【转载请注明来源】【未经授权禁止转载】文的解读,提出了一种可以实现自执行的任务未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.net处理系统架构。一个agent本身的实现可著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。以很复杂,但是在概念上,它只是一个“in本文作者:唐霜,转载请注明出处。【访问 www.tangshuang.net 获取更多精彩内容】put -> agent ->【原创内容,转载请注明出处】转载请注明出处:www.tangshuang.net; output”的处理单元,是非常简单【未经授权禁止转载】著作权归作者所有,禁止商业用途转载。的。随着我们在技术上的深入,我们会越来越【本文受版权保护】原创内容,盗版必究。接近AI编程。就如上文展示的一样,将来,未经授权,禁止复制转载。未经授权,禁止复制转载。在AI系统的基础上,我们只需要使用非常简【访问 www.tangshuang.net 获取更多精彩内容】【本文受版权保护】单的自然语言,就能设计出以目标为导向的任【关注微信公众号:wwwtangshuangnet】本文版权归作者所有,未经授权不得转载。务,而无需关心它的具体实现,以及它的内部【版权所有,侵权必究】【作者:唐霜】原理。如此依赖,即使没有接触过编程的普通【版权所有,侵权必究】【本文受版权保护】人(甚至是障碍人士)也可以轻松的借助机器【访问 www.tangshuang.net 获取更多精彩内容】【转载请注明来源】完成自己的创意或工作。

转载请注明出处:www.tangshuang.net【版权所有,侵权必究】【原创内容,转载请注明出处】本文版权归作者所有,未经授权不得转载。【本文首发于唐霜的博客】

2024-03-24 3791 , ,

为价值买单,打赏一杯咖啡

本文价值37.91RMB