用ComfyUI的思路设计Agent工作流

广告位招租
扫码页面底部二维码联系

过去几周,我一直再思考如何用自然语言来编【转载请注明来源】【版权所有】唐霜 www.tangshuang.net写Agent工作流。起初我的思路是通过L著作权归作者所有,禁止商业用途转载。原创内容,盗版必究。LM从自然语言中提炼出可用于表达Work本文作者:唐霜,转载请注明出处。【作者:唐霜】flow的DSL,再由DSL来驱动​流程转载请注明出处:www.tangshuang.net本文版权归作者所有,未经授权不得转载。引擎。但是在实现过程中,我发现流程引擎的【版权所有,侵权必究】原创内容,盗版必究。能力与DSL的匹配度其实很难把握,其中的转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】根源在于DSL本身的设计,往往具有局限性本文版权归作者所有,未经授权不得转载。未经授权,禁止复制转载。​。在使用了ComfyUI的工作流之后,【访问 www.tangshuang.net 获取更多精彩内容】【原创不易,请尊重版权】我有了新想法,这篇文章就来聊一聊​。

【关注微信公众号:wwwtangshuangnet】【本文首发于唐霜的博客】【原创内容,转载请注明出处】【原创内容,转载请注明出处】

什么是ComfyUI​?【版权所有】唐霜 www.tangshuang.net

【原创不易,请尊重版权】【本文首发于唐霜的博客】【版权所有】唐霜 www.tangshuang.net未经授权,禁止复制转载。【访问 www.tangshuang.net 获取更多精彩内容】

在AIGC领域,除了LLM,我想你应该都【版权所有】唐霜 www.tangshuang.net【本文首发于唐霜的博客】了解文生图这个领域,而该领域的开源模型S本文版权归作者所有,未经授权不得转载。原创内容,盗版必究。table Diffusion​则占据了原创内容,盗版必究。原创内容,盗版必究。大半江山。由于开源社区的强大,SD的生态【版权所有】唐霜 www.tangshuang.net【版权所有,侵权必究】非常丰富​。作为其官方公司Stabili本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】ty仅仅发布了底座模型,甚至都没有UI,【版权所有】唐霜 www.tangshuang.net本文作者:唐霜,转载请注明出处。而社区目前最主流的两大UI(WebUI和【版权所有,侵权必究】【转载请注明来源】ComfyUI)都非官方作品,却​派生了【访问 www.tangshuang.net 获取更多精彩内容】著作权归作者所有,禁止商业用途转载。更大的社区空间。(最近新的UI工具for【原创内容,转载请注明出处】本文版权归作者所有,未经授权不得转载。ge也涌现出来,开源真的促进​发展。)

【作者:唐霜】未经授权,禁止复制转载。本文版权归作者所有,未经授权不得转载。

WebUI以配置为操作模式,用户通过选、【版权所有】唐霜 www.tangshuang.net【关注微信公众号:wwwtangshuangnet】填来完成​模型操作。而ComfyUI则是【版权所有,侵权必究】【转载请注明来源】以工作流为操作模式,用户需要通过配置出一【本文首发于唐霜的博客】本文版权归作者所有,未经授权不得转载。个个的pipeline,通过不同节点和连未经授权,禁止复制转载。原创内容,盗版必究。线来完成​模型操作和内容生成。两者各有优【版权所有】唐霜 www.tangshuang.net【转载请注明来源】势,但在灵活性和深度上,​ComfyUI【版权所有】唐霜 www.tangshuang.net未经授权,禁止复制转载。更胜一筹。如果WebUI是一次冒险旅行,转载请注明出处:www.tangshuang.net转载请注明出处:www.tangshuang.net那么ComfyUI则是一场拉力赛,前者短【原创不易,请尊重版权】【访问 www.tangshuang.net 获取更多精彩内容】时间浅尝辄止,后者​有些累人但柳暗花明。本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】如果你还没有用过​,建议你现在就去尝试一【版权所有,侵权必究】未经授权,禁止复制转载。下。

著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】【版权所有,侵权必究】转载请注明出处:www.tangshuang.net

Workflow本身就是模型著作权归作者所有,禁止商业用途转载。

【本文首发于唐霜的博客】转载请注明出处:www.tangshuang.net著作权归作者所有,禁止商业用途转载。原创内容,盗版必究。

ComfyUI最吸引人的地方在于它的工作著作权归作者所有,禁止商业用途转载。【关注微信公众号:wwwtangshuangnet】流是可以被分享的,在社区openart.【转载请注明来源】【版权所有,侵权必究】ai上,民间高手们分享着自己的工作流,其【版权所有】唐霜 www.tangshuang.net【未经授权禁止转载】他小伙伴可以下载这个工作流,并导入到自己著作权归作者所有,禁止商业用途转载。【转载请注明来源】的comfyui中去,再替换自己的pro【未经授权禁止转载】未经授权,禁止复制转载。mpt,就能用相同的参数,生成该工作流预【访问 www.tangshuang.net 获取更多精彩内容】转载请注明出处:www.tangshuang.net设的效果的​图片。

【访问 www.tangshuang.net 获取更多精彩内容】原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。

注意,我这里说的是,用相同的参数​。转载请注明出处:www.tangshuang.net

【未经授权禁止转载】本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】【原创不易,请尊重版权】

​这不就是模型吗?在comfyui的每一原创内容,盗版必究。本文作者:唐霜,转载请注明出处。个节点中,我们需要配置好节点参数,在运行【转载请注明来源】【本文首发于唐霜的博客】工作流时,​这些参数就会生效。以一个wo【未经授权禁止转载】【原创不易,请尊重版权】rkflow作为蓝本,对它节点上的参数做原创内容,盗版必究。著作权归作者所有,禁止商业用途转载。细微的调整,就能在原来的图片效果基础上做【本文受版权保护】【作者:唐霜】​细微变化,这不就是微调吗?目前,在co本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】mfyui的生态中已经有近百的插件,也就【作者:唐霜】原创内容,盗版必究。意味着我们可以构建出非常庞大的workf【版权所有】唐霜 www.tangshuang.net【本文首发于唐霜的博客】low,而通过微调workflow,以达【本文受版权保护】【原创内容,转载请注明出处】到自己最满意的效果之后,在后续的全部工作【原创内容,转载请注明出处】未经授权,禁止复制转载。中,我们就可以再次使用这个workflo未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.netw,只需要传入不同的初始prompt即可【原创内容,转载请注明出处】【原创不易,请尊重版权】​。

【本文受版权保护】著作权归作者所有,禁止商业用途转载。【本文受版权保护】原创内容,盗版必究。

【访问 www.tangshuang.net 获取更多精彩内容】【转载请注明来源】【作者:唐霜】

你看,这样的工作模式,不就是模型的工作模本文作者:唐霜,转载请注明出处。【版权所有,侵权必究】式吗​?​而comfyui的workfl著作权归作者所有,禁止商业用途转载。本文版权归作者所有,未经授权不得转载。ow导出后,仅仅是一个json文件。

原创内容,盗版必究。著作权归作者所有,禁止商业用途转载。【本文受版权保护】【版权所有,侵权必究】

移植可能性​?【转载请注明来源】

本文作者:唐霜,转载请注明出处。【本文受版权保护】【版权所有】唐霜 www.tangshuang.net【关注微信公众号:wwwtangshuangnet】

基于这种理念,我发现在Agent的工作流【转载请注明来源】【作者:唐霜】搭建中,直接照抄​,是完全可以的。在St【版权所有,侵权必究】【本文首发于唐霜的博客】able Diffusion的模型操作中【版权所有】唐霜 www.tangshuang.net未经授权,禁止复制转载。,comfyui插件甚至可以调用第三方模未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.net型,只要确保节点的输入输出符合​work【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。flow中的要求即可。

转载请注明出处:www.tangshuang.net【本文受版权保护】【作者:唐霜】

同样的道理​,Agent工作流不也是这样【原创不易,请尊重版权】本文作者:唐霜,转载请注明出处。吗?只要确保我们的节点​有符合要求的输入未经授权,禁止复制转载。【访问 www.tangshuang.net 获取更多精彩内容】输出即可。于是,我有了移植ComfyUI原创内容,盗版必究。【本文首发于唐霜的博客】到​Agent工作流创建中的想法。如果可本文版权归作者所有,未经授权不得转载。未经授权,禁止复制转载。以在现有的ComfyUI的基础上,加入A转载请注明出处:www.tangshuang.net【版权所有,侵权必究】gent的工作流搭建能力,不仅可以解决A【原创内容,转载请注明出处】【访问 www.tangshuang.net 获取更多精彩内容】gent工作流编程问题,还能直接将LLM本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。和生图模型结合在一起,甚至在Stable原创内容,盗版必究。转载请注明出处:www.tangshuang.net Diffusion生成视频的能力,构建著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。完全自动化的营销短视频生成、发布​流程,【作者:唐霜】【访问 www.tangshuang.net 获取更多精彩内容】也不是不可能。于是我开始研究ComfyU转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.netI的源码​。

【本文受版权保护】著作权归作者所有,禁止商业用途转载。【原创内容,转载请注明出处】未经授权,禁止复制转载。【本文首发于唐霜的博客】

然而,结果有点小失望,ComfyUI和S【版权所有,侵权必究】【关注微信公众号:wwwtangshuangnet】table Diffusion的绑定比较【原创内容,转载请注明出处】未经授权,禁止复制转载。深,虽然我们可以用它来实现上述的设计,但【原创不易,请尊重版权】未经授权,禁止复制转载。是当我去尝试封装它的代码时,发现似乎没有【未经授权禁止转载】【本文首发于唐霜的博客】什么工作可以做,除非全部重写一遍,把它重【版权所有】唐霜 www.tangshuang.net【作者:唐霜】构为一个与SD解耦的纯AI模型工作流,但著作权归作者所有,禁止商业用途转载。【未经授权禁止转载】如果是这样的话,可能要做的工作比较多,最【原创内容,转载请注明出处】【版权所有】唐霜 www.tangshuang.net终可能就做出一个类似coze一样的平台,【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。成本有点大​,感觉没必要。而ComfyU【访问 www.tangshuang.net 获取更多精彩内容】【本文受版权保护】I之所以​如此流行,还和它的性能有关,或未经授权,禁止复制转载。未经授权,禁止复制转载。者说它的python部分真的很少,以至于【版权所有】唐霜 www.tangshuang.net【关注微信公众号:wwwtangshuangnet】整个仓库没多少代码,运行起来当然是​有不【原创内容,转载请注明出处】【版权所有,侵权必究】错的性能表现。

【本文受版权保护】【本文受版权保护】原创内容,盗版必究。未经授权,禁止复制转载。【作者:唐霜】

工作流技术揭秘【本文首发于唐霜的博客】

著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。【本文受版权保护】【作者:唐霜】原创内容,盗版必究。

Workflow本质上是流程引擎的应用,原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。只不过世界上的流程引擎各有各的怨念,家家【未经授权禁止转载】著作权归作者所有,禁止商业用途转载。有本难念的经​,看上去所有的流程都差不太本文作者:唐霜,转载请注明出处。【原创不易,请尊重版权】多,但是细细一看,又哪哪都不同。

本文作者:唐霜,转载请注明出处。转载请注明出处:www.tangshuang.net本文作者:唐霜,转载请注明出处。

我们从使用的角度,往往会从图出发来设计w著作权归作者所有,禁止商业用途转载。【作者:唐霜】orflow​。这也是为什么comfyu【关注微信公众号:wwwtangshuangnet】【转载请注明来源】i能流行起来的原因,因为它封闭了流程执行著作权归作者所有,禁止商业用途转载。原创内容,盗版必究。的内部细节,用看得见的流程图来作为直观的【作者:唐霜】【原创内容,转载请注明出处】操作​入口。和bpmn这样的业务流程图设【本文首发于唐霜的博客】转载请注明出处:www.tangshuang.net计差别巨大,以组织软件运行为目标的流程图【原创内容,转载请注明出处】本文作者:唐霜,转载请注明出处。往往会以“节点”作为容器来运行某个软件或转载请注明出处:www.tangshuang.net【未经授权禁止转载】程序,并以“边”来表达节点之间的数据流向本文版权归作者所有,未经授权不得转载。本文版权归作者所有,未经授权不得转载。

本文作者:唐霜,转载请注明出处。【本文首发于唐霜的博客】【原创内容,转载请注明出处】

转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】本文作者:唐霜,转载请注明出处。

节点和边各自有多种类型,不同的类型所表达【转载请注明来源】著作权归作者所有,禁止商业用途转载。的执行​方式不同。

【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。著作权归作者所有,禁止商业用途转载。

通常,节点有输入和输出,根据不同的类型,原创内容,盗版必究。原创内容,盗版必究。输入输出的数量又不同​。除了输入输出,节著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshuang.net点还需要配置属性(或者叫参数)。节点本身【作者:唐霜】转载请注明出处:www.tangshuang.net意味着它内部会调用某个软件或程序,把输入本文版权归作者所有,未经授权不得转载。本文作者:唐霜,转载请注明出处。和参数同时传给这个程序,等待程序返回结果【本文受版权保护】未经授权,禁止复制转载。,将这个结果按照规则解析后​,作为输出给原创内容,盗版必究。未经授权,禁止复制转载。到下一个节点。

【转载请注明来源】本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。

边有方向,​负责把节点串联起来。【版权所有】唐霜 www.tangshuang.net

【关注微信公众号:wwwtangshuangnet】本文作者:唐霜,转载请注明出处。【转载请注明来源】转载请注明出处:www.tangshuang.net

由节点和边构成的网络我们称为图(Grap著作权归作者所有,禁止商业用途转载。【原创内容,转载请注明出处】h),很多流程设计都遵循这种模式,例如米未经授权,禁止复制转载。【原创内容,转载请注明出处】家智能家居的配置、nodered的设计、本文作者:唐霜,转载请注明出处。【未经授权禁止转载】xstate状态图,前几天介绍的lang【转载请注明来源】著作权归作者所有,禁止商业用途转载。graph本质上也是参考状态图。图的形状本文版权归作者所有,未经授权不得转载。转载请注明出处:www.tangshuang.net可以有非常多的变化,而不同的变化所带来的【本文受版权保护】本文作者:唐霜,转载请注明出处。效果​完全不同。

【版权所有】唐霜 www.tangshuang.net未经授权,禁止复制转载。【转载请注明来源】

我们可以把图作为Workflow的某种可原创内容,盗版必究。转载请注明出处:www.tangshuang.net视化的DSL,它以图形语言的方式表达了一【原创不易,请尊重版权】转载请注明出处:www.tangshuang.net个工作流是怎么运作的​。我们执行一个流程【版权所有,侵权必究】【原创不易,请尊重版权】图,本质上就是以流程图作为DSL来驱动流【访问 www.tangshuang.net 获取更多精彩内容】【本文受版权保护】程引擎工作执行。

原创内容,盗版必究。本文作者:唐霜,转载请注明出处。【未经授权禁止转载】

结语原创内容,盗版必究。

【本文受版权保护】【版权所有】唐霜 www.tangshuang.net著作权归作者所有,禁止商业用途转载。本文版权归作者所有,未经授权不得转载。

本文介绍了ComfyUI,并希望借鉴Co【原创不易,请尊重版权】【本文受版权保护】mfyUI设计基于相同的图(Graph)【本文受版权保护】未经授权,禁止复制转载。来实现Agent工作流的​想法。在界面交【本文受版权保护】【访问 www.tangshuang.net 获取更多精彩内容】互上,ComfyUI依赖的是一款名为li本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.nettegraph.js的流程图脚本库,要实转载请注明出处:www.tangshuang.net本文版权归作者所有,未经授权不得转载。现​流程图的创建的交互本身并不复杂。现在【原创不易,请尊重版权】转载请注明出处:www.tangshuang.net的问题是,如何在后端有效的管理、注册、调著作权归作者所有,禁止商业用途转载。未经授权,禁止复制转载。度、执行Agents​,这或许是我接下来【本文受版权保护】本文版权归作者所有,未经授权不得转载。要研究的。​

本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。

2024-04-16 4501

为价值买单,打赏一杯咖啡

本文价值45.01RMB