242026.4

细数deepSeek v4给我留下的10个不爽的点!快气孕了!

1. 去融资!为什么要去融资?我们中国用户养不活你吗?
请你摆正自己的位置,你是国产大模型之光,不是那种路边摊捡的,你不知道你随便搞个什么套餐,用户都会疯狂埋单吗?一点自知之明都没有!
2. V3用的好好的,为什么要下架?
虽然现在各种大模型疯狂出,v3是一年前的产物,但是,用它创作内容真的香啊,关键是价格太感人,跟白菜价一样,为什么要下架,现在连报价都没了,你是看不起我们用户吗?你那个flash价格是一样,但是你看看出来的效果,能和v3比吗?把稳定好用的v3还给我,我给你氪不行吗?
3. V4-Pro为什么那么贵?这个价格怎么去干死对面claude和gpt?
支持国产,人人有责。但是,如果用一些第三方的,claude和gpt是可以薅到羊毛的,反而是国内模型一毛都薅不到。同样是开发人群,你怎么让大家有勇气从gpt切换到v4-pro?老实点,赶紧扛起价格屠夫的名号,把价格砍下来。
4. 为什么要开源?
你不知道你一开源,很快就又要有些模型公司超越SOTA了吗?本来我们自己关起门来,再卖token给外国佬,让他们也感受一下来自中国词元的力量。现在好了,他们去自己部署,反倒靠算力优势,通过一些平台把token反卖给我们。
5. 为什么不搞coding plan?是这种躺着收钱的方式不香吗?
你看看隔壁的智谱、minimax、kimi,还有字节、阿里,都在搞coding plan,一茬接一茬,既绑定了用户,有着稳定的月费收入,又可以让开发者们共享你的发展成果,利国利民,为什么不搞。
6. 为什么为了适配国产芯片,足足拖了半年才发新模型?
你知道你上一个模型是什么时候发的吗?R1是2025年1月,这都多久过去了?要不是你当年一个R1直接干懵整个模型界,威压足足扩散1整年,你现在发模型,就是“诈尸”了。过去半年你在干什么?glm-5.0发完又发5.1,minimax发完M2.6又发M2.7,kimi发完K2.5又发K2.6,gpt都从5.3到5.5了,claude都从opus4.5到4.7了,期间还有Sora2、香蕉2和Pro、Seedance2.0、HappyHorse这些逆天模型发布,你看看你在干嘛?
7. 为什么没有多模态?
之前坊间说v4是一个多模态模型,那你倒是兑现啊!现在好了,没有多模态,接编程工具还得再配一个支持图片识别的其他模型。之前发布的ocr咋不用进来?你说你!哎!
8. 为什么没有超过opus4.6?甚至连opus4.5都只能战平?
大家都以为你在憋大招,结果你只出了个意料之中。这让我吹出去的牛皮,都不好意思收回来。我知道你本来应该在半年前发,那个时候,拳打glm-5,脚踢gpt-5.3,那个时候你要是发,你就是王,现在发,你真的只能称弟弟了。
9. 为什么token耗的那么快?
同样一个任务,隔壁gpt才几毛钱,你已经飞上10多块去了。我知道你喜欢思考,但是,你倒是把思考用在刀刃上啊!我就问了一句你好啊,你直接给我吃了6毛钱,我感觉我快没资格跟你打招呼了。
10. 准备了那么久,为什么算力支持如此糟糕?
一个Agent任务,你给我中断了两次,说什么动态限频,还说什么等芯片厂商那边供货上来了,就给我们降价。喂!你是大模型公司,是国产之光,不是他们的打工仔!国产芯片再牛批,人家只是把你当作一个下游的订购商,等他搞起来了,他可以拿国家荣誉,他可以给其他模型厂商供货,你呢?狡兔走狗,你哭吧你。所以,别那么犟了!赶快再次拿出当年R1的新水准模型出来吧!
19:41:46 已有0条回复
162026.4

Token用不完?AICodingBus让你的团队共享词元

哈喽大家好啊,好久没发东西了。这段时间一直在忙产品相关的工作,比较少分享技术或者开源方面的探索。

这几天遇到一个挺有意思的现象:好几个小伙伴跑来问我,能不能一起拼一个 GLM 5.1 的套餐来写代码。毕竟目前国内模型里,5.1 确实算最强的那一档。再加上 Claude 官方最近上线了 KYC(身份认证)策略,用它的服务得做身份验证,而且本身就屏蔽了国内用户——这让国内的小伙伴用 Claude 的成本越来越高。很多渠道可能都面临关闭的风险,于是大家又把目光投回了国产模型。

智谱 5.1 发布后反响确实不错,但让人不爽的是:官方把直接订阅 Coding Plan 的入口给关了。据说是因为算力紧张,做这个套餐本身也比较亏本,现在就搞成“放量”模式——有点像秒杀,一出来就被抢光。好多小伙伴想买都买不到,有钱花不出去的感觉。

我自己手上倒有一个 Max 套餐。之前做 Claude Code 深度教程的时候,很多小伙伴通过我的推荐去买了套餐,官方给了我一笔返现奖励,我用这笔钱买了 Max 套餐。之前上车的朋友应该没亏吧?😄

现在这个套餐我自己用得不多,主要还是在用 Codex(GPT 模型写代码)。我就想,既然我用量少,能不能把这个套餐分享出去?收点钱回回血也行,实在不行免费分享也可以。

正好有小伙伴来找我,想“搭车”一起用这个套餐。但问题来了:官方并没有独立的 API Key 专门给 Coding Plan 用。在智谱官网上,所有服务的 token 是混在一起的——我账户里还有不少余额,是用来调用其他模型服务的。如果把 key 直接交给小伙伴,万一(不是不信任)把我通用 API 的余额也消耗掉了,那就尴尬了。

有没有现成的方案?

我找了一圈,市面上确实有中转系统(比如 One API 这类),可以把海外 Claude、GPT、Gemini 的 token 转给国内用户用。但那种方案太重了,面向的是跨境卖 token 的场景。我这边就是几个熟人一起用一个套餐,没必要搞得那么复杂。

搜了一圈,没找到合适的。那就自己做一个吧——反正功能上也不难。

一个晚上从 0 到上线

昨天晚上,我开始用 Claude Code,连上 GPT 和 GLM,把我的想法讲了一遍。让它帮我梳理需求、出 PRD 文档,然后根据文档设计系统架构。接着我开启了 Claude Code 的 Ralph 模式(需要装个插件,用一条命令就能让 AI 一直跑,直到它认为自己完成了所有需求)。

我让它自己跑,然后我就去睡觉了。

今天早上起来验收,功能基本都实现了,但细节上还有些问题:UI 不够好看,一些交互逻辑需要打磨。于是花了一整天,跟 Claude Code 和 AI 一起把系统打磨完,下午快吃饭的时候上线了。

AI Coding 的真实体验

现在做一套系统确实非常快。我的流程很简单:让 Claude Code 出设计文档、实现文档,然后开始跑。

但花时间最多的阶段,不是“从 0 到 1”,而是 从 1 到 100 的精细化打磨。

从 0 到 1 基本可以无人值守,AI 自己就能搞定。但精细化打磨的时候,你必须盯着它,出结果后马上验证,给实时反馈。比如 UI 上哪里不对、交互逻辑怎么改、隐私安全怎么保障——这些细节在初始阶段 AI 是没法帮你做好的。

我一整天绝大部分时间都在做这件事:告诉 AI 哪里有细节问题,让它改,然后验证。这个过程需要实时互动,不可能完全放手。

之前有做产品的朋友跟我交流,说他们对产品的理解很好,想借助 AI 独立实现产品。但经过这一天的体验,我发现他们可能能做到 0 到 1,但很难做到 1 到 100。因为有些东西你根本不知道“需要有这个东西”——比如加密、数据库字段、算法逻辑。你不知道,就没办法让 AI 帮你做。

当然,我们做技术的人从 90 分到 100 分能做得到,但从 0 到 1 的想象力可能不如产品经理。所以最好是两种思维都有——或者像我们这样,一个人既懂技术又懂产品,还得懂点营销。

AI 让大家失业?我觉得可能有一半的冲击,但完全颠覆行业还远着呢。比如界面审美——你得让 AI 装上视觉、理解效果、具备审美,这几乎不可能。所以目前来看,人还是不可或缺的。

我做的东西:AICodingBus

回到正题。我做这个系统叫 AICodingBus(AI 编程巴士),所有小伙伴都是来“搭车”的。

· 共享自己的 token,或者搭车使用别人的 token。
· 平台本身没有任何收费项目,只做分享和限制功能。收费什么的大家线下(场外)自己解决。
· 目标是熟人之间的 token 共享,不是那种中转服务商。

使用流程很简单:注册账号 → 创建共享池 → 填入上游服务商的 API 地址和 Key → 生成邀请链接 → 审核通过后,使用者就能拿到平台提供的 URL 和 Key,放到自己的编程工具里直接用。

核心设计点:

  1. 额度分配:比如一个套餐 3 个人用(包括创建者自己),可以设置平均分配份额,避免一个人把所有人的额度都用光。
  2. 隐私保护:使用者只能看到自己的用量,创建者能看到整体用量,但看不到其他人的具体用量。
  3. 防坑机制:如果创建者收了钱,不能随便踢人(只有成员主动退出)。当然这防不了君子不防小人——创建者可以直接在官方层面删掉 Key。后续可以考虑加信任评分系统,让大家知道谁靠谱。

个人建议一个共享池不要超过 10 个人,五六个人最好,方便管理。

使用地址:https://aicodingbus.24×7.to

使用说明:https://www.bilibili.com/video/BV1MMd6BvEuF/

最后

通过这次体验,我觉得 AI 编程确实很高效,但也没有想象中那么“傻瓜化”。我做这个工具主要想解决日常开发中的小问题,没打算靠它盈利。

如果你也有 token 共享的需求,或者对这个工具有什么想法,欢迎在评论区聊聊~

有机会再和大家聊更多话题,拜拜!

19:50:41 已有0条回复

怪不得如此蹊跷,原来Hermes Agent涉嫌抄袭

最近大火的Hermes Agent和之前大火的openclaw存在核心理念的差别。Hermes Agent最核心的一项特征,是有非常先进的记忆,实现自进化。关注我公众号的小伙伴都知道,我在之前的两篇文章中提到过,Agent的记忆“进化”能力会成为一项重要课题,当时点到了Claude Code和EvoMap两个项目。而Hermes的爆火,正是这个方向上的一大突破带来的影响力。

然而,今天,开源圈却爆出惊天大瓜,Hermes Agent涉嫌抄袭EvoMap。虽然EvoMap的项目完全开源(MIT协议),然而Hermes的项目在核心“进化记忆”设计上,与EvoMap 100%重合,却通过1:1的重新发明概念、用python重写,来宣称自己的完全自主研发创新,在其所有材料中,没有提到一嘴对EvoMap的感谢。

这是一起引发全球AI圈震动的开源伦理事件。事情的焦点是中国AI创业公司EvoMap,公开指控硅谷明星AI项目Hermes Agent,系统性抄袭了其开源的自进化引擎Evolver。

👥 谁是当事人?
控方EvoMap:一家不到20人的中国深圳创业公司。创始人张昊阳(95后)曾是腾讯《和平精英》的技术策划,其核心产品Evolver是一个能让AI通过自我学习不断进化的“引擎”。

辩方Nous Research:硅谷知名的AI实验室,融资过亿美元,在开发者社区影响力巨大。其明星产品Hermes Agent因强大的“自进化”能力在GitHub上斩获超过8.5万星标,是当时增长最快的AI项目之一。

🕵️‍♂️ EvoMap的核心指控
EvoMap的指控主要围绕以下几个方面:

时间线高度可疑:Evolver的核心概念于2026年2月1日完全公开,而Hermes Agent推出核心自进化功能的时间在3月初,时间差仅有24至39天。

架构设计惊人雷同:EvoMap发布的技术报告指出,双方在多个核心模块上存在一一对应的同构关系:

- 10步主循环:虽然编程语言不同(Hermes使用Python,Evolver使用Node.js),但两者的核心进化逻辑步骤几乎完全一致。
- 三层记忆体系:双方都采用了“持久事实层+程序性记忆层+历史搜索层”的架构。
- 核心术语替换:多达12组核心术语被系统性替换,例如将“Gene”换成了“SKILL.md”。
- 其他细节:双方还实现了“任务完成后自动提取经验资产”、“周期性自我反思机制”等高度雷同的功能。
- 开源协议被漠视:Evolver采用的是宽松的MIT开源协议,唯一的“署名”要求未被遵守。Hermes Agent在7份公开发布的材料中,均未对Evolver进行任何形式的引用、致谢或标明来源。

🤔 双方回应与辩护
面对详尽的指控,Hermes背后的Nous Research团队做出了一系列备受争议的回应。

第一次回应:傲慢与删帖
其官方账号回应称:“我们的仓库2025年7月就有了。我们是先驱。删除你们的账号”,并拉黑了EvoMap成员。这条回应因态度傲慢且技术论据不足,很快被删除。

第二次回应:坚决否认
联合创始人Teknium随后回应:“我这辈子从来没有听说过这个人、他的项目……毫无证据地声称我剽窃了他们的作品,这是谎言”。

辩方的技术辩护

仓库创建更早:辩方强调其主仓库创建于2025年7月,远早于Evolver。

“独立趋同”:认为出现相似设计是“英雄所见略同”,底层逻辑借鉴了共同的学术框架(如ICLR 2026 Oral的GEPA框架),而非抄袭。

⚖️ EvoMap的反驳与影响
EvoMap随即进行了有力反驳,并采取了行动:

戳破“先发”时间点:EvoMap指出,辩方的主仓库长期处于私有状态,内容无法验证;而涉及争议的“自进化”功能仓库创建于2026年3月9日,明显晚于Evolver的公开时间。

捍卫架构原创性:EvoMap强调,即便底层有通用学术概念,但将10步主循环、三层记忆、经验沉淀等模块进行特定组合的创新,正是其原创性的体现,且这种特定的组合方式不应在短期内被“独立”复现。

“闭源”以示抗议:由于在本次事件中感受不到对原创者的尊重,EvoMap宣布将Evolver的许可证从MIT改为更严格的GPL-3.0,并将核心模块改为混淆发布,标志着该项目从开放走向了保守。

💎 事件反思
这起事件的核心已超越了“代码抄袭”的技术层面,它更像一面镜子,映照出AI飞速发展下的几个深层矛盾:

开源伦理的困境:当“借鉴”的界限变得模糊,尤其在AI“洗代码”(通过AI工具重写代码以掩盖来源)技术出现后,如何保护原创者的尊严和生存空间?

影响力悬殊下的“举证之难”:一个拥有数亿美元融资、8万星标的明星项目,和一个只有2000星标的初创团队之间,话语权的天平天然是倾斜的。即便证据确凿,小团队也面临巨大的发声与维权成本。

总而言之,这起事件最终在法律层面也许难有明确判决,但它在技术圈激起的涟漪,将持续拷问整个AI行业的创新伦理与合作底线。

这件事让我更加印证了我很久以前的一个想法。MIT协议的开源,只适用于有强大话语权的强势方,(甚至开源本身)并不适用于没有话语权的弱势方。开源本身是一种共识,但是随着这个世界越来越向草台班子发展,这种共识很容易被打破,因为这种“犯罪”毫无成本。开源本身,在今天,已经没有太大的意义,这是一个悲伤的结局,是某些道德水平差的劣币驱逐良币的结果。

前段时间,HappyHorse准备开源时,其实我已经有点开始担心,然后昨天收到消息,阿里取消了HappyHorse的开源计划。在今天这个中美竞争激烈的时刻,开源已经成为一种国家级竞争的武器,特别是对于优秀的技术,要不要开源,如何开源,已经成为一项与国家利益直接挂钩的重要战略问题。这让我对DeepSeek的v4版本也捏一把汗,deepseek已经作出了非常多理论上的贡献,驱动了glm-5、qwen-3.6等大模型的成功,新版本是否开源,可能得掂量着中美竞争的大势来执行。

EvoMap只是一个非常小的团队,人数不足50人。在与西方有背后资本支持的团队竞争时,很容易落下风。EvoMap走向闭源是对的,他们没有deepseek那样的资本力量托底,技术高度又无法企及国家层面的支持,只能通过自己的深入研究来进一步发展。EvoMap的团队称,Nous Research可以抄袭,但是无法理解他们团队的下一步路线。当EvoMap开始闭源,Hermes Agent就只能靠自己的理解发展,甚至可能就不发展了,因为他们可能能理解EvoMap关于自发展记忆的技术,但是无法理解EvoMap关于记忆共享的生态,甚至更进一步的发展。

18:46:37 已有0条回复
142026.4

含切镜视频生成提示词怎么写?这份标准结构格式值得收藏

你是不是看到过非常专业的视频生成控制的演示呢?在别人用AI生成的视频演示中,你能看到他们可以让AI完全按照自己的想法生成视频。今天,我就把这个秘诀教给你。

想要严格控制AI生成视频的整体过程,我们推荐一种标准化结构的提示词格式,这种格式向AI提供了全面的生成依据,因此,可以做到精准把控。

让我们先看一个案例。

下面这个视频是用通用语言描述生成的视频:

提示词如下:

健身房,大叔对着镜子努力举哑铃,表情狰狞。旁边肌肉男轻松拉起三倍重量,结果裤子崩开,露出卡通内裤。大叔憋笑到岔气,哑铃砸到脚,单腿乱跳撞倒一排蛋白粉罐,粉尘漫天,所有人变成“雪人”。

而下面这段视频的,则是用我们标准结构的提示词生成:

提示词如下:

镜头1(0-2秒)
运镜:固定镜头
画面:中景,平视,顶光。中年大叔在健身房镜子前奋力举哑铃,面部肌肉紧绷,嘴角抽搐,双臂微微颤抖。
音效:哑铃碰撞声。
---
转场:镜头跟随视线右移
---
镜头2(2-5秒)
运镜:缓慢推进
画面:特写,侧光,低饱和度。肌肉男轻松举起三倍重哑铃,裤子突然崩开,露出卡通内裤,周围人表情从惊讶到憋笑。
音效:布料撕裂声。
---
镜头3(5-8秒)
运镜:轻微晃动
画面:全景,俯拍,高对比度。大叔憋笑岔气,哑铃脱手砸到脚,单腿跳跃撞倒蛋白粉罐,粉尘弥漫,所有人变成"雪人",表情从痛苦到滑稽。
音效:哑铃落地声、罐子倒下声、粉尘飞扬声。
---
音效(0-8秒):健身房背景噪音

可以看到,AI遵循了我们提示词中至少90%的指令。

那么,一款标准结构的提示词格式是怎样呢?下面就是一份我们总结的标准提示词示例。

写实纪实风、自然光、低饱和、轻微颗粒感。(可选)
---
镜头1(0-3秒)
运镜:固定镜头,轻微手持感(可选)
画面:中景,平视,侧光。角色A(通过 mention 引用)坐在凌乱书桌前,台灯只照亮半张脸。
台词(角色A,低沉且疲惫):“又来了。”(可选)
音效:虫鸣声。(可选)
---
转场:硬切,跟随角色A视线方向(可选)
---
镜头2(3-6秒)
运镜:缓慢前推(可选)
画面:特写,俯拍,焦点从虚到实。桌上笔记本内页墨水晕开形成黑色圆点。
台词(角色A,压低声线):“这不对劲。”(可选)
音效:笔在纸上的书写声。(可选)
---
...(可包含更多镜头、转场,总时长控制在 8-15 秒内)
---
音效(4-12秒):雨声(跨镜头,按需添加)
音效(12-13秒):巨大的雷声(跨镜头,按需添加)
---
**强制音频约束**:禁止出现任何音乐内容(包括但不限于背景音乐、配乐、歌曲、BGM、持续哼唱、乐器演奏),仅允许“音效 + 说话声”。

让我们来详细拆解一下:

  • 开头:提供整体视频的基础信息,这里提供基础的视频风格。
  • 镜头:
    • 时间跨度
    • 运镜:这里需要注意,我们在镜头内先指出运镜,这让AI可以更好的遵循指令,经过多番测试,生成的视频效果更好。
    • 画面:包含景别、光影、构图等镜头设计。然后才是对故事情节的具体展开。
    • 台词
    • 镜头音效
  • 镜头间转场
  • 其他镜头
  • 跨镜头音效:提供了该音效的持续时长
  • 其他提示信息

这份提示词所包含的信息非常具体,这种具体的指令,可以让AI更加可控的按照我们的需要去生成视频。

以上就是这份含切镜视频生成提示词标准结构格式的秘诀要领。赶快到你的视频生成中去试试吧。

21:23:15 已有0条回复
122026.4

可怕的事实在于,AI没有增加任何新的需求,而是用算力顶替人力,提升效率。但是,这背后存在巨大的安全隐患,那就是能力的中心化,所带来的风险集中。以前,企业雇佣工人来解决生产力问题,把能力分散在员工个体身上,当一个员工出现问题(例如生病、状态下滑等),可以通过可插拔式的招聘新员工来替代,这种去中心化的能力组合模式,是过去企业管理的底层基石。但是,随着用AI来顶替人类员工的盛行,能力的过度中心化,会企业带来巨大效率提升的同时,也买下巨大的隐患。当单一AI的能力不足以支撑企业的业务需求,或者遇到算力的降智时,企业必须承担这种中心化唯一节点退化带来的风险和损失,再也无法通过插拔式招聘替代来解决问题。也就是说,将企业的管理基石切换到AI模式后,企业不再有能力管理局部细节的风险,而是与AI和算力一荣俱荣一损俱损。

11:33:07 已有0条回复
102026.4

这个世界的另一种形态是信息,物质、能量、信息在不停的相互转换。但是人类自身结构的局限性,并不能完全理解超出自身接收信息的能力。宇宙的信息穿过人们的肉体,我们却对这些信息一无所知。于是,有人给它们取了个名字,叫“暗物质”,说它无处不在。世界上哪有那么多物质,只是存在的另外一种形式罢了。

22:31:26 已有0条回复
082026.4

AI让我消失的这半个月

Hey,大概半个月没有更新公众号了,不知道小伙伴们最近过的怎么样。这半个月我在集中开发一款AI漫剧制作平台 kuaimanju.com,因此没有时间更新公众号文章。今天,我同步更新了播客,播客Robust已经有快两年没有更新了,感觉已经失去了节奏。同样,我的博客也长时间没有更新,一方面是没时间精力,另一方面是不知道有什么内容是必须用文字来表达的。

过去一段时间(1年左右),我尝试了多个idea,我在思考自己的定位,在思考AI对于我们个人,有什么样的启示。在AI时代,信息的流速会越来越快,人如何在有限的时间里,完成自己想做的事情?哪些想法是应该放弃的,哪些是应该持续保持去做的?这对我来说,都值得去思考。人对时间的把控能力,随着AI的到来变得越来越弱,这和人们对AI最初的理想,背道而驰。但是,我们对环境的抱怨没有任何裨益,适应环境,在匆忙的时间里,把自己认为值得花时间去打磨的东西做好,或许就是一种和AI对抗的方式。

在这半个月里,我沉浸式的进行vibe coding,完成了kuaimanju.com平台。在2年前,我从腾讯离职,离职聚餐的时候,前同事给我留下了一个问题:AI什么时候能帮我们写代码?今天,这个问题得到了很好的回答。世间事事难料,我们作为普通人,在时代的浪潮前,最大的救赎就是逐浪而行。

我记得还没离职时,BG搞了两次技术的交流会,当时我们聊到了AI编程,我当时的发言还是围绕RAG技术,认为依靠这个技术应该也可以通过工程来实现AI编程的一些能力。谁能想到,短短两年时间RAG已经成为一门很少被提及的技术。现在,连“上下文工程”都是一个落伍的词,最近,只有聊“Harness”才是时髦的。

从对“AI帮助我们写代码”感到有些难以理解,到“没有AI写不了代码”的今天,只有短短两年,软件行业正在被完全重塑,甚至软件本身,也在迎来2.0时刻,软件的交互,正在从通过鼠标、键盘的交互模式,向说话、感官的交互模式转变,这种转变很大程度是因为AI所带来的信息兼容性得到的。以前,人们只有通过手工的方式,才能为机器提供准确的指令,但AI的出现,让人们开始不再需要直接向机器提供准确指令,而是只需要描述和引导。这使得在2015年,绝大多数的产品经理职业的人们,开始转型做开发,甚至有些小企业的老板亲自下场做开发。

这种趋势被Anthropic敏锐的捕捉到。在Manus爆火之后,他们就猛然看到了这种必然的趋势,因此,它们在一种莫名其妙的动力驱使下,将所有的宝押在“Coding模型”这条道路上。当时我觉得莫名其妙,因为openAI们都在追求真正的“大”模型,也就是通用模型,而Anthropic为什么要专注在代码上?难道是做通用模型太难了,所以先退而求其次?

现在,我们已经看到了。Anthropic通过claude code这个拳头产品,已经构建起了一整套的AI生态,今天,它的营收已经超过了openAI,而这种收益,还是在它严格要求安全的前提下,当然,还有一点,令人不爽的,在对中国的高强度封锁的前提下。前几天,claude code的源码泄漏出来,但是,这不仅没有让它的护城河决堤,相反,人们看到了它稳固的AI发展前景。

Claude code这款产品,虽然一开始是一个极客类型的产品,只有CLI界面。但是,我看到太多不同行业的人,在听说它的强大之后,以身试险,并通过claude code,认识了“AI真的能干活”这个新世界的大门。现在,很多人接触openclaw,开始“养虾”,他们刚接触的时候,会惊讶于,AI还能“真的做事”,而实际上,在那之前,claude code / codex 已经杀疯了。
当AI开始真的做事的时候,作为有贪恋的我们,就会开始尝试让我们处于高强度的多线程并行状态中。

我以前写代码会进入心流状态,写代码写到忘记现在是上午还是下午。但是,在拥有AI之后,我开始同一时间,处理多个项目的代码,在不同的编程窗口之间来回切换,确认当前的编程进度。AI并没有让我轻松下来,而是让我快起来,快的停不下来。

于此同时,我会不舍得放弃任何一个想法,因为我已经有AI了,它可以帮我在半个小时里面给一个想法做出一个原型效果。我会想,既然已经开始了,看到雏形了,那我怎么舍得不把它做完呢?于是,我就会开始并行做多个项目,有了想法就会去尝试做一个新的网站或小程序。

然而,随着开发进入深水区,进入细节逻辑的补充,细节UI的调整优化,AI就会开始慢下来,而我就开始着急。同步写多个项目的情况下,我会在多个编程进度窗口之间切来切去,看着还在处理的进度,有些焦虑。

这就是现实。AI并没有让我们感到轻松,并不是AI本身的问题,而是我们自己本身的问题。当我们手上有了“锤子”,我们就会去拼命找“钉子”。在不停的寻找中,我们也慢慢丢失了自己最开始的理想:让AI去做,我就解放,可以去喝喝茶,逛逛春天。

所以,我开始对自己说:停下来吧。

虽然用AI来开始一个产品的0-1非常容易,可是AI现在只能做到80%,而剩下的20%是最艰难的部分。更艰难的,是产品100%以后,如何让产品让更多人看见,如何让更多人满意。

当编程,不再是我的全部工作,我就需要花更多时间去关注如何让产品被看见,如何让产品被看好。这完全超出了我以往的经验和能力范畴。虽然现在AI非常强,但是,当我们进入自己不熟悉的领域时,我们并不知道如何让AI替自己在这个新领域做事。所以说,AI并不能真的让人无所不能,在用AI成为强者之前,我们必须先成为这个领域的专家。

但是,好在,我们有AI,可以快速入门一个领域,让我减少进入这个领域的门槛。做市场,做营销,做内容推广。这些以前并不在行的事,在AI的辅助下,我做的仅仅有条。虽然算不上很好,但是不会毫无头绪。

在AI这个领域,我从2024年初,就开始关注除了AI智能之外的另一个领域,就是AIGC。在2026年的今天,AIGC似乎已经很少人提了。但是,今年上市的minimax之所以在股价上表现好于GLM,更多的原因就在于minimax在AIGC领域还有着巨大的市场份额。对于普通人而言,AIGC意味着AI时代的艺术创作、哲学思考和赛博文学。

在B站上,我们可以看到一些非常了不起的作品。这些作品用AI完成,它们不是什么影视作品,不讲究镜头表达,它们只在乎“思考”这件事。它们思考,AI对于人类的认知、存在、未来进行思考。它们应该被当作艺术品,或者文学作品放起来。

在AI时代,每一个普通人都可以通过AIGC作品来进行表达。这种表达的形式,往往就是我们熟知的“影片”的形式。人类的表达是无穷无尽的,从人开始拥有语言开始。没有什么是可以遏制人类的表达欲的。只不过,不同的时代,人类的表达形式在不停的变着,落伍的表达形式,无法让更多人看到,新潮的表达形式,会进入更多人的视野。这也就是为什么,我选择在今年这个特殊的时间节点,仍然投入完成kuaimanju.com 这个项目的原因。

去年(2025)6月份的时候,AI漫剧这个赛道开始突然火热。当时已经有一些沙雕漫剧很火了,比如“虾仁”系列的,那个时候,“解说漫”开始出现,这种模式用AI很方便制作,github上还出现了moneyprinter这样的项目。但是到了年末和今年初,平台开始突然收紧,AI漫剧开始走向精品化,4月1日,广电关于漫剧的新规施行,整个行业真正进入新阶段。

我认为这对真正有表达欲,想要通过作品传达自己思想的创作者是好事,因为平台和官方已经为这样的创作者扫除了市场上的干扰因素。而AI的成熟,也为创作者们带来了更便捷的制作路径。这可能是对创作者们来说,最友好的时候。随着AI剧成为一种重要的,有规范的内容创作形式,它将挤压传统的创作形式,例如以前鬼畜是一种非常流行的创作形式,而现在,AI剧会替代它,成为新的流行,创作者们会依赖这种形式的内容来表达,当然,具体表达的内容可以五花八门,不一定全部都是正能量,但是,不可否认,一旦一种表达形式成为主流时,传统的表达形式的市场就会变小,就像我的博客、播客,甚至公众号,这些表达形式,都在慢慢像艺术品一样,虽然看上去很“香”,但是看的人很少。

当然,对于一个创作工具而言,就像Cursor一样,更像是一个壳,而不是一个颠覆级创新。壳就应该有壳的态度,所以,我在开发kuaimanju.com时,既尽可能的追求极致的贴近类似即梦这样的工具的原生能力,又持开放态度,让用户可以与其他平台对接打通。我想,一个壳,重点不在于本身能力有多强,而在于对这个领域的流程、特征的契合,这也就是Harness的思想。

我写这篇文章,不是为了介绍这个新产品。我只是在回顾这半个月时,绕不开这个沉浸式vibe coding过程中的产出。随着我从开发人员的身份转变,我也开始审视我应该表达些什么。过去很长一段时间,我输出的内容把注意力集中在面向开发者们表达,“工匠精神”“做T型人才”“追求代码的极致”,这些曾经引以为傲的。如今,我本身已经脱离了一半的开发,我很难在输出技术层面的原理性内容。写作,往往逃不出“太炸裂”“天塌了”这类博眼球流量的宿运。所以,我开始思考,我是否需要继续写作,或者,我并不需要写更多的干货,而是回归写作的初衷——表达。

人类需要表达。

这里的表达不是输出干货,不是追求“有用”,而是一种近乎无用的自我刻画。这也是博客时代最初的模样。世事无常,大肠包小肠,九转回肠,又转回到最初的模样。在这个AI输出的“有用”内容比普通人更专业、更全面、更结构化时,人们就可以回到最初的表达,向世界表达:我是谁,我是怎样?所以,我以后会同步博客、公众号的内容,不再输出所谓干货,把自己真正所想所思记录下来,回归最初。

当AI照进现实,照进城市的高楼之巅,照进中国的乡村田间,我们这一代人,共赏这一轮“新月”到来。

22:10:24 已有0条回复