历经2个月，我的第一款真正意义上的AI产品上线|唐霜

大家好，这两个月我完成了一款产品——Videa。虽然过去一年，我做了很多东西，但是部分是套壳，部分是把别人的想法做出来，真正我一直想做的，其实是一款借助AI创作短视频的产品。现在，我把它做出来了。

下面，我将聊一聊我做这款产品的想法。

生成模型不是产品

我们现在已经有很多图片、视频的生成模型，图片领域有最早的SD、Flux，现在又有了recraft、ideogram等，而且国产的kolors等也获得好评，这几天flux kontext的发布再次震撼了业界；视频生成领域除了最早的Gen2、Pika、PixVerse，到Sora、Voe3，以及国内的混元、可灵、海螺、通义，都已经非常成熟。在如此激烈的生成模型竞争中，我发现，创作者要完成自己的短视频制作，仍然很难。

视频生成模型的厂商们在自家App中提供的视频生成功能，虽然在它们的演示中表现的非常抢眼，然而在实际使用中，普通用户很难一次性得到符合预期的结果。更重要的是，创作这件事本身，是有非常复杂的程序和时间因素的。而生成模型只能创建短时间的随机的视频，通过prompt是无法真正做到按预期生成视频的。

市面上出现了一些Agent模式的产品，例如skyreels，通过Agent来规划和制作长视频。然而其随机性大大增加，如果没有正确识别用户的创作意图，工具甚至会产出与用户意图背道而驰的作品。

总而言之，生成模型虽然好，但是只能解决从0到1的问题，而无法解决1到100的问题。模型本身很难直接成为产品，作为底层的支撑，在模型之上构建真正符合实际使用场景的产品，则是我的想法。

讲好故事而非视觉艺术

在得知AI生成视频的能力已经非常强的时候，我们跃跃欲试的心终于按捺不住，开始尝试将自己积压已久的想法制作成短视频。然而，很快我们就会发现，我们把事情想得过于简单，而工具们又把问题想得太复杂。实际上，我们的核心痛点，是想将我们内心的“故事”用短视频的形式表达出来，这种欲而不得的焦虑，促使我们对现有的AI工具产生质疑。

制作视频本身是一项技术的工作，优秀的视频剪辑，让视频非常出彩，专业的视频制作让一个博主、品牌具有强烈的人设。但是，作为普通人，很难在不以视频为自身主业的情况下，制作出令人称赞的视觉效果。那么，我们能否退而求其次，用朴素的视频，也可以传递我们想要表达的内容呢？

我的理解是，对于绝大多数有此冲动的人们而言，

短视频的本质是讲好一个故事，而非纷繁复杂的视觉艺术。

制作视频来讲述我们内心的故事，并不一定要让我们的视频具有多么高级的视觉艺术，我们都不是导演，拍不出电影级的视觉盛宴。我们的短视频，只是一个普普通通讲故事的人。这是一种表达欲的延伸，是互联网原始的初衷，是网络冲浪中敢于表达自身的内在需求。

在过去很长很长一段时间，文字或更高级的图文内容，充分展示了人们的内心世界。但在多媒体时代，这种表达，被媒体制作的技术要求所约束，以至于让网络平台成为某些人独有的话语权。

我们这个世界需要故事，而现在普通人通过AI，讲好自己的故事已经成为可能。我们绝大部分情况下，不会尝试去制作电影级的视觉效果，我们会用最朴素的节奏和配音，来把我们脑海中的故事，一点点的揉捏出视频的形。这个故事，可以是关于一个天真孩子看到神奇现象时脑海中的奇妙历险，可以是一个经过生活打磨后的中年打工人对年轻人的寄语，可以是科幻爱好者对未来星际旅行的人类空间城的设想，可以是策划人寻找与用户情感共鸣的广告设计，可以是文人们对历史回音里的控诉的无声传递。我们本质上想要短视频把90%的力量用在讲好故事，剩下的10%留给视觉和技巧带来的吸引力。

创作者们的工作流

在生成模型的基础上，创作者们构建了一套行之有效的工作流。总体而言，可以总结为如下：

在抛开需要在视频出现人物，并且保持人物一致性的情况下，这套工作流让创作者们可以利用AI工具，创作尽可能还原自身意图的短视频。而且，这套工作流的厉害之处在于，如果有足够的毅力，甚至可以制作出一部几十分钟的中长片，甚至电影级时长也不是没可能，毕竟即使电影的后期，也需要几个月的制作时间。

而对于AI工具的选择，则不同的创作者倾向不同，文生图有直接在本地部署Flux的，也有在即梦充会员的，音乐生成有网易云和qq音乐的对应平台，也可以去国外的suno等。总之，不同的工具选择，并不影响这一套工作流的具体实施。而这种灵活的组织模式，也可以让创作者们在实现创作的同时，尽可能压缩自己的成本。

化无形为有形

如何做出一款产品，将已知的概念，落地为切实的存在呢？我只抓住一个点，即前文所说的“短视频的本质是讲好一个故事”。从技术层面，短视频的制作中有一个非常重要的要素，就是“时间”，即视频这种形式与其它载体形式的最大区别就是在时间延续上的连贯性，画面的连贯性、声音的连贯性、意境情绪的连贯性。让“故事”在“时间”上行游，就是Vdiea这款产品的原始创意。

说的人话些，Videa的界面第一眼看上去就像一个视频编辑器。它由多个区域组成，其中最占视野的就是中间的视频画布区域和底下的轨道控制区域，轨道控制区域与几乎所有的视频编辑器大致相同。不同的地方在于：

Videa没有其它视频编辑器所拥有的素材控制
没有其它视频编辑器的特效和转场
没有其它视频编辑器的超强剪辑能力

它不是一个编辑工具，不是一个编辑工具，不是一个编辑工具！在我看来，它本质上是一个管理工具，你可以直接在Videa中完成上述工作流的全部内容，包括但不限于：

与AI对话来进行故事创作、脚本制作等
通过文生图、文生视频、图转视频等来获得画面素材
通过语音合成来创建配音
无需分镜管理，因为它主动提供了“分镜”类型的轨道
集成了“剧本”类型轨道来获得连续的文案和配音

对于“讲故事”的创作者们而言，视频编辑器上的众多特效特技我们用不上，这种时间轴轨道的形式，仅仅是为了以“时间”的维度来管理我们的分镜和素材，我们会更多的将精力放在我们的故事创作上，用故事的内核（而非视频外在）打动我们的读者/观众，用朴素的方式，传递我们内心的声音。

结束语

从故事出发，一点一点地构砌那个属于我们自己的讲述，一帧一帧画面的跳动，干净而朴素，故事娓娓道来，然后结束。作为一个独立开发者，我有很多故事可以讲，而Videa就像一位老朋友，它慢慢的倾听，并把我的故事用短视频的方式，呈现给每一个恰到好处相遇的人。

AI让原本需要很专业才能做到的事，如今成为每一个普通人手到擒来的。Videa默认配置下可以完全免费使用，当免费的AI能力不能满足时，你可以通过购买资源包来升级，资源包是按量扣费，而且Fuu AI全站可用。无需邀请码。电脑上打开使用：

https://videa.work

在使用过程中，如果你遇到什么问题，或者发现有什么地方还做得不够好，你可以在下方留言，让我可以知道。也可以点击下面阅读原文，分享到电脑上打开后收藏，与我保持长期互动，不放过你的每一个想法。关注本公众号，获取更多使用技巧。

好了，就到这里，祝你愉快😀

唐霜

历经2个月，我的第一款真正意义上的AI产品上线

生成模型不是产品

讲好故事而非视觉艺术

创作者们的工作流

化无形为有形

结束语

声明

关于

生态