第048期:Sora的出现,加速了AGI进程,疯狂的想法喷涌而出

广告位招租
扫码页面底部二维码联系

OpenAI在我们中国春节期间发布了新产【本文首发于唐霜的博客】【访问 www.tangshuang.net 获取更多精彩内容】品——Sora,它将是比ChatGPT更【原创内容,转载请注明出处】【关注微信公众号:wwwtangshuangnet】颠覆的产品,ChatGPT的主要能力是理未经授权,禁止复制转载。未经授权,禁止复制转载。解通用自然语言和常识,并做出文本的预测,【原创内容,转载请注明出处】【原创内容,转载请注明出处】而Sora的能力是理解这个世界的运行规律【本文受版权保护】本文版权归作者所有,未经授权不得转载。,并以视频的形式完成预测,“理解世界的运本文作者:唐霜,转载请注明出处。【作者:唐霜】行规律”和“理解自然语言”比起来,级别一本文版权归作者所有,未经授权不得转载。【作者:唐霜】下子上升了很多,所以我说它将是比Chat【未经授权禁止转载】【原创内容,转载请注明出处】GPT更颠覆的产品。本期将深入聊一聊我对【未经授权禁止转载】本文版权归作者所有,未经授权不得转载。Sora这款产品的看法。

本文版权归作者所有,未经授权不得转载。【版权所有】唐霜 www.tangshu著作权归作者所有,禁止商业用途转载。【版权所有,侵权必究】ang.net本文作者:唐霜,转载请注明出处。

【关注微信公众号:wwwtangshua【作者:唐霜】【访问 www.tangshuang.net 获取更多精彩内容】ngnet】未经授权,禁止复制转载。著作权归作者所有,禁止商业用途转载。

在线收听

喜马拉雅:点击播放

【版权所有】唐霜 www.tangshu本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.netang.net转载请注明出处:www.tangshua【转载请注明来源】本文作者:唐霜,转载请注明出处。ng.net

你还可以在苹果自带的 Podcast 应【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。用、小宇宙APP、QQ音乐中搜“Robu【访问 www.tangshuang.net 获取更多精彩内容】【原创内容,转载请注明出处】st”找到我们的节目收听。

原创内容,盗版必究。转载请注明出处:www.tangshua原创内容,盗版必究。【版权所有】唐霜 www.tangshuang.netng.net

捐赠支持

求打赏🙇如果你觉得 Ro【本文受版权保护】【原创不易,请尊重版权】bust 这样一档技术类的谈话节目还不错本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】,希望我继续做下去,不妨打赏支持。

著作权归作者所有,禁止商业用途转载。原创内容,盗版必究。

本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。【访问 www.tangshuang.n【版权所有,侵权必究】【版权所有,侵权必究】et 获取更多精彩内容】【版权所有】唐霜 www.tangshu【关注微信公众号:wwwtangshuangnet】【版权所有】唐霜 www.tangshuang.netang.net

内容摘要

OpenAI在我们中国春节期间发布了新产转载请注明出处:www.tangshuang.net本文版权归作者所有,未经授权不得转载。品——Sora,它将是比ChatGPT更【访问 www.tangshuang.net 获取更多精彩内容】著作权归作者所有,禁止商业用途转载。颠覆的产品,ChatGPT的主要能力是理【本文首发于唐霜的博客】原创内容,盗版必究。解通用自然语言和常识,并做出文本的预测,本文版权归作者所有,未经授权不得转载。原创内容,盗版必究。而Sora的能力是理解这个世界的运行规律本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。,并以视频的形式完成预测,“理解世界的运原创内容,盗版必究。【版权所有】唐霜 www.tangshuang.net行规律”和“理解自然语言”比起来,级别一未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.net下子上升了很多,所以我说它将是比Chat本文版权归作者所有,未经授权不得转载。本文版权归作者所有,未经授权不得转载。GPT更颠覆的产品。

【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。【版权所有,侵权必究】

如果人工智能能够理解这个世界的运行规律,【版权所有】唐霜 www.tangshuang.net【本文受版权保护】那么也就可以建立现在业界提出的概念“世界未经授权,禁止复制转载。本文版权归作者所有,未经授权不得转载。模型”,一旦世界模型得以建立,我们就可以转载请注明出处:www.tangshuang.net【原创不易,请尊重版权】再建一个平行世界。这样的想法很是疯狂,不本文版权归作者所有,未经授权不得转载。原创内容,盗版必究。过疯狂的想法不止于此。

本文版权归作者所有,未经授权不得转载。【转载请注明来源】未经授权,禁止复制转载。【作者:唐霜】

AGI(通用人工智能)作为新工业革命标志【本文首发于唐霜的博客】【版权所有,侵权必究】,几乎已经形成了共识。未来我们的生产、消【作者:唐霜】本文作者:唐霜,转载请注明出处。费、娱乐、科学等等,都可能依赖AGI,或转载请注明出处:www.tangshuang.net【作者:唐霜】者以它为工具,或者用AGI创造新智能,甚【原创内容,转载请注明出处】转载请注明出处:www.tangshuang.net至寄生于中。当然,这里面有很多社会学、人【原创内容,转载请注明出处】未经授权,禁止复制转载。类文化学的问题要研究,例如一个最关键的问【转载请注明来源】未经授权,禁止复制转载。题是,穷人在这个时代如何被赋予公平的权利原创内容,盗版必究。【版权所有】唐霜 www.tangshuang.net?不过现在讨论这些为时尚早,先努力将技术【关注微信公众号:wwwtangshuangnet】【版权所有,侵权必究】推进至那一天再来思考不迟。

著作权归作者所有,禁止商业用途转载。转载请注明出处:www.tangshua转载请注明出处:www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】ng.net

Sora给我们的启示非常大。

【访问 www.tangshuang.n本文版权归作者所有,未经授权不得转载。【原创不易,请尊重版权】et 获取更多精彩内容】【原创不易,请尊重版权】

大家都觉得Sora出的视频真实,这种真实本文版权归作者所有,未经授权不得转载。著作权归作者所有,禁止商业用途转载。感远远大于之前的其他软件,这是为什么呢?未经授权,禁止复制转载。【关注微信公众号:wwwtangshuangnet】这是一个非常重要且严肃的问题。这可以上升【版权所有,侵权必究】著作权归作者所有,禁止商业用途转载。到更高层面的一个问题,“为什么我们感觉真未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.net实?”,比如,为什么我们有时候会说“这个原创内容,盗版必究。【关注微信公众号:wwwtangshuangnet】梦好真实”。现在我来总结答案:因为我们当【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】下的体验,符合我们的常识和经验。我们觉得未经授权,禁止复制转载。【版权所有,侵权必究】梦真实,是因为这个梦里面的场景延续了自己著作权归作者所有,禁止商业用途转载。著作权归作者所有,禁止商业用途转载。这几天的生活体验,所以符合生活经验的体验未经授权,禁止复制转载。原创内容,盗版必究。,让我们有强烈的真实感。我们看到Sora本文作者:唐霜,转载请注明出处。本文版权归作者所有,未经授权不得转载。的视频有更强真实感,是因为我们觉得它出的【转载请注明来源】本文作者:唐霜,转载请注明出处。视频,在细节上都非常符合我们的常识和经验【原创不易,请尊重版权】【版权所有】唐霜 www.tangshuang.net。当然,那些用Sora做的翻车视频,就是原创内容,盗版必究。【未经授权禁止转载】不符合我们常识和经验的反例。现在的问题,【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。就是为什么它出视频能做到按照人们的常识和【原创内容,转载请注明出处】【本文受版权保护】经验来出?

本文作者:唐霜,转载请注明出处。未经授权,禁止复制转载。【未经授权禁止转载】原创内容,盗版必究。

在Sora出现之前,市面上比较知名的文生【转载请注明来源】著作权归作者所有,禁止商业用途转载。视频应用有Pika和Runway,但是它【转载请注明来源】【本文受版权保护】们在技术层面有着天大的差别,Pika和R著作权归作者所有,禁止商业用途转载。【转载请注明来源】unway等主要是通过传统的机器学习算法【原创不易,请尊重版权】【关注微信公众号:wwwtangshuangnet】对视频帧(像素)做处理和渲染,而Sora【本文受版权保护】未经授权,禁止复制转载。则是采用ChatGPT相同的思路,通过提【版权所有】唐霜 www.tangshuang.net本文版权归作者所有,未经授权不得转载。前进行超大规模的训练来掌握真实世界中的物本文作者:唐霜,转载请注明出处。本文版权归作者所有,未经授权不得转载。理表现,然后再通过提示词来预测和复现。

【原创不易,请尊重版权】【原创不易,请尊重版权】【原创不易,请尊重版权】本文版权归作者所有,未经授权不得转载。

打个比方,我们以前开发游戏,需要准备很多【版权所有,侵权必究】【本文首发于唐霜的博客】素材,然后对素材进行操作,而现在开发游戏【原创内容,转载请注明出处】【版权所有,侵权必究】则主要依赖于一个物理引擎,基于物理引擎的本文作者:唐霜,转载请注明出处。原创内容,盗版必究。游戏对比基于素材的无论是感观上还是体验上【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。都要高一个维度。而Sora就是那个基于物【关注微信公众号:wwwtangshuangnet】【转载请注明来源】理引擎的,它的物理引擎,就是通过对大量的【转载请注明来源】【版权所有】唐霜 www.tangshuang.net现实世界的视频的训练和学习,而建立的“世转载请注明出处:www.tangshuang.net著作权归作者所有,禁止商业用途转载。界引擎”,当我们输入提示词时,它就在这个【版权所有】唐霜 www.tangshuang.net著作权归作者所有,禁止商业用途转载。引擎上创建一个视频出来。

【未经授权禁止转载】【作者:唐霜】

Sora还有两个特征,一个是可以做到60著作权归作者所有,禁止商业用途转载。【访问 www.tangshuang.net 获取更多精彩内容】s的视频,二是可以在保持主角色不变的高度未经授权,禁止复制转载。本文版权归作者所有,未经授权不得转载。一致性的同时,还生成多个不同角度的分镜。未经授权,禁止复制转载。【访问 www.tangshuang.net 获取更多精彩内容】在这两点之下,它的视频还很丝滑,像素高(未经授权,禁止复制转载。【未经授权禁止转载】据称能到4K),有大片感(据称其底层依赖本文版权归作者所有,未经授权不得转载。【版权所有】唐霜 www.tangshuang.net虚幻5引擎来生成视频)。而且Sora还可转载请注明出处:www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】以提供一个视频,对其细节修改的能力,这使【访问 www.tangshuang.net 获取更多精彩内容】【本文受版权保护】得很多博主基于一些有趣的视频,创造出更有本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。趣的东西。

【版权所有】唐霜 www.tangshu【转载请注明来源】【作者:唐霜】ang.net【版权所有,侵权必究】【本文首发于唐霜的博客】

关于Sora的技术解析,它是怎么训练的,【原创内容,转载请注明出处】原创内容,盗版必究。怎么预测的,我在B站上发现了一个视频,讲本文版权归作者所有,未经授权不得转载。未经授权,禁止复制转载。的深入浅出,你可以通过这个视频来了解(https://www.bilibili【本文首发于唐霜的博客】原创内容,盗版必究。.com/video/BV1RH4y1j【版权所有】唐霜 www.tangshuang.net【转载请注明来源】74b/)。

【关注微信公众号:wwwtangshua【未经授权禁止转载】本文版权归作者所有,未经授权不得转载。ngnet】【转载请注明来源】

站在2024年的今天,我们不得不承认AG【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】I会对很多行业带来颠覆。Sora对电影特本文作者:唐霜,转载请注明出处。原创内容,盗版必究。效、短视频制作等等的冲击,可想而知。

著作权归作者所有,禁止商业用途转载。本文版权归作者所有,未经授权不得转载。原创内容,盗版必究。【原创不易,请尊重版权】

我在之前的节目里面曾提到一个想法,就是基本文作者:唐霜,转载请注明出处。本文作者:唐霜,转载请注明出处。于GPT来做电影和游戏开发,当时我的想法【版权所有】唐霜 www.tangshuang.net【转载请注明来源】思路是和Pika之类的路线是一样的,想通【本文受版权保护】【本文首发于唐霜的博客】过图片的补间的方式来实现连续动画和持续生【转载请注明来源】【转载请注明来源】成,但这种思路不可能带来优秀的体验。而S【版权所有,侵权必究】【未经授权禁止转载】ora让我看到了另外一种可能。就目前来说【原创内容,转载请注明出处】【原创内容,转载请注明出处】,基于Sora和其他智能工具配合,制作出【版权所有,侵权必究】【原创内容,转载请注明出处】3-5分钟的视频毫无悬念,而Sora还具未经授权,禁止复制转载。未经授权,禁止复制转载。备续写的能力,只需要我们在相同语言上下文【版权所有】唐霜 www.tangshuang.net【作者:唐霜】中给出新的提示词即可。要知道ChatGP转载请注明出处:www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】T已经支持模型的记忆能力。由此可见,互动著作权归作者所有,禁止商业用途转载。【版权所有,侵权必究】式的视频生成越来越近。

原创内容,盗版必究。【未经授权禁止转载】

今天,我在网上看到另外一种想法,现在苹果【本文受版权保护】著作权归作者所有,禁止商业用途转载。的Vision  Pro已经发售,假以时【本文首发于唐霜的博客】【版权所有】唐霜 www.tangshuang.net日,在Vision Pro这样的设备上,本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.net实现持续性的沉浸式交互式视频生成,由用户著作权归作者所有,禁止商业用途转载。本文版权归作者所有,未经授权不得转载。自己来创造自己想看的内容,而非由第三方机本文作者:唐霜,转载请注明出处。【版权所有,侵权必究】构来推荐内容,成为了可能。前段时间爆火的转载请注明出处:www.tangshuang.net本文作者:唐霜,转载请注明出处。《糟糕!我被美女包围了》视频互动游戏,其【本文受版权保护】原创内容,盗版必究。制作成本、剧情量、交互的选择数都是有限的著作权归作者所有,禁止商业用途转载。【访问 www.tangshuang.net 获取更多精彩内容】,而有了我上述的大胆想法之后,这样的游戏【未经授权禁止转载】原创内容,盗版必究。将变得轻而易举,且无限可能。届时,我我们【访问 www.tangshuang.net 获取更多精彩内容】【版权所有,侵权必究】可能分不清,这到底是游戏,还是电影。

转载请注明出处:www.tangshua【本文受版权保护】【本文受版权保护】ng.net【关注微信公众号:wwwtangshua【关注微信公众号:wwwtangshuangnet】【原创内容,转载请注明出处】ngnet】

类似《头号玩家》《黑客帝国》《Her》这【本文受版权保护】【本文受版权保护】样的电影中的场景,现在来看,似乎也未尝不【未经授权禁止转载】未经授权,禁止复制转载。能达到。

【版权所有,侵权必究】本文作者:唐霜,转载请注明出处。【原创不易,请尊重版权】【本文受版权保护】

最后,我们来总结一下。Sora的发布,预【转载请注明来源】著作权归作者所有,禁止商业用途转载。示着AGI发展进程已经进入理解世界运行规【版权所有】唐霜 www.tangshuang.net【作者:唐霜】律的阶段,并尝试构建世界模型。这将颠覆我未经授权,禁止复制转载。未经授权,禁止复制转载。们以前很多需要基于计算机技术才能做到的事【转载请注明来源】原创内容,盗版必究。,这对有关行业的颠覆无疑是巨大的,虽然A【版权所有,侵权必究】【作者:唐霜】GI的发展初衷是为了把工作交给计算机,把本文版权归作者所有,未经授权不得转载。【原创内容,转载请注明出处】人作为劳动力解放出来,但实际中我们还是需【本文首发于唐霜的博客】【作者:唐霜】要有危机感,个人要实时更新自己的行业技能【版权所有】唐霜 www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】,转换工作范式,以应对科技革命中的巨大变原创内容,盗版必究。【转载请注明来源】化。

【版权所有,侵权必究】原创内容,盗版必究。本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshu本文作者:唐霜,转载请注明出处。转载请注明出处:www.tangshuang.netang.net

最后再推荐1部小众电影《未来战警》,以现【作者:唐霜】转载请注明出处:www.tangshuang.net在的技术发展来看,也不是不可能。

转载请注明出处:www.tangshua【版权所有】唐霜 www.tangshuang.net著作权归作者所有,禁止商业用途转载。ng.net【原创不易,请尊重版权】本文作者:唐霜,转载请注明出处。著作权归作者所有,禁止商业用途转载。

2024-02-20 2860

为价值买单,打赏一杯咖啡

本文价值28.6RMB