第048期:Sora的出现,加速了AGI进程,疯狂的想法喷涌而出

广告位招租
扫码页面底部二维码联系

OpenAI在我们中国春节期间发布了新产【原创不易,请尊重版权】【本文首发于唐霜的博客】品——Sora,它将是比ChatGPT更著作权归作者所有,禁止商业用途转载。【关注微信公众号:wwwtangshuangnet】颠覆的产品,ChatGPT的主要能力是理【转载请注明来源】【未经授权禁止转载】解通用自然语言和常识,并做出文本的预测,未经授权,禁止复制转载。【本文首发于唐霜的博客】而Sora的能力是理解这个世界的运行规律【本文受版权保护】本文版权归作者所有,未经授权不得转载。,并以视频的形式完成预测,“理解世界的运【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。行规律”和“理解自然语言”比起来,级别一著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshuang.net下子上升了很多,所以我说它将是比Chat原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。GPT更颠覆的产品。本期将深入聊一聊我对著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。Sora这款产品的看法。

【原创不易,请尊重版权】本文版权归作者所有,未经授权不得转载。【访问 www.tangshuang.n转载请注明出处:www.tangshuang.net【版权所有】唐霜 www.tangshuang.netet 获取更多精彩内容】本文版权归作者所有,未经授权不得转载。

著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】未经授权,禁止复制转载。本文版权归作者所有,未经授权不得转载。

在线收听

喜马拉雅:点击播放

本文作者:唐霜,转载请注明出处。【访问 www.tangshuang.n【版权所有】唐霜 www.tangshuang.net【转载请注明来源】et 获取更多精彩内容】

你还可以在苹果自带的 Podcast 应著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshuang.net用、小宇宙APP、QQ音乐中搜“Robu转载请注明出处:www.tangshuang.net【访问 www.tangshuang.net 获取更多精彩内容】st”找到我们的节目收听。

【原创内容,转载请注明出处】【关注微信公众号:wwwtangshua本文版权归作者所有,未经授权不得转载。本文版权归作者所有,未经授权不得转载。ngnet】【本文受版权保护】

捐赠支持

求打赏🙇如果你觉得 Ro著作权归作者所有,禁止商业用途转载。【原创不易,请尊重版权】bust 这样一档技术类的谈话节目还不错【原创不易,请尊重版权】本文作者:唐霜,转载请注明出处。,希望我继续做下去,不妨打赏支持。

【原创不易,请尊重版权】【本文首发于唐霜的博客】【版权所有】唐霜 www.tangshu【版权所有,侵权必究】未经授权,禁止复制转载。ang.net【原创内容,转载请注明出处】

【作者:唐霜】本文作者:唐霜,转载请注明出处。

内容摘要

OpenAI在我们中国春节期间发布了新产【未经授权禁止转载】本文版权归作者所有,未经授权不得转载。品——Sora,它将是比ChatGPT更【未经授权禁止转载】著作权归作者所有,禁止商业用途转载。颠覆的产品,ChatGPT的主要能力是理【原创内容,转载请注明出处】本文作者:唐霜,转载请注明出处。解通用自然语言和常识,并做出文本的预测,【版权所有】唐霜 www.tangshuang.net【本文首发于唐霜的博客】而Sora的能力是理解这个世界的运行规律【作者:唐霜】【关注微信公众号:wwwtangshuangnet】,并以视频的形式完成预测,“理解世界的运【转载请注明来源】【作者:唐霜】行规律”和“理解自然语言”比起来,级别一未经授权,禁止复制转载。【原创不易,请尊重版权】下子上升了很多,所以我说它将是比Chat本文作者:唐霜,转载请注明出处。著作权归作者所有,禁止商业用途转载。GPT更颠覆的产品。

【本文首发于唐霜的博客】【未经授权禁止转载】著作权归作者所有,禁止商业用途转载。

如果人工智能能够理解这个世界的运行规律,未经授权,禁止复制转载。【作者:唐霜】那么也就可以建立现在业界提出的概念“世界本文作者:唐霜,转载请注明出处。著作权归作者所有,禁止商业用途转载。模型”,一旦世界模型得以建立,我们就可以【关注微信公众号:wwwtangshuangnet】【原创不易,请尊重版权】再建一个平行世界。这样的想法很是疯狂,不原创内容,盗版必究。【版权所有】唐霜 www.tangshuang.net过疯狂的想法不止于此。

未经授权,禁止复制转载。【关注微信公众号:wwwtangshua【作者:唐霜】【本文首发于唐霜的博客】ngnet】【转载请注明来源】未经授权,禁止复制转载。

AGI(通用人工智能)作为新工业革命标志【本文受版权保护】著作权归作者所有,禁止商业用途转载。,几乎已经形成了共识。未来我们的生产、消【本文受版权保护】【未经授权禁止转载】费、娱乐、科学等等,都可能依赖AGI,或著作权归作者所有,禁止商业用途转载。原创内容,盗版必究。者以它为工具,或者用AGI创造新智能,甚【转载请注明来源】转载请注明出处:www.tangshuang.net至寄生于中。当然,这里面有很多社会学、人【版权所有】唐霜 www.tangshuang.net本文版权归作者所有,未经授权不得转载。类文化学的问题要研究,例如一个最关键的问【原创不易,请尊重版权】原创内容,盗版必究。题是,穷人在这个时代如何被赋予公平的权利著作权归作者所有,禁止商业用途转载。【转载请注明来源】?不过现在讨论这些为时尚早,先努力将技术原创内容,盗版必究。本文版权归作者所有,未经授权不得转载。推进至那一天再来思考不迟。

未经授权,禁止复制转载。【版权所有,侵权必究】未经授权,禁止复制转载。【原创内容,转载请注明出处】

Sora给我们的启示非常大。

本文作者:唐霜,转载请注明出处。【访问 www.tangshuang.n【作者:唐霜】本文作者:唐霜,转载请注明出处。et 获取更多精彩内容】本文作者:唐霜,转载请注明出处。【关注微信公众号:wwwtangshua【访问 www.tangshuang.net 获取更多精彩内容】【本文首发于唐霜的博客】ngnet】

大家都觉得Sora出的视频真实,这种真实【版权所有】唐霜 www.tangshuang.net【原创不易,请尊重版权】感远远大于之前的其他软件,这是为什么呢?【原创不易,请尊重版权】本文版权归作者所有,未经授权不得转载。这是一个非常重要且严肃的问题。这可以上升【版权所有】唐霜 www.tangshuang.net本文版权归作者所有,未经授权不得转载。到更高层面的一个问题,“为什么我们感觉真未经授权,禁止复制转载。【访问 www.tangshuang.net 获取更多精彩内容】实?”,比如,为什么我们有时候会说“这个未经授权,禁止复制转载。【本文受版权保护】梦好真实”。现在我来总结答案:因为我们当【关注微信公众号:wwwtangshuangnet】原创内容,盗版必究。下的体验,符合我们的常识和经验。我们觉得【关注微信公众号:wwwtangshuangnet】【访问 www.tangshuang.net 获取更多精彩内容】梦真实,是因为这个梦里面的场景延续了自己【作者:唐霜】【原创内容,转载请注明出处】这几天的生活体验,所以符合生活经验的体验著作权归作者所有,禁止商业用途转载。本文作者:唐霜,转载请注明出处。,让我们有强烈的真实感。我们看到Sora【未经授权禁止转载】【转载请注明来源】的视频有更强真实感,是因为我们觉得它出的转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】视频,在细节上都非常符合我们的常识和经验【原创不易,请尊重版权】【作者:唐霜】。当然,那些用Sora做的翻车视频,就是本文版权归作者所有,未经授权不得转载。本文版权归作者所有,未经授权不得转载。不符合我们常识和经验的反例。现在的问题,【访问 www.tangshuang.net 获取更多精彩内容】【本文受版权保护】就是为什么它出视频能做到按照人们的常识和未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.net经验来出?

【版权所有】唐霜 www.tangshu原创内容,盗版必究。【原创不易,请尊重版权】ang.net【原创不易,请尊重版权】未经授权,禁止复制转载。【访问 www.tangshuang.n【未经授权禁止转载】【本文首发于唐霜的博客】et 获取更多精彩内容】

在Sora出现之前,市面上比较知名的文生【作者:唐霜】【关注微信公众号:wwwtangshuangnet】视频应用有Pika和Runway,但是它【本文首发于唐霜的博客】本文作者:唐霜,转载请注明出处。们在技术层面有着天大的差别,Pika和R本文作者:唐霜,转载请注明出处。【版权所有】唐霜 www.tangshuang.netunway等主要是通过传统的机器学习算法【本文首发于唐霜的博客】未经授权,禁止复制转载。对视频帧(像素)做处理和渲染,而Sora原创内容,盗版必究。原创内容,盗版必究。则是采用ChatGPT相同的思路,通过提【版权所有】唐霜 www.tangshuang.net【转载请注明来源】前进行超大规模的训练来掌握真实世界中的物转载请注明出处:www.tangshuang.net本文版权归作者所有,未经授权不得转载。理表现,然后再通过提示词来预测和复现。

本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】本文作者:唐霜,转载请注明出处。

打个比方,我们以前开发游戏,需要准备很多转载请注明出处:www.tangshuang.net著作权归作者所有,禁止商业用途转载。素材,然后对素材进行操作,而现在开发游戏本文版权归作者所有,未经授权不得转载。【版权所有,侵权必究】则主要依赖于一个物理引擎,基于物理引擎的【原创内容,转载请注明出处】著作权归作者所有,禁止商业用途转载。游戏对比基于素材的无论是感观上还是体验上未经授权,禁止复制转载。【版权所有,侵权必究】都要高一个维度。而Sora就是那个基于物【本文受版权保护】【版权所有,侵权必究】理引擎的,它的物理引擎,就是通过对大量的原创内容,盗版必究。【版权所有,侵权必究】现实世界的视频的训练和学习,而建立的“世【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】界引擎”,当我们输入提示词时,它就在这个【作者:唐霜】【转载请注明来源】引擎上创建一个视频出来。

著作权归作者所有,禁止商业用途转载。【关注微信公众号:wwwtangshua【本文首发于唐霜的博客】【关注微信公众号:wwwtangshuangnet】ngnet】

Sora还有两个特征,一个是可以做到60未经授权,禁止复制转载。【转载请注明来源】s的视频,二是可以在保持主角色不变的高度【转载请注明来源】著作权归作者所有,禁止商业用途转载。一致性的同时,还生成多个不同角度的分镜。【作者:唐霜】著作权归作者所有,禁止商业用途转载。在这两点之下,它的视频还很丝滑,像素高(【本文受版权保护】【版权所有,侵权必究】据称能到4K),有大片感(据称其底层依赖本文作者:唐霜,转载请注明出处。本文版权归作者所有,未经授权不得转载。虚幻5引擎来生成视频)。而且Sora还可转载请注明出处:www.tangshuang.net【关注微信公众号:wwwtangshuangnet】以提供一个视频,对其细节修改的能力,这使【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。得很多博主基于一些有趣的视频,创造出更有【本文首发于唐霜的博客】【原创不易,请尊重版权】趣的东西。

著作权归作者所有,禁止商业用途转载。【版权所有】唐霜 www.tangshu【原创不易,请尊重版权】【原创不易,请尊重版权】ang.net原创内容,盗版必究。【本文首发于唐霜的博客】

关于Sora的技术解析,它是怎么训练的,原创内容,盗版必究。著作权归作者所有,禁止商业用途转载。怎么预测的,我在B站上发现了一个视频,讲【未经授权禁止转载】【作者:唐霜】的深入浅出,你可以通过这个视频来了解(https://www.bilibili转载请注明出处:www.tangshuang.net【作者:唐霜】.com/video/BV1RH4y1j原创内容,盗版必究。【原创内容,转载请注明出处】74b/)。

【版权所有,侵权必究】【本文受版权保护】

站在2024年的今天,我们不得不承认AG【版权所有】唐霜 www.tangshuang.net【原创内容,转载请注明出处】I会对很多行业带来颠覆。Sora对电影特【本文首发于唐霜的博客】未经授权,禁止复制转载。效、短视频制作等等的冲击,可想而知。

本文作者:唐霜,转载请注明出处。转载请注明出处:www.tangshua【未经授权禁止转载】【原创内容,转载请注明出处】ng.net

我在之前的节目里面曾提到一个想法,就是基【原创内容,转载请注明出处】原创内容,盗版必究。于GPT来做电影和游戏开发,当时我的想法【本文首发于唐霜的博客】原创内容,盗版必究。思路是和Pika之类的路线是一样的,想通【版权所有】唐霜 www.tangshuang.net【原创不易,请尊重版权】过图片的补间的方式来实现连续动画和持续生本文作者:唐霜,转载请注明出处。原创内容,盗版必究。成,但这种思路不可能带来优秀的体验。而S【版权所有】唐霜 www.tangshuang.net【本文受版权保护】ora让我看到了另外一种可能。就目前来说【作者:唐霜】原创内容,盗版必究。,基于Sora和其他智能工具配合,制作出转载请注明出处:www.tangshuang.net【未经授权禁止转载】3-5分钟的视频毫无悬念,而Sora还具【原创内容,转载请注明出处】未经授权,禁止复制转载。备续写的能力,只需要我们在相同语言上下文【原创不易,请尊重版权】【本文受版权保护】中给出新的提示词即可。要知道ChatGP转载请注明出处:www.tangshuang.net著作权归作者所有,禁止商业用途转载。T已经支持模型的记忆能力。由此可见,互动【访问 www.tangshuang.net 获取更多精彩内容】【原创不易,请尊重版权】式的视频生成越来越近。

【转载请注明来源】【本文受版权保护】【版权所有】唐霜 www.tangshu未经授权,禁止复制转载。【本文受版权保护】ang.net【版权所有】唐霜 www.tangshu本文作者:唐霜,转载请注明出处。转载请注明出处:www.tangshuang.netang.net

今天,我在网上看到另外一种想法,现在苹果【本文首发于唐霜的博客】【原创不易,请尊重版权】的Vision  Pro已经发售,假以时未经授权,禁止复制转载。本文作者:唐霜,转载请注明出处。日,在Vision Pro这样的设备上,【版权所有】唐霜 www.tangshuang.net本文版权归作者所有,未经授权不得转载。实现持续性的沉浸式交互式视频生成,由用户原创内容,盗版必究。未经授权,禁止复制转载。自己来创造自己想看的内容,而非由第三方机【未经授权禁止转载】本文作者:唐霜,转载请注明出处。构来推荐内容,成为了可能。前段时间爆火的【转载请注明来源】【访问 www.tangshuang.net 获取更多精彩内容】《糟糕!我被美女包围了》视频互动游戏,其【转载请注明来源】【原创不易,请尊重版权】制作成本、剧情量、交互的选择数都是有限的【访问 www.tangshuang.net 获取更多精彩内容】本文版权归作者所有,未经授权不得转载。,而有了我上述的大胆想法之后,这样的游戏未经授权,禁止复制转载。【版权所有】唐霜 www.tangshuang.net将变得轻而易举,且无限可能。届时,我我们【本文受版权保护】【本文受版权保护】可能分不清,这到底是游戏,还是电影。

本文作者:唐霜,转载请注明出处。【原创内容,转载请注明出处】【本文受版权保护】【本文受版权保护】

类似《头号玩家》《黑客帝国》《Her》这【转载请注明来源】【关注微信公众号:wwwtangshuangnet】样的电影中的场景,现在来看,似乎也未尝不【原创内容,转载请注明出处】著作权归作者所有,禁止商业用途转载。能达到。

本文作者:唐霜,转载请注明出处。【访问 www.tangshuang.n【原创不易,请尊重版权】【转载请注明来源】et 获取更多精彩内容】著作权归作者所有,禁止商业用途转载。

最后,我们来总结一下。Sora的发布,预【转载请注明来源】【未经授权禁止转载】示着AGI发展进程已经进入理解世界运行规【版权所有,侵权必究】本文作者:唐霜,转载请注明出处。律的阶段,并尝试构建世界模型。这将颠覆我著作权归作者所有,禁止商业用途转载。原创内容,盗版必究。们以前很多需要基于计算机技术才能做到的事【关注微信公众号:wwwtangshuangnet】【作者:唐霜】,这对有关行业的颠覆无疑是巨大的,虽然A【未经授权禁止转载】著作权归作者所有,禁止商业用途转载。GI的发展初衷是为了把工作交给计算机,把【版权所有】唐霜 www.tangshuang.net原创内容,盗版必究。人作为劳动力解放出来,但实际中我们还是需原创内容,盗版必究。【未经授权禁止转载】要有危机感,个人要实时更新自己的行业技能原创内容,盗版必究。本文作者:唐霜,转载请注明出处。,转换工作范式,以应对科技革命中的巨大变本文版权归作者所有,未经授权不得转载。【原创不易,请尊重版权】化。

【原创不易,请尊重版权】【转载请注明来源】转载请注明出处:www.tangshua【原创不易,请尊重版权】原创内容,盗版必究。ng.net

最后再推荐1部小众电影《未来战警》,以现【作者:唐霜】【版权所有,侵权必究】在的技术发展来看,也不是不可能。

【关注微信公众号:wwwtangshua【访问 www.tangshuang.net 获取更多精彩内容】【原创不易,请尊重版权】ngnet】【关注微信公众号:wwwtangshua本文作者:唐霜,转载请注明出处。原创内容,盗版必究。ngnet】

2024-02-20 2829

为价值买单,打赏一杯咖啡

本文价值28.29RMB