刷屏的Sora 2,不是“AI抖音”时刻(附邀请码)

Source

从模型到 App:Sora 2 的全新亮相

今日AI圈无人放假。

OpenAI 在预告了一段之后,正式推出新一代视频生成模型 Sora 2,而这一次的主角不再是模型本身。它首次将其以独立 iOS 应用的形式发布。

与一年前发布的第一代 Sora 相比,Sora 2 不再只是 ChatGPT Plus 里的“附加功能”,而是直接进入消费级产品赛道,成为一款带有短视频流和互动机制的 App:

Sora by OpenAI

(因为Sora当初发布后,这个名字就被很多人给占去了,所以它后面带上了By OpenAI)

这款名为 Sora 的应用目前在美国和加拿大率先上线,采用邀请制,用户可生成并分享 10 秒视频,浏览个性化推荐流,并通过点赞、评论和二次创作(Remix)与他人互动。OpenAI 把它定位为“超写实动作与声音”的创作工具,既是模型升级,也是产品形态上的彻底转身。

上手实测:

虽然是邀请码机制,但它分发的方式其实很容易让人们拿到邀请,更重要的其实还是一个制造FOMO带来营销效果的策略。也就是说,OpenAI对这个产品的投入,并没有担心token——哪怕ChatGPT都在悄悄通过“降智”来减少token使用的今天,OpenAI对这个产品以及向toC的市场冲刺的野心也体现出来。

打开app,输入邀请码后,会看到提示。

然后,是一个和今天所有短视频应用界面一样的首页。

抄袭(划掉)致敬TikTok们的界面。

当你想制作视频,点击“+”号,开始制作。

你可以选择已经有的“人物”,描述视频内容,生成他们彼此互动的视频。

也可以制作自己的虚拟形象。

然后你就可以尽情虚构你的人生了!

Cameo:把自己放进视频

Sora 2 的最大变化之一,是在生成画面时实现了同步音频。过去 AI 视频往往只负责影像,声音需要后期叠加,而现在用户可以在同一次生成里得到语音对白、环境音效和音轨,带来更完整的沉浸式体验。

OpenAI 在研究博文中强调,Sora 2 在物理一致性、动作连贯性和指令跟随上都有明显提升,并配合安全过滤机制,限制错误信息或不当内容的生成。业内分析认为,这一功能正是与 Google Veo 3 等竞品正面竞争的关键点。

如果说 Sora 2 的视频+音频一体化是“底层能力”的升级,那么 Cameo 功能则是“玩法逻辑”的变革。

在 Sora App 里,用户可以通过一次性的录入来确认身份,并上传肖像和声音的样本。只要完成了这个步骤,App 就会为你生成一个“可授权的虚拟分身”。从此,你不仅能生成一个抽象的角色,还能让视频里的主角就是“自己”:你会出现在 10 秒的短片里,唱歌、演戏、跳舞,甚至在虚拟场景里和 AI 生成的角色互动。

这种体验被 OpenAI 形容为“超写实 Cameo”,强调的是本人同意、本人形象。它的设计逻辑就是 “只生成愿意出现的人”。因此,公众人物、未经授权的第三方形象都被禁止使用,用户也可以随时撤销授权。

在 OpenAI 的官方页面中,有文字描述:用户可通过一次录制,将自己以 Cameo 形式插入模型生成的视频场景中。OpenAI 表示,这一功能在内部测试阶段就已经被团队频繁使用,能够在任意场景中重现面部、声音与动作一致性。

Prompt:萨姆·奥特曼走进火车站,让每个人都和他一起跳舞

官方展示案例:AI 拍出的“日常生活”

OpenAI 展示了几组由 Sora 2 生成的视频:

提示:花样滑冰运动员在头上放着一只会猫,完成三周跳

[triple_axel.mp4]

提示:两位穿着亮丽技术外壳的山地探险家,脸上结着冰霜,眼睛因紧迫而眯起,在雪地里轮流大声呼喊

动漫场景生成

这些案例展示了 Sora 2 不只是“生成影像”,而是第一次让 AI 视频在动作、环境和声音上趋近真实世界。

版权与合规:争议与防护并存

路透社报道称,OpenAI 对 Sora 2 的版权管理可能采用“版权所有者选择退出(opt-out)”机制。换句话说,如果权利人没有明确声明退出,其作品可能被模型用作生成数据。这一做法立刻引发好莱坞关注,迪士尼等大型内容公司已经宣布选择退出。

与此同时,Sora App 还同步上线了 家长控制功能,允许为青少年账号设置非个性化内容流、关闭私信和限制连播。这也是 OpenAI 在内容安全上的防护措施之一。

从 Sora 到 Sora 2:应用场景的转变

去年底的 Sora 1 主要服务于 ChatGPT 用户,强调“文本到视频”的突破,最长支持 20 秒片段,并在微软 Bing 里落地成工具。但它始终是工具属性更强的“创作模块”。

Sora 2 则直接转向消费级应用:一方面通过 App 降低门槛,让更多用户体验 AI 视频;另一方面通过短视频流、点赞、评论与二次创作,激发社交属性。这种“模型 + 平台”的组合,使得 AI 视频不再只是技术炫技,而是进入日常内容生态。

不是“AI抖音”,而是musical.ly时刻

OpenAI带来的明星效应,继续让这个产品被广泛关注。哪怕在此之前已经有大量同样设计的产品,甚至玩法更花样的产品。但人们依然选择第一时间称呼这个产品为“AI版抖音”。

然而当人们称 Sora 2 是“AI 抖音”时,其实隐含了一个预设:它已经具备了大规模的用户沉浸和内容爆发的条件。但事实上,现在的 Sora 2 更接近于当年的 musical.ly——这个产品可能已经被很多人忘了,但它被收购是抖音等产品真正风靡的关键转折点。

它展示了一种新媒介的可能性,却还未真正融入到大规模的日常社交场景中。musical.ly 在 2014 年首次让人们看到短视频不只是“视频版的微博”,而是一种全新的表达语言:

配合音乐、用镜头和动作创造氛围。这种创作范式的创新才是后来抖音得以崛起的土壤。

同样,Sora 2 的意义也不在于今天就能带来爆炸性的流量或商业化,而在于它让大众第一次直观地感受到:AI 生成的视频可以像 musical.ly 的 lip sync 一样,创造出一种全新的叙事风格,意识到“视频不一定是拍摄的结果,也可以是生成的起点”。

这是一种从“拍摄”到“想象”的思路迁移,就像短视频从“记录”到“表演”的转折。

如果说抖音的关键在于建立了规模化分发和用户沉浸的基础设施,那么 musical.ly 的关键则是教育了用户:原来短视频是可以用来玩、用来表达自我、用来社交的。Sora 2 今天所扮演的,或者说今天只有OpenAI下场才会带来的,正是这种“教育角色”。它会让更广泛的人直观地玩起“AI 视频”,产生了最初的“哦,原来还能这样讲故事”的感受。

同时这也意味着另一件事:Sora2开启的商业和更多的可能性,并不一定就是OpenAI最终全部吞下,这只是起点,大家都还有机会!

至于现在,那肯定是趁着假期先玩起来吧。(评论区附上邀请码,大家可以接龙返回邀请码)