OpenAI今日全面开放了其视频生成大模型Sora 3.0的API,并推出了专为专业影视制作打造的“Sora Studio”平台。新版本攻克了AI视频生成中长期存在的“物理规律崩溃”与“人物特征不一致”两大痛点,首次支持生成长达20分钟、包含复杂多机位切换且角色面部及服装保持绝对一致的高分辨率(4K 60帧)视频片段。
Sora 3.0不再仅仅是一个视频生成器,它实际上构建了一个包含三维空间、光学规律与时间连续性的“世界模拟器”。通过引入多模态时空注意力机制,Sora 3.0可以在剧本输入的初始阶段,在潜空间(Latent Space)中为每个角色和场景生成固定的三维锚点。这意味着导演可以用自然语言发出类似“将机位切至女主过肩镜头,保持背景雨滴下落速度不变”的指令,模型能够精准执行而不改变人物长相或背景细节。

