OpenAI最新的视频生成工具Sora在二月份的发布会上,以其流畅、逼真的视频效果让AI领域一片哗然,其技术显然领先于竞争对手好几个身位。

然而,精心策划的首秀背后,隐藏着许多未被透露的细节。这些细节随后由一位早期获得试用机会的电影制作者填补。

多伦多的数字制作团队Shy Kids被OpenAI选中,负责制作短片,这些短片基本上是为了OpenAI的宣传目的,但制作团队在创作《气球头》时拥有了相当大的创意自由。

后期制作艺术家Patrick Cederberg分享了他“真实使用Sora”的经历。

对大多数人来说,最重要的一点是:尽管OpenAI的介绍让人感觉这些短片几乎是Sora自动生成的,但实际上这些都是专业的制作,包括详尽的分镜头脚本、剪辑、调色以及后期的转场和视觉特效工作。就像Apple宣称“拍摄于iPhone”,但并未展示背后的工作室设置、专业灯光和色彩处理一样,Sora的介绍也仅仅聚焦于它的功能,而非具体的制作过程。

297b772a-7f79-4ab8-92e1-cf071a958ab3.gif

Cederberg在采访中透露了一些关于使用Sora的有趣细节。虽然Sora的表现令人印象深刻,但它似乎并没有我们想象中的那样革命性。

控制细节依旧是最受欢迎但也最难以掌握的部分。我们只能尽量在提示词中进行详尽的描述,比如解释角色的服装以及气球的具体类型,这是我们为了保持连贯性所采取的方法。因为从一镜到下一镜、从一个生成到下一个生成,系统还没有一个完整的功能集来保证完全的一致性。

换句话说,在传统的电影制作中很简单的事情,比如选择角色衣服的颜色,在生成系统中需要复杂的规避策略和检查,因为每一镜都是独立创建的。这当然可能会改变,但目前来看还是相当繁复的。

使用Sora时还需要注意避免不希望出现的元素:Cederberg描述说,模型会经常在主角的气球头上生成一个脸,或者在前面挂一个绳子。如果无法通过提示排除这些元素,那么这些都需要在后期进行删除,这又是一个耗时的过程。

精确的角色动作或摄像机移动几乎是不可能的:“在生成过程中,这些不同动作发生的位置有一点时间上的控制,但并不精确……这更像是摸黑中的尝试,”Cederberg说。

例如,像挥手这样的动作,只能大致按照建议进行时间安排,而像向上平移摄像机这样的镜头可能根本无法反映出电影制作者的意图——因此在这种情况下,团队渲染了一个纵向的镜头并在后期进行裁剪。生成的片段也经常以不明原因显示为慢动作。

事实上,使用电影制作中的常见语言,如“向右平移”或“追踪镜头”在使用中通常都是不一致的,Cederberg表示,这让团队感到相当意外。

“研究人员在邀请艺术家使用这个工具之前,似乎并没有真正以电影制作人的思维来考虑,”他说。

结果,团队进行了数百次的生成,每次10到20秒,最终只使用了其中的一小部分。Cederberg估计使用比例大约是300:1 —— 当然,如果是在普通拍摄中,我们可能都会对这个比例感到惊讶。

关于版权的最后一个有趣问题是:如果你让Sora生成一个“星球大战”剪辑,它会拒绝。如果你试图用“穿着长袍、手持激光剑在未来派飞船上”的描述来绕过,它也会拒绝,因为通过某种机制它能识别出你的企图。

一方面,这完全说得通。但这也引出了一个问题:如果Sora知道这些是什么,那是否意味着模型是在这些内容上训练的,以更好地识别这些属于侵权的内容?OpenAI一直对其训练数据守口如瓶,甚至永远都不可能透露。

至于Sora在电影制作中的应用,它显然是一个强大且有用的工具,但它的位置并不是“完全自主创作电影”。