OpenAI正式发布文本生成视频AI工具Sora
发布概况
在2月份宣布其新的文本转视频AI生成器Sora后,OpenAI终于向全球公开发布了这款产品。自2月份有限发布以来,Sora经历了一些重大变化。此前,仅有少数用户可以访问Sora,主要用于测试和安全目的。除了11月下旬的一次恶意泄露外,公众一直在等待其正式发布。
技术进展
随着OpenAI将这个新的视频生成模型"走出研究预览阶段",公司也在思考Sora的底层技术对其更广泛AI目标的意义。OpenAI解释说:"Sora作为理解和模拟现实的AI基础,是开发能与物理世界交互的模型的重要一步。"
关于Sora的底层技术,其训练方式一直很神秘。在推出Sora一个月后,公司首席技术官Mira Murati拒绝解释Sora的训练集,仅表示公司使用了"公开可用的数据"。两个月后,公司仍然不愿透露具体的训练数据来源。值得一提的是,Murati已于9月离开OpenAI。
新功能与改进
OpenAI开发了新版本的视频生成器Sora Turbo,较2月份的版本"显著更快",现已向ChatGPT Plus和Pro用户开放。其中:
- ChatGPT Plus起价每月20美元
- Pro版本为每月200美元
公司还提升了Sora的功能:
- 现可创建高达1080p分辨率的视频
- 可生成长达20秒的视频片段
- 用户可以引入自己的素材进行扩展、重混和混合,或从文本生成全新内容
界面与工具
Sora推出了新的界面,模仿故事板的形式,允许用户在特定帧中输入AI生成的内容。类似于Adobe在10月MAX大会上发布的Premiere新Firefly工具,OpenAI正在实施可以扩展现有片段的生成式AI,填补空白或拉伸内容以满足特定需求。
局限性与安全措施
OpenAI承认,今天部署的Sora版本"仍有许多限制"。Sora"经常生成不真实的物理效果,在长时间的复杂动作处理上存在困难"。
为确保安全使用,OpenAI采取了多项措施:
- 所有Sora生成的视频都包含C2PA元数据
- 默认包含可见水印(Pro用户可移除)
- 限制创建具有"特别有害形式的滥用"内容
- 在开发深度伪造缓解工具期间,限制涉及人物的上传内容
定价与可用性
Sora现已通过新的专用网站提供服务:
ChatGPT Plus订阅(每月20美元):
- 可创建最高720p的视频
- 视频长度限制为5秒
Pro订阅(每月200美元):
- 可创建1080p视频
- 视频长度可达20秒
- 可下载无水印视频(水印位于右下角,任何人都可以裁剪掉)
OpenAI网站上提供了许多Sora功能示例。公司希望这个早期版本的Sora能让世界各地的人们探索新的创意形式,讲述他们的故事,并推动视频叙事可能性的边界。
评论区