目 录CONTENT

文章目录

12月10日 OpenAI正式发布文本生成视频AI工具Sora

OpenAI正式发布文本生成视频AI工具Sora

发布概况

在2月份宣布其新的文本转视频AI生成器Sora后,OpenAI终于向全球公开发布了这款产品。自2月份有限发布以来,Sora经历了一些重大变化。此前,仅有少数用户可以访问Sora,主要用于测试和安全目的。除了11月下旬的一次恶意泄露外,公众一直在等待其正式发布。

技术进展

随着OpenAI将这个新的视频生成模型"走出研究预览阶段",公司也在思考Sora的底层技术对其更广泛AI目标的意义。OpenAI解释说:"Sora作为理解和模拟现实的AI基础,是开发能与物理世界交互的模型的重要一步。"

关于Sora的底层技术,其训练方式一直很神秘。在推出Sora一个月后,公司首席技术官Mira Murati拒绝解释Sora的训练集,仅表示公司使用了"公开可用的数据"。两个月后,公司仍然不愿透露具体的训练数据来源。值得一提的是,Murati已于9月离开OpenAI。

新功能与改进

OpenAI开发了新版本的视频生成器Sora Turbo,较2月份的版本"显著更快",现已向ChatGPT Plus和Pro用户开放。其中:

  • ChatGPT Plus起价每月20美元
  • Pro版本为每月200美元

公司还提升了Sora的功能:

  • 现可创建高达1080p分辨率的视频
  • 可生成长达20秒的视频片段
  • 用户可以引入自己的素材进行扩展、重混和混合,或从文本生成全新内容

界面与工具

Sora推出了新的界面,模仿故事板的形式,允许用户在特定帧中输入AI生成的内容。类似于Adobe在10月MAX大会上发布的Premiere新Firefly工具,OpenAI正在实施可以扩展现有片段的生成式AI,填补空白或拉伸内容以满足特定需求。

局限性与安全措施

OpenAI承认,今天部署的Sora版本"仍有许多限制"。Sora"经常生成不真实的物理效果,在长时间的复杂动作处理上存在困难"。

为确保安全使用,OpenAI采取了多项措施:

  • 所有Sora生成的视频都包含C2PA元数据
  • 默认包含可见水印(Pro用户可移除)
  • 限制创建具有"特别有害形式的滥用"内容
  • 在开发深度伪造缓解工具期间,限制涉及人物的上传内容

定价与可用性

Sora现已通过新的专用网站提供服务:

ChatGPT Plus订阅(每月20美元):

  • 可创建最高720p的视频
  • 视频长度限制为5秒

Pro订阅(每月200美元):

  • 可创建1080p视频
  • 视频长度可达20秒
  • 可下载无水印视频(水印位于右下角,任何人都可以裁剪掉)

OpenAI网站上提供了许多Sora功能示例。公司希望这个早期版本的Sora能让世界各地的人们探索新的创意形式,讲述他们的故事,并推动视频叙事可能性的边界。

0

评论区