信息差

Open-Sora 2.0：20万美元打造的开源SOTA视频生成神器

Open-Sora 是一个 开源的视频生成 AI 框架，旨在 让所有人都能高效地创建高质量视频。
它采用 深度学习 和 文本到视频（Text-to-Video, T2V） 技术，支持：

✅ 文本生成视频（Text-to-Video）
✅ 图像生成视频（Image-to-Video）
✅ 视频转换编辑（Video-to-Video）

Open-Sora 2.0（最新版本）带来了多项优化，让它的表现可以与 OpenAI Sora 相媲美。

模型大小：11B（与 HunyuanVideo 11B 和 Step-Video 30B 竞争）
训练成本：性能提升的同时，训练成本比上一代减少 50%，全流程训练只需 $200K，相比商业 AI 解决方案便宜数百万美元
核心架构：
✅ VAE（变分自动编码器）提升视频清晰度
✅ Transformer 结构优化时序一致性
✅ 运动评分（Motion Score）提高动态表现力

如果觉得文章对你有用，请随意赞赏

快讯

Open-Sora 2.0：20万美元打造的开源SOTA视频生成神器

破晓

2025-03-13

2025-03-13

CC BY 4.0