信息差

字节跳动豆包视频生成模型全新上线支持多镜头视频一致性创作

火山引擎科技有限公司在2024年AI创新巡展上宣布推出豆包·视频生成模型，这是其大模型家族的新成员。火山引擎总裁谭待表示，豆包·视频生成模型在视频生成方面具有多项先进性能，包括精准的语义理解、多动作多主体交互、强大的动态效果和一致性多镜头生成能力。

该模型能够理解和遵从复杂的指令，实现多个主体间的交互，并能够在视频主体的大动态和镜头间进行炫酷切换。此外，它还能够在多镜头切换中保持一致性，10秒内讲述一个完整的故事，并支持多种风格和比例，如黑白、3D动画、国画等。

豆包·视频生成模型的推出，预计将为电商营销、动画教育、城市文旅、微剧本（音乐MV、微电影、短剧等）等多个领域带来创新和效率提升。火山引擎表示，该模型的发布将全面加速AIGC应用创新。

火山引擎承诺，将继续推进模型能力的升级和迭代，探索模型能力在更多场合的应用，并为企业实现云上智能化提供动力。

数据显示，截至到9月，豆包大模型的日均 tokens 使用量已经超过1.3万亿，4个月的时间里 tokens 整体增长超过了10倍。在多模态方面，豆包·文生图模型日均生成图片5，000万张，此外，豆包目前日均处理语音85万小时。

如果觉得文章对你有用，请随意赞赏

快讯

字节跳动豆包视频生成模型全新上线支持多镜头视频一致性创作

破晓

2024-09-24

2024-09-24

CC BY 4.0

字节跳动豆包视频生成模型全新上线 支持多镜头视频一致性创作