信息差

字节跳动豆包视频生成模型上线支持多镜头一致性优化

在2024年火山引擎AI创新巡展上，火山引擎总裁谭待揭晓了最新的豆包·视频生成模型。

该模型具备多项先进技术，包括高效的DIT融合计算单元，这一单元能够实现视频和文本的深度压缩编码;同时，它采用了一种全新的扩散模型训练方式，确保了在生成多镜头视频时的一致性;此外，模型还整合了深度优化的Transformer结构，显著增强了视频生成的泛化能力。

谭待在发布活动中强调，豆包视频生成大模型能够支持多风格和多比例的一致性多镜头生成，适用于电商营销、动画教育、城市文旅和微剧本制作等多个领域。

如果觉得文章对你有用，请随意赞赏

快讯

字节跳动豆包视频生成模型上线支持多镜头一致性优化

破晓

2024-09-24

2024-09-24

CC BY 4.0

字节跳动豆包视频生成模型上线 支持多镜头一致性优化