在2024年火山引擎AI创新巡展上,火山引擎总裁谭待揭晓了最新的豆包·视频生成模型。

image

该模型具备多项先进技术,包括高效的DIT融合计算单元,这一单元能够实现视频和文本的深度压缩编码;同时,它采用了一种全新的扩散模型训练方式,确保了在生成多镜头视频时的一致性;此外,模型还整合了深度优化的Transformer结构,显著增强了视频生成的泛化能力。

谭待在发布活动中强调,豆包视频生成大模型能够支持多风格和多比例的一致性多镜头生成,适用于电商营销、动画教育、城市文旅和微剧本制作等多个领域。