在2024年火山引擎AI创新巡展上,火山引擎总裁谭待揭晓了最新的豆包·视频生成模型。
该模型具备多项先进技术,包括高效的DIT融合计算单元,这一单元能够实现视频和文本的深度压缩编码;同时,它采用了一种全新的扩散模型训练方式,确保了在生成多镜头视频时的一致性;此外,模型还整合了深度优化的Transformer结构,显著增强了视频生成的泛化能力。
谭待在发布活动中强调,豆包视频生成大模型能够支持多风格和多比例的一致性多镜头生成,适用于电商营销、动画教育、城市文旅和微剧本制作等多个领域。
在2024年火山引擎AI创新巡展上,火山引擎总裁谭待揭晓了最新的豆包·视频生成模型。
该模型具备多项先进技术,包括高效的DIT融合计算单元,这一单元能够实现视频和文本的深度压缩编码;同时,它采用了一种全新的扩散模型训练方式,确保了在生成多镜头视频时的一致性;此外,模型还整合了深度优化的Transformer结构,显著增强了视频生成的泛化能力。
谭待在发布活动中强调,豆包视频生成大模型能够支持多风格和多比例的一致性多镜头生成,适用于电商营销、动画教育、城市文旅和微剧本制作等多个领域。
字节跳动豆包视频生成模型上线 支持多镜头一致性优化
https://soraor.com/archives/ai-today_20240924151450