全球开发者目光再次聚焦中国!在备受瞩目的全球开发者大会(GDC)上,阿里云魔搭社区重磅宣布,首发上线阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型 Step-Video-T2V,以及业界首款产品级开源语音交互模型 Step-Audio。 这一消息瞬间引爆全球AI开源社区,再次彰显中国在人工智能领域的强劲创新实力。
作为中国最大的AI模型社区,阿里云魔搭社区此次发布的这两款重磅模型,无疑是近期全球多模态领域最受瞩目的开源成果。 Step-Video-T2V 以其巨大的参数规模,一举刷新了开源视频生成模型的记录,预示着更高质量、更精细化的视频内容创作即将成为现实。 而 Step-Audio 则突破了传统语音模型的局限,成为业界首个产品级开源语音交互系统,意味着更自然、更智能的语音交互技术将加速普及应用。
图源备注:图片由AI生成,图片授权服务商Midjourney
据官方介绍,截至目前,阿里云魔搭社区已汇聚超过4万个开源模型,全面覆盖了包括大语言模型(LLM)、对话系统、语音技术、文生图、图生视频等多个前沿领域, 稳坐中国最大AI模型社区的头把交椅。 此次选择在魔搭社区开源这两款极具分量的模型,不仅是对魔搭社区平台实力的肯定,也体现了阶跃星辰对开源生态建设的积极贡献。
在GDC这一全球开发者瞩目的舞台上发布如此重要的开源成果,无疑向世界展示了中国AI技术的蓬勃发展态势和开放合作姿态。 这两款模型的开源,将极大地降低AI技术的使用门槛,加速全球人工智能技术的普及和发展。