信息差

AI速递：DeepSeek开源FlashMLA大模型加速器；海螺AI发布I2V-01-Director模型；Pixverse V4.0新增同步音效与转绘功能

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、DeepSeek开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s

DeepSeek在开源周首日推出了FlashMLA，这是一款针对英伟达Hopper架构GPU的高效多层注意力解码内核，旨在优化变长序列场景下的大模型推理性能。该技术通过全面支持BF16精度和创新的页式键值缓存系统，显著提升了内存管理的精确性。FlashMLA在性能测试中表现出色，达到了3000GB/s的处理速度和580TFLOPS的算力。

【AI摘要:】

⚙️ FlashMLA专为英伟达Hopper架构GPU设计，优化变长序列场景，提升推理性能。

💾 采用BF16精度和块大小为64的页式键值缓存系统，实现精确内存管理。

📈 在H800SXM5GPU上，FlashMLA在内存受限场景下达到3000GB/s的处理速度。

详情链接:https://github.com/deepseek-ai/FlashMLA

2、海螺AI解锁全新“导演”模式:I2V-01-Director模型向所有人开放

海螺AI最新推出的I2V-01-Director模型为全球用户提供了一个突破性的AI视频生成工具，标志着AI在影视创作领域的又一重要进展。该工具允许用户通过自然语言指令控制镜头运动，轻松将创意转化为电影般的作品。

【AI摘要:】

📽️ I2V-01-Director模型支持自然语言指令，用户可通过简单描述控制镜头运动。

🎨 该工具降低了专业视频制作的门槛，提升了创意工作者的创作自由度。

🌐 海螺AI已将该模型整合至视频创作平台，用户可立即体验。

详情链接:https://hailuoai.video/create

3、谷歌AI视频生成模型Veo2使用成本曝光:一分钟视频要30美元

谷歌最近公布了其视频生成AI模型Veo2的定价信息，引起了广泛关注。Veo2的使用费用为每秒50美分，换算下来一分钟的视频成本为30美元，每小时则高达1800美元。与漫威电影《复仇者联盟:终局之战》的32，000美元每秒制作成本相比，Veo2的定价显得相对划算。

【AI摘要:】

💰 Veo2的视频生成费用为每秒50美分，每小时成本高达1800美元。

🎬 与漫威电影《复仇者联盟:终局之战》的32，000美元每秒制作成本相比，Veo2的定价显得非常划算。

💡 OpenAI 的 Sora 模型订阅费为每月200美元，Veo2在市场上具有竞争优势。

4、Grok3上线实时语音功能，一共支持10种模式

Grok APP最近推出了实时语音模式，支持多达10种交互模式，提升了用户体验。新增的Unhinged和Sexy模式引起了广泛关注，前者以挑衅式争论为特点，后者则充满浪漫暗示。这一更新不仅丰富了对话方式，也引发了对内容审核和未成年用户影响的讨论。

【AI摘要:】

🎙️ Grok APP推出实时语音模式，支持10种交互方式，提升用户体验。

🔥 新增Unhinged和Sexy模式，前者擅长挑衅争论，后者则充满调情意味。

🔍 此次更新引发对内容审核及未成年用户影响的讨论，xAI需平衡创新与安全。

5、百度APP全面焕新:上线AI入口 DeepseekR1深度搜索不卡顿

百度App今日宣布全量上线全新的AI入口，深度整合文心大模型与DeepSeek模型，为用户提供全面升级的使用体验。新功能包括AI搜索、全网信息提炼、AI总结和数字人智能体，能够精准理解用户需求，实现个性化搜索结果。借助海量用户数据和大模型推理能力，百度App为用户呈现多模态内容推荐，提升信息获取效率。

【AI摘要:】

🔍 新增AI搜索、全网信息提炼等多项智能功能，提升用户体验。

👤 通过用户画像与行为数据分析，提供个性化的搜索结果，真正实现千人千面。

📈 升级首日使用量突破千万次，显示出用户对新功能的高度认可。

6、腾讯混元视频模型（Hunyuan Video）测试招募中，开源在望

腾讯混元视频模型（Hunyuan Video）近期在X平台上公开招募测试伙伴，标志着其AI视频生成技术进入关键测试阶段。该模型以超过13B参数量成为开源视频生成模型中的佼佼者，展现出卓越的性能，特别是在视频流畅性和多对象生成方面。

【AI摘要:】

🎯 混元视频模型是腾讯在AI视频生成领域的重要创新，参数量超过13B，具备强大的生成能力。

🛠️ 该模型在测试阶段表现出色，尤其在视频流畅性、细节还原和多对象生成方面超越现有模型。

🤝 招募测试伙伴旨在通过合作提升模型性能，参与者将为模型开源前的稳定性和实用性提供反馈。

详情链接:https://docs.google.com/forms/d/e/1FAIpQLScZe9DflcpKf_JfcgGnAiXfyhEZAt2uP4mE0Rhs5l9R2m49oA/viewform

7、月之暗面联手UCLA推新模型Mixture-of-Expert，提升语言模型训练效率

在人工智能领域，Moonshot AI与UCLA联合开发的Moonlight模型，采用Muon优化器，显著提升了大型语言模型的训练效率和稳定性。通过创新的牛顿-舒尔茨迭代法和权重衰减技术，Moonlight在多个任务上超越了传统的AdamW优化器，尤其在语言理解和代码生成方面表现优异。

【AI摘要:】

🌟 Moonlight模型是由Moonshot AI与UCLA联合开发的Mixture-of-Expert模型，提供30亿和160亿参数配置，训练使用了5.7万亿个标记。

⚙️ Muon优化器通过牛顿-舒尔茨迭代法和权重衰减技术，显著提高了大型模型训练的效率和稳定性。

📈 实证结果显示，Moonlight在多个任务上优于传统的AdamW训练模型，表现出更好的语言理解和代码生成能力。

详情链接:https://github.com/MoonshotAI/Moonlight?tab=readme-ov-file

8、1x发布家庭机器人NEO Gamma:能冲咖啡、洗衣和吸尘等

1X 公司最新推出的家居机器人 Neo Gamma 具备多项家务功能，如冲咖啡、洗衣和吸尘，同时也能为用户提供陪伴。与传统家用机器人不同，Neo Gamma 的设计更为温和亲切，易于引发情感依赖。其先进的运动控制系统和语言交互功能，使其能够自然地融入家庭生活，成为人们生活中的得力助手。

【AI摘要:】

🌟 Neo Gamma 是一款新型家居机器人，能够完成家务并为用户提供陪伴。

🤖 其设计更为亲切温和，与传统家用机器人截然不同，易于让人产生情感依赖。

🛠️ Neo Gamma 具备自然运动能力和语言交互功能，未来将与家庭生活紧密结合。

详情链接:https://www.1x.tech/neo

9、小米将推出首款AI PC产品

小米集团合伙人兼总裁卢伟冰在最近的直播中宣布，小米即将推出其首款AI PC产品，引起了科技界的广泛关注。这款新产品的最大亮点是其搭载的99Wh超大电池，不仅符合民航运输的安全标准，还能显著提升用户在移动办公时的续航能力。随着移动办公的普及，用户对电池续航的需求日益增加，而小米的这一设计正好解决了这一问题。

【AI摘要:】

🔋 新款AI PC搭载99Wh超大电池，满足民航运输安全标准，成为可登机产品。

💼 该产品旨在提升用户在移动办公时的续航能力，解决续航焦虑。

🤖 深度整合AI技术，提供更智能的操作体验，提升工作和学习的便利性。

10、阿里巴巴宣布创纪录投资:未来三年3800亿加码云与AI硬件建设

阿里巴巴集团CEO吴泳铭宣布未来三年将投入超过3800亿元人民币用于云和AI硬件基础设施建设。这一创纪录的投资不仅是中国民营企业在该领域的最大手笔，也展示了阿里在AI时代的技术野心与战略布局。

【AI摘要:】

🚀 阿里巴巴未来三年将投入3800亿元人民币用于云和AI硬件基础设施建设。

📈 国内AI产业正迎来爆发式增长，阿里巴巴的投资将加速行业智能化转型。

🌍 此次投资将提升中国在全球AI竞赛中的竞争力，助力企业在国际舞台上占据重要位置。

11、Meta AI 发布新型视频学习模型V-JEPA :视频理解新突破

Meta AI团队最新推出的V-JEPA模型在无监督视频学习领域取得了重大突破。该模型通过特征预测原则，利用视频数据直接进行学习，避免了传统方法对预训练编码器和文本监督的依赖。V-JEPA在运动理解和视频任务上表现优越，展示了其高效的训练能力和强大的表示能力，尤其在低样本设置下仍能保持准确性。

【AI摘要:】

🔍 V-JEPA模型专注于无监督特征预测，直接从视频数据中学习，避免传统方法的限制。

⚡ 该模型在视频任务和低样本学习中表现出色，展现了高效的训练能力和强大的表示能力。

📈 V-JEPA在捕捉细微运动细节方面具有优势，证明了其在视频理解中的潜力。

详情链接:https://ai.meta.com/research/publications/revisiting-feature-prediction-for-learning-visual-representations-from-video/

12、LiblibAI哩布哩布AI宣布再获数亿元融资一年内连续完成四轮融资

LiblibAI在短短一年内成功完成四轮融资，创下国内AI应用赛道融资速度的新纪录。此次融资再获数亿元资金，进一步巩固了其在行业内的领先地位。公司致力于通过AI技术改变创作者的创作方式，建立了完整的创作生态链，并在用户增长和技术研发上持续发力。

【AI摘要:】

💰 LiblibAI在一年内完成四轮融资，创下国内AI应用赛道融资速度新纪录。

🖼️ 公司的AI模型/图像创作者已突破两千万，日均创作交互数百万级。

🌐 本轮融资将重点投入创作者生态建设和技术研发，提升平台技术实力和用户体验。

13.Pixverse V4.0更新:音效与转绘功能震撼登场

Pixverse 发布了 V4.0版本，增强了底层模型，新增同步生成音效和转绘功能。用户可以通过 “Restyle” 功能将视频风格转换，且生成速度和真实感显著提升。这次更新为内容创作者提供了更丰富的创作体验，并被广泛好评。

【Soraor 提要:】

🎨 V4.0引入转绘功能，支持多种风格转换，提升创作自由度。

⚡ 视频生成速度提升至10秒，真实感和提示词遵循度显著提高。

🎶 新增同步音效功能，丰富视频内容体验，增强视听效果。

如果觉得文章对你有用，请随意赞赏

快讯

AI速递：DeepSeek开源FlashMLA大模型加速器；海螺AI发布I2V-01-Director模型；Pixverse V4.0新增同步音效与转绘功能

https://soraor.com/archives/ai-today_20250224154715

作者

破晓

发布于

2025-02-24

更新于

2025-02-24

许可协议

CC BY 4.0