欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:soraor.com
1、DeepSeek开源周首日:发布大模型加速利器FlashMLA 解码性能飙升至3000GB/s
DeepSeek在开源周首日推出了FlashMLA,这是一款针对英伟达Hopper架构GPU的高效多层注意力解码内核,旨在优化变长序列场景下的大模型推理性能。该技术通过全面支持BF16精度和创新的页式键值缓存系统,显著提升了内存管理的精确性。FlashMLA在性能测试中表现出色,达到了3000GB/s的处理速度和580TFLOPS的算力。
【AI摘要:】
⚙️ FlashMLA专为英伟达Hopper架构GPU设计,优化变长序列场景,提升推理性能。
💾 采用BF16精度和块大小为64的页式键值缓存系统,实现精确内存管理。
📈 在H800SXM5GPU上,FlashMLA在内存受限场景下达到3000GB/s的处理速度。
详情链接:https://github.com/deepseek-ai/FlashMLA
2、海螺AI解锁全新“导演”模式:I2V-01-Director模型向所有人开放
海螺AI最新推出的I2V-01-Director模型为全球用户提供了一个突破性的AI视频生成工具,标志着AI在影视创作领域的又一重要进展。该工具允许用户通过自然语言指令控制镜头运动,轻松将创意转化为电影般的作品。
【AI摘要:】
📽️ I2V-01-Director模型支持自然语言指令,用户可通过简单描述控制镜头运动。
🎨 该工具降低了专业视频制作的门槛,提升了创意工作者的创作自由度。
🌐 海螺AI已将该模型整合至视频创作平台,用户可立即体验。
详情链接:https://hailuoai.video/create
3、谷歌AI视频生成模型Veo2使用成本曝光:一分钟视频要30美元
谷歌最近公布了其视频生成AI模型Veo2的定价信息,引起了广泛关注。Veo2的使用费用为每秒50美分,换算下来一分钟的视频成本为30美元,每小时则高达1800美元。与漫威电影《复仇者联盟:终局之战》的32,000美元每秒制作成本相比,Veo2的定价显得相对划算。
【AI摘要:】
💰 Veo2的视频生成费用为每秒50美分,每小时成本高达1800美元。
🎬 与漫威电影《复仇者联盟:终局之战》的32,000美元每秒制作成本相比,Veo2的定价显得非常划算。
💡 OpenAI 的 Sora 模型订阅费为每月200美元,Veo2在市场上具有竞争优势。
4、Grok3上线实时语音功能,一共支持10种模式
Grok APP最近推出了实时语音模式,支持多达10种交互模式,提升了用户体验。新增的Unhinged和Sexy模式引起了广泛关注,前者以挑衅式争论为特点,后者则充满浪漫暗示。这一更新不仅丰富了对话方式,也引发了对内容审核和未成年用户影响的讨论。
【AI摘要:】
🎙️ Grok APP推出实时语音模式,支持10种交互方式,提升用户体验。
🔥 新增Unhinged和Sexy模式,前者擅长挑衅争论,后者则充满调情意味。
🔍 此次更新引发对内容审核及未成年用户影响的讨论,xAI需平衡创新与安全。
5、百度APP全面焕新:上线AI入口 DeepseekR1深度搜索不卡顿
百度App今日宣布全量上线全新的AI入口,深度整合文心大模型与DeepSeek模型,为用户提供全面升级的使用体验。新功能包括AI搜索、全网信息提炼、AI总结和数字人智能体,能够精准理解用户需求,实现个性化搜索结果。借助海量用户数据和大模型推理能力,百度App为用户呈现多模态内容推荐,提升信息获取效率。
【AI摘要:】
🔍 新增AI搜索、全网信息提炼等多项智能功能,提升用户体验。
👤 通过用户画像与行为数据分析,提供个性化的搜索结果,真正实现千人千面。
📈 升级首日使用量突破千万次,显示出用户对新功能的高度认可。
6、腾讯混元视频模型(Hunyuan Video)测试招募中,开源在望
腾讯混元视频模型(Hunyuan Video)近期在X平台上公开招募测试伙伴,标志着其AI视频生成技术进入关键测试阶段。该模型以超过13B参数量成为开源视频生成模型中的佼佼者,展现出卓越的性能,特别是在视频流畅性和多对象生成方面。
【AI摘要:】
🎯 混元视频模型是腾讯在AI视频生成领域的重要创新,参数量超过13B,具备强大的生成能力。
🛠️ 该模型在测试阶段表现出色,尤其在视频流畅性、细节还原和多对象生成方面超越现有模型。
🤝 招募测试伙伴旨在通过合作提升模型性能,参与者将为模型开源前的稳定性和实用性提供反馈。
详情链接:https://docs.google.com/forms/d/e/1FAIpQLScZe9DflcpKf_JfcgGnAiXfyhEZAt2uP4mE0Rhs5l9R2m49oA/viewform
7、月之暗面联手UCLA推新模型Mixture-of-Expert,提升语言模型训练效率
在人工智能领域,Moonshot AI与UCLA联合开发的Moonlight模型,采用Muon优化器,显著提升了大型语言模型的训练效率和稳定性。通过创新的牛顿-舒尔茨迭代法和权重衰减技术,Moonlight在多个任务上超越了传统的AdamW优化器,尤其在语言理解和代码生成方面表现优异。
【AI摘要:】
🌟 Moonlight模型是由Moonshot AI与UCLA联合开发的Mixture-of-Expert模型,提供30亿和160亿参数配置,训练使用了5.7万亿个标记。
⚙️ Muon优化器通过牛顿-舒尔茨迭代法和权重衰减技术,显著提高了大型模型训练的效率和稳定性。
📈 实证结果显示,Moonlight在多个任务上优于传统的AdamW训练模型,表现出更好的语言理解和代码生成能力。
详情链接:https://github.com/MoonshotAI/Moonlight?tab=readme-ov-file
8、1x发布家庭机器人NEO Gamma:能冲咖啡、洗衣和吸尘等
1X 公司最新推出的家居机器人 Neo Gamma 具备多项家务功能,如冲咖啡、洗衣和吸尘,同时也能为用户提供陪伴。与传统家用机器人不同,Neo Gamma 的设计更为温和亲切,易于引发情感依赖。其先进的运动控制系统和语言交互功能,使其能够自然地融入家庭生活,成为人们生活中的得力助手。
【AI摘要:】
🌟 Neo Gamma 是一款新型家居机器人,能够完成家务并为用户提供陪伴。
🤖 其设计更为亲切温和,与传统家用机器人截然不同,易于让人产生情感依赖。
🛠️ Neo Gamma 具备自然运动能力和语言交互功能,未来将与家庭生活紧密结合。
详情链接:https://www.1x.tech/neo
9、小米将推出首款AI PC产品
小米集团合伙人兼总裁卢伟冰在最近的直播中宣布,小米即将推出其首款AI PC产品,引起了科技界的广泛关注。这款新产品的最大亮点是其搭载的99Wh超大电池,不仅符合民航运输的安全标准,还能显著提升用户在移动办公时的续航能力。随着移动办公的普及,用户对电池续航的需求日益增加,而小米的这一设计正好解决了这一问题。
【AI摘要:】
🔋 新款AI PC搭载99Wh超大电池,满足民航运输安全标准,成为可登机产品。
💼 该产品旨在提升用户在移动办公时的续航能力,解决续航焦虑。
🤖 深度整合AI技术,提供更智能的操作体验,提升工作和学习的便利性。
10、阿里巴巴宣布创纪录投资:未来三年3800亿加码云与AI硬件建设
阿里巴巴集团CEO吴泳铭宣布未来三年将投入超过3800亿元人民币用于云和AI硬件基础设施建设。这一创纪录的投资不仅是中国民营企业在该领域的最大手笔,也展示了阿里在AI时代的技术野心与战略布局。
【AI摘要:】
🚀 阿里巴巴未来三年将投入3800亿元人民币用于云和AI硬件基础设施建设。
📈 国内AI产业正迎来爆发式增长,阿里巴巴的投资将加速行业智能化转型。
🌍 此次投资将提升中国在全球AI竞赛中的竞争力,助力企业在国际舞台上占据重要位置。
11、Meta AI 发布新型视频学习模型V-JEPA :视频理解新突破
Meta AI团队最新推出的V-JEPA模型在无监督视频学习领域取得了重大突破。该模型通过特征预测原则,利用视频数据直接进行学习,避免了传统方法对预训练编码器和文本监督的依赖。V-JEPA在运动理解和视频任务上表现优越,展示了其高效的训练能力和强大的表示能力,尤其在低样本设置下仍能保持准确性。
【AI摘要:】
🔍 V-JEPA模型专注于无监督特征预测,直接从视频数据中学习,避免传统方法的限制。
⚡ 该模型在视频任务和低样本学习中表现出色,展现了高效的训练能力和强大的表示能力。
📈 V-JEPA在捕捉细微运动细节方面具有优势,证明了其在视频理解中的潜力。
详情链接:https://ai.meta.com/research/publications/revisiting-feature-prediction-for-learning-visual-representations-from-video/
12、LiblibAI哩布哩布AI宣布再获数亿元融资 一年内连续完成四轮融资
LiblibAI在短短一年内成功完成四轮融资,创下国内AI应用赛道融资速度的新纪录。此次融资再获数亿元资金,进一步巩固了其在行业内的领先地位。公司致力于通过AI技术改变创作者的创作方式,建立了完整的创作生态链,并在用户增长和技术研发上持续发力。
【AI摘要:】
💰 LiblibAI在一年内完成四轮融资,创下国内AI应用赛道融资速度新纪录。
🖼️ 公司的AI模型/图像创作者已突破两千万,日均创作交互数百万级。
🌐 本轮融资将重点投入创作者生态建设和技术研发,提升平台技术实力和用户体验。
13.Pixverse V4.0更新:音效与转绘功能震撼登场
Pixverse 发布了 V4.0版本,增强了底层模型,新增同步生成音效和转绘功能。用户可以通过 “Restyle” 功能将视频风格转换,且生成速度和真实感显著提升。这次更新为内容创作者提供了更丰富的创作体验,并被广泛好评。
【Soraor 提要:】
🎨 V4.0引入转绘功能,支持多种风格转换,提升创作自由度。
⚡ 视频生成速度提升至10秒,真实感和提示词遵循度显著提高。
🎶 新增同步音效功能,丰富视频内容体验,增强视听效果。