信息差

AI速递：昆仑万维天工版o1、4o齐发；罗永浩携AI助理“J1 Assistant”亮相；爱奇艺诉MiniMax AI模型侵权风波

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、昆仑万维天工大模型4.0o1版和4o版正式上线

2025年1月6日，昆仑万维集团推出了其最新的「天工大模型4.0」o1版和4o版，标志着在人工智能领域的一次重大进展。o1版是国内首款具备中文逻辑推理能力的模型，经过技术升级，能够处理多种推理挑战。而4o版则是一款多模态模型，拥有情感表达和多语言能力，为用户提供了更自然的对话体验。。

【AI摘要:】

🧠 o1版具备中文逻辑推理能力，经过技术升级，能处理数学、代码等多种推理挑战。

💬4o版是一款多模态模型，提供情感表达和快速响应的实时语音对话助手Skyo。

🌐 两款模型的发布推动了昆仑万维在AI领域的技术进步和应用拓展。

详情链接:https://www.tiangong.cn/

2、罗永浩新 AI 助理 “J1Assistant” 正式上线，语音交互引领智能新时代

罗永浩的人工智能项目Jarvis推出了名为“J1Assistant”的AI助理软件，现仅在海外提供安卓版本。该软件的亮点在于其音频输入功能，用户可以通过语音轻松发送消息、搜索信息或与AI模型互动。J1Assistant集成了Jarvis自家AI模型，具备备忘录功能，帮助用户管理日常事务。

【AI摘要:】

🎤 J1Assistant推出音频输入功能，用户可通过语音进行操作，提升交互体验。

📅 集成Jarvis自家AI模型，提供实用答案及备忘录功能，帮助用户管理事务。

🌍 目前仅支持安卓版本，未来有望推出更多功能和平台，满足用户需求。

3、爱奇艺起诉MiniMax:AI模型涉嫌侵犯版权，要求赔偿10万元

有媒体报道称爱奇艺向法院提起诉讼，指控AI初创企业MiniMax在模型训练中侵犯其版权。MiniMax被指未经授权使用爱奇艺的素材，生成侵权内容。爱奇艺要求MiniMax立即停止侵权并索赔10万元。MiniMax可能会以素材为公开资源或用户输入为由进行抗辩，争取法律免责。此事件尚未有双方公开回应，法律争议仍在发展中。

【AI摘要:】

⚖️ 爱奇艺已向法院起诉MiniMax，指控其侵犯版权。

📜 MiniMax被指未经授权使用爱奇艺的版权素材进行模型训练。

💰 爱奇艺要求MiniMax停止侵权并索赔约10万元人民币。

4、阿里团队出品!妆容迁移技术SHMT:提供化妆参考图就能给你上妆

阿里巴巴达摩院最近推出的SHMT模型，利用潜在扩散模型实现化妆效果的精准转移，已被国际顶级学术会议NeurIPS2024接收。该技术通过简单的化妆参考图和目标角色照片，能够快速生成妆容效果，极大地推动了化妆应用和图像处理领域的发展。

【AI摘要:】

🎓 SHMT模型利用潜在扩散模型实现化妆效果转移，已被NeurIPS2024接收。

🔧 团队提供完整的开源代码和预训练模型，便于研究人员进行应用与改进。

📂 数据准备和参数调整至关重要，研究中详细指导了操作流程和目录结构。

详情链接:https://github.com/Snowfallingplum/SHMT

5、字节跳动开源全新AI模型LatentSync 精准控制唇形同步

字节跳动推出的LatentSync是一项先进的端到端唇同步技术，利用音频条件的潜在扩散模型，实现了视频中人物唇部动作与音频的精确匹配。该技术通过引入TREPA技术，增强了时间一致性，同时优化了SyncNet的收敛性，显著提升了唇同步的准确性。

【AI摘要:】

🎤 端到端框架:LatentSync无需中间运动表示，直接从音频生成唇部动作。

🌟 高质量生成:利用Stable Diffusion生成动态逼真的说话视频，提升视觉效果。

⏱️ 时间一致性:通过TREPA技术增强视频帧之间的时间一致性，确保唇同步的准确性。

详情链接:https://github.com/bytedance/LatentSync

6、Meta 发布新型记忆层技术:突破参数限制，大幅提升 AI 事实准确性

Meta 公司近日推出了一项创新的记忆层技术，旨在提升大型语言模型的事实准确性并扩展参数规模。这项技术通过可训练的键值查找机制，显著提高了模型的信息存储和检索能力。实验结果表明，配备记忆层的模型在多个任务中表现优异，尤其在事实性任务上，性能提升显著。

【AI摘要:】

🧩 记忆层技术通过稀疏激活机制提升事实准确性，达到1280亿参数的规模。

🚀 实验显示，配备记忆层的模型在事实性问答等任务中表现优于传统稠密模型。

🔧 研究人员对记忆层进行了多项优化，提升了性能和稳定性，展示出强大的可扩展性。

详情链接:https://arxiv.org/pdf/2412.09764

7、Yukai推出陪伴型机器人“Mirumi”:毛茸茸的带给你婴儿般的情感体验

Yukai Engineering以其创新的机器人产品而闻名，最新推出的Mirumi是一款装在钱包上的毛茸茸小球，能够自发转头观察周围的人。这款机器人旨在模仿婴儿的天真与愉快，带给人们愉悦的互动体验。Mirumi的设计灵感源自日本妖怪，结合运动感应技术，展现多种情感，如好奇、害羞等，进一步彰显了Yukai在奇特机器人领域的独特地位。

【AI摘要:】

👶 Mirumi是一款毛茸茸的小球，能自发转头观察周围，带来愉悦感。

🤔 该机器人通过运动感应表达情感，模仿婴儿的天真与互动。

🎉 Mirumi的设计灵感源自日本妖怪，旨在重现与婴儿互动的快乐体验。

8、OpenAI 开始将目标转向“超级智能”

OpenAI CEO 山姆・奥特曼在其博客中宣布，公司已掌握构建人工智能（AGI）的核心技术，并将目标转向超智能。他认为，超智能将显著提升科学发现和创新速度，推动社会繁荣。尽管当前技术存在限制，如“幻觉”现象和高运行成本，奥特曼对未来充满信心，认为技术进步将改变时间线。

【AI摘要:】

🌟 OpenAI CEO 山姆・奥特曼表示，公司已经掌握了构建 AGI 的技术，并将目标转向超智能。

🔍 AGI 被定义为在经济上超越人类的高度自主系统，OpenAI 与微软的协议对其有明确约定。

🚀 尽管当前技术仍有限制，奥特曼对未来发展充满信心，认为时间线会随着技术进步而变化。

9、哈佛大学华人研究员Jeffrey Wang加盟OpenAI 专注模型预训练和推理工作

Jeffrey Wang，哈佛大学的华人研究员，最近加入OpenAI，专注于模型预训练和推理工作。他的学术成就和研究背景引起了广泛关注，尤其是在机器学习和隐私性领域的贡献。Jeffrey的加入不仅是他个人职业生涯的重要一步，也展示了OpenAI对顶尖人才的吸引力，预示着未来AI研究的蓬勃发展。

【AI摘要:】

🎓 Jeffrey Wang在哈佛大学期间积极参与机器学习和统计学的研究，并教授相关课程。

📄 他的研究成果在多个国际会议上发表，探讨了语言模型隐私和扩散模型的公平性问题。

🌟 Jeffrey Wang的加入标志着OpenAI吸引顶尖人才的能力，推动AI领域的发展。

10、微软计划在2025财年投入800亿美元建设人工智能数据中心

微软公司在2025财年计划投入800亿美元用于建设专门处理人工智能工作负载的数据中心。这一投资旨在加速AI模型的训练和云应用的全球部署，展现了美国在新技术浪潮中的重要地位。随着AI技术的迅速发展，微软的投资不仅是对自身业务的扩展，也反映了对基础设施的迫切需求，未来将为更多行业的数字化转型提供强大支持。

【AI摘要:】

💰 超过一半的资金将用于美国建设，彰显其在AI技术中的重要地位。

🌐 微软与OpenAI的竞争关系日益紧张，未来可能影响行业格局。

⚡ 随着AI技术需求增加，电力需求也在急剧上升，数据中心面临电力短缺风险。

11、这能力绝了!AI 可以“听出”锂电池即将起火的信号

锂离子电池在我们的日常生活中无处不在，但其过热或损坏可能引发严重火灾。2023年，纽约市因电动自行车电池引发的火灾事件频发，造成多起伤亡。为应对这一风险，NIST研究团队开发了一种基于声音的火灾预警技术，能够通过AI算法识别电池安全阀破裂声，提前约两分钟发出警告。

【AI摘要:】

🔥 NIST研究团队开发基于声音的锂电池火灾预警技术，利用AI识别安全阀破裂声。

🔊 经过训练的算法识别率高达94%，在多种噪音干扰下仍能保持高效检测。

⏳ 新型火灾警报器预计提供约两分钟的提前预警，帮助人们及时逃生。

12、马斯克宣布 Grok3即将上线，实力提升十倍!

在人工智能领域，埃隆·马斯克再次成为焦点，他在社交媒体上透露，备受期待的Grok3模型即将推出，计算能力较Grok2提升十倍。Grok系列自发布以来备受关注，尽管Grok3的推出经历了一些延迟，但马斯克的最新消息无疑令期待已久的用户振奋。

【AI摘要:】

⚙️ Grok3模型即将推出，计算能力提升十倍，使用了10万块英伟达H100芯片。

📈 尽管Grok3原定去年底发布，但由于多种原因推迟，马斯克确认预训练工作已完成。

🌍 全球对AI技术的需求增长，Grok3的发布将为开发者和企业带来新的机遇和挑战。

如果觉得文章对你有用，请随意赞赏

快讯

AI速递：昆仑万维天工版o1、4o齐发；罗永浩携AI助理“J1 Assistant”亮相；爱奇艺诉MiniMax AI模型侵权风波

https://soraor.com/archives/ai-today_20250106154311

作者

破晓

发布于

2025-01-06

更新于

2025-01-06

许可协议

CC BY 4.0