欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、昆仑万维天工大模型4.0o1版和4o版正式上线

2025年1月6日,昆仑万维集团推出了其最新的「天工大模型4.0」o1版和4o版,标志着在人工智能领域的一次重大进展。o1版是国内首款具备中文逻辑推理能力的模型,经过技术升级,能够处理多种推理挑战。而4o版则是一款多模态模型,拥有情感表达和多语言能力,为用户提供了更自然的对话体验。。

image

【AI摘要:】

🧠 o1版具备中文逻辑推理能力,经过技术升级,能处理数学、代码等多种推理挑战。

💬4o版是一款多模态模型,提供情感表达和快速响应的实时语音对话助手Skyo。

🌐 两款模型的发布推动了昆仑万维在AI领域的技术进步和应用拓展。

详情链接:https://www.tiangong.cn/

2、罗永浩新 AI 助理 “J1Assistant” 正式上线,语音交互引领智能新时代

罗永浩的人工智能项目Jarvis推出了名为“J1Assistant”的AI助理软件,现仅在海外提供安卓版本。该软件的亮点在于其音频输入功能,用户可以通过语音轻松发送消息、搜索信息或与AI模型互动。J1Assistant集成了Jarvis自家AI模型,具备备忘录功能,帮助用户管理日常事务。

【AI摘要:】

🎤 J1Assistant推出音频输入功能,用户可通过语音进行操作,提升交互体验。

📅 集成Jarvis自家AI模型,提供实用答案及备忘录功能,帮助用户管理事务。

🌍 目前仅支持安卓版本,未来有望推出更多功能和平台,满足用户需求。

3、爱奇艺起诉MiniMax:AI模型涉嫌侵犯版权,要求赔偿10万元

有媒体报道称爱奇艺向法院提起诉讼,指控AI初创企业MiniMax在模型训练中侵犯其版权。MiniMax被指未经授权使用爱奇艺的素材,生成侵权内容。爱奇艺要求MiniMax立即停止侵权并索赔10万元。MiniMax可能会以素材为公开资源或用户输入为由进行抗辩,争取法律免责。此事件尚未有双方公开回应,法律争议仍在发展中。

【AI摘要:】

⚖️ 爱奇艺已向法院起诉MiniMax,指控其侵犯版权。

📜 MiniMax被指未经授权使用爱奇艺的版权素材进行模型训练。

💰 爱奇艺要求MiniMax停止侵权并索赔约10万元人民币。

4、阿里团队出品!妆容迁移技术SHMT:提供化妆参考图就能给你上妆

阿里巴巴达摩院最近推出的SHMT模型,利用潜在扩散模型实现化妆效果的精准转移,已被国际顶级学术会议NeurIPS2024接收。该技术通过简单的化妆参考图和目标角色照片,能够快速生成妆容效果,极大地推动了化妆应用和图像处理领域的发展。

image

【AI摘要:】

🎓 SHMT模型利用潜在扩散模型实现化妆效果转移,已被NeurIPS2024接收。

🔧 团队提供完整的开源代码和预训练模型,便于研究人员进行应用与改进。

📂 数据准备和参数调整至关重要,研究中详细指导了操作流程和目录结构。

详情链接:https://github.com/Snowfallingplum/SHMT

5、字节跳动开源全新AI模型LatentSync 精准控制唇形同步

字节跳动推出的LatentSync是一项先进的端到端唇同步技术,利用音频条件的潜在扩散模型,实现了视频中人物唇部动作与音频的精确匹配。该技术通过引入TREPA技术,增强了时间一致性,同时优化了SyncNet的收敛性,显著提升了唇同步的准确性。

【AI摘要:】

🎤 端到端框架:LatentSync无需中间运动表示,直接从音频生成唇部动作。

🌟 高质量生成:利用Stable Diffusion生成动态逼真的说话视频,提升视觉效果。

⏱️ 时间一致性:通过TREPA技术增强视频帧之间的时间一致性,确保唇同步的准确性。

详情链接:https://github.com/bytedance/LatentSync

6、Meta 发布新型记忆层技术:突破参数限制,大幅提升 AI 事实准确性

Meta 公司近日推出了一项创新的记忆层技术,旨在提升大型语言模型的事实准确性并扩展参数规模。这项技术通过可训练的键值查找机制,显著提高了模型的信息存储和检索能力。实验结果表明,配备记忆层的模型在多个任务中表现优异,尤其在事实性任务上,性能提升显著。

image

【AI摘要:】

🧩 记忆层技术通过稀疏激活机制提升事实准确性,达到1280亿参数的规模。

🚀 实验显示,配备记忆层的模型在事实性问答等任务中表现优于传统稠密模型。

🔧 研究人员对记忆层进行了多项优化,提升了性能和稳定性,展示出强大的可扩展性。

详情链接:https://arxiv.org/pdf/2412.09764

7、Yukai推出陪伴型机器人“Mirumi”:毛茸茸的带给你婴儿般的情感体验

Yukai Engineering以其创新的机器人产品而闻名,最新推出的Mirumi是一款装在钱包上的毛茸茸小球,能够自发转头观察周围的人。这款机器人旨在模仿婴儿的天真与愉快,带给人们愉悦的互动体验。Mirumi的设计灵感源自日本妖怪,结合运动感应技术,展现多种情感,如好奇、害羞等,进一步彰显了Yukai在奇特机器人领域的独特地位。

【AI摘要:】

👶 Mirumi是一款毛茸茸的小球,能自发转头观察周围,带来愉悦感。

🤔 该机器人通过运动感应表达情感,模仿婴儿的天真与互动。

🎉 Mirumi的设计灵感源自日本妖怪,旨在重现与婴儿互动的快乐体验。

8、OpenAI 开始将目标转向“超级智能”

OpenAI CEO 山姆・奥特曼在其博客中宣布,公司已掌握构建人工智能(AGI)的核心技术,并将目标转向超智能。他认为,超智能将显著提升科学发现和创新速度,推动社会繁荣。尽管当前技术存在限制,如“幻觉”现象和高运行成本,奥特曼对未来充满信心,认为技术进步将改变时间线。

【AI摘要:】

🌟 OpenAI CEO 山姆・奥特曼表示,公司已经掌握了构建 AGI 的技术,并将目标转向超智能。

🔍 AGI 被定义为在经济上超越人类的高度自主系统,OpenAI 与微软的协议对其有明确约定。

🚀 尽管当前技术仍有限制,奥特曼对未来发展充满信心,认为时间线会随着技术进步而变化。

9、哈佛大学华人研究员Jeffrey Wang加盟OpenAI 专注模型预训练和推理工作

Jeffrey Wang,哈佛大学的华人研究员,最近加入OpenAI,专注于模型预训练和推理工作。他的学术成就和研究背景引起了广泛关注,尤其是在机器学习和隐私性领域的贡献。Jeffrey的加入不仅是他个人职业生涯的重要一步,也展示了OpenAI对顶尖人才的吸引力,预示着未来AI研究的蓬勃发展。

image

【AI摘要:】

🎓 Jeffrey Wang在哈佛大学期间积极参与机器学习和统计学的研究,并教授相关课程。

📄 他的研究成果在多个国际会议上发表,探讨了语言模型隐私和扩散模型的公平性问题。

🌟 Jeffrey Wang的加入标志着OpenAI吸引顶尖人才的能力,推动AI领域的发展。

10、微软计划在2025财年投入800亿美元建设人工智能数据中心

微软公司在2025财年计划投入800亿美元用于建设专门处理人工智能工作负载的数据中心。这一投资旨在加速AI模型的训练和云应用的全球部署,展现了美国在新技术浪潮中的重要地位。随着AI技术的迅速发展,微软的投资不仅是对自身业务的扩展,也反映了对基础设施的迫切需求,未来将为更多行业的数字化转型提供强大支持。

【AI摘要:】

💰 超过一半的资金将用于美国建设,彰显其在AI技术中的重要地位。

🌐 微软与OpenAI的竞争关系日益紧张,未来可能影响行业格局。

⚡ 随着AI技术需求增加,电力需求也在急剧上升,数据中心面临电力短缺风险。

11、这能力绝了!AI 可以“听出”锂电池即将起火的信号

锂离子电池在我们的日常生活中无处不在,但其过热或损坏可能引发严重火灾。2023年,纽约市因电动自行车电池引发的火灾事件频发,造成多起伤亡。为应对这一风险,NIST研究团队开发了一种基于声音的火灾预警技术,能够通过AI算法识别电池安全阀破裂声,提前约两分钟发出警告。

image

【AI摘要:】

🔥 NIST研究团队开发基于声音的锂电池火灾预警技术,利用AI识别安全阀破裂声。

🔊 经过训练的算法识别率高达94%,在多种噪音干扰下仍能保持高效检测。

⏳ 新型火灾警报器预计提供约两分钟的提前预警,帮助人们及时逃生。

12、马斯克宣布 Grok3即将上线,实力提升十倍!

在人工智能领域,埃隆·马斯克再次成为焦点,他在社交媒体上透露,备受期待的Grok3模型即将推出,计算能力较Grok2提升十倍。Grok系列自发布以来备受关注,尽管Grok3的推出经历了一些延迟,但马斯克的最新消息无疑令期待已久的用户振奋。

【AI摘要:】

⚙️ Grok3模型即将推出,计算能力提升十倍,使用了10万块英伟达H100芯片。

📈 尽管Grok3原定去年底发布,但由于多种原因推迟,马斯克确认预训练工作已完成。

🌍 全球对AI技术的需求增长,Grok3的发布将为开发者和企业带来新的机遇和挑战。