信息差

AI速递：智谱Realtime、4V、Air新模型齐发；Luma AI Ray2模型逼真度爆表；xAI Grok网页版正式上线

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、Luma AI 推出Ray2视频生成模型，实现更快更自然的运动效果

Luma AI最近推出了Ray2视频生成模型，标志着在AI视频创作领域的重要进展。Ray2经过大量计算训练，提升了视频生成的速度和自然度，用户可以通过简单的文本描述生成短视频。尽管在复杂提示下可能出现失真，整体反馈积极。为了庆祝这一发布，Luma Labs还举办了大奖赛，鼓励创作者参与并有机会赢得奖金。

【AI摘要:】

🌟 Ray2生成视频模型发布，提升视频创作效率和自然度。

🎥 支持文本到视频的快速生成，用户可轻松制作短视频。

💰 举办 Ray2大奖赛，创作者有机会赢得高达7000美元的奖金。

详情链接:https://lumalabs.ai/ray

2、马斯克旗下xAI上线Grok网页版无需X账号即可体验

近日，埃隆·马斯克旗下的xAI公司推出了网页版Grok AI聊天机器人，用户无需访问X.com或拥有X账户即可体验其强大功能。只需在浏览器中访问grok.com并提供出生年份，用户便可立即使用这款智能聊天机器人。Grok AI不仅能实时收集信息和解答问题，还具备生成图像的能力，带来便捷的用户体验。

【AI摘要:】

🌐 Grok AI网页版上线，用户无需X账户即可使用。

🤖 只需提供出生年份，便可体验智能聊天功能。

🔒 临时模式保护用户隐私，聊天内容不被记录。

3、智谱AI成首家被美国列入实体清单的中国大模型公司，回应称不受影响

智谱AI被美国商务部列入出口管制实体清单，成为首家被制裁的中国大模型公司。尽管面临制裁，智谱AI强调其技术源自清华大学，并表示制裁不会对其运营造成实质性影响。智谱AI在大模型技术领域持续创新，展现出强大的市场前景和技术实力。

【AI摘要:】

📉 智谱AI成为首家被美国列入实体清单的中国大模型公司，标志着对中国AI产业的新一轮打压。

🔧 公司强调其技术源自清华大学，拥有全链路大模型核心技术，制裁不会影响正常运营。

📱 智谱AI正在与苹果洽谈合作，显示出其技术实力和市场前景。

4、阶跃星辰自研推理模型Step Reasoner mini上线

上海阶跃星辰智能科技有限公司推出了其自研的推理模型Step Reasoner mini（Step R-mini），该模型以其超长推理能力在逻辑推理、代码和数学等领域表现出色。Step R-mini通过大规模强化学习训练，能够兼顾文理科双向能力，展现了在复杂问题解决和内容创作上的卓越性能。

【AI摘要:】

🧠 Step R-mini是首个推理模型，擅长主动规划和反思，提供准确可靠的回复。

📊 在数学和逻辑推理任务中，Step R-mini展现出色的解题能力，能够处理复杂问题并提供多种解法。

🎨 该模型在内容创作中深入理解用户需求，具备创新表达风格，能够生成富有情感的文学作品。

详情链接:https://yuewen.cn

5、阿里巴巴Qwen 团队发布新型过程奖励模型，数学推理再进化

阿里巴巴 Qwen 团队最新发布的论文介绍了新型过程奖励模型（PRM）在数学推理中的应用，推出了 Qwen2.5-Math-PRM 系列模型，显著提升了推理的准确性和泛化能力。这些模型通过创新的共识过滤机制和蒙特卡洛估计，解决了传统方法在推理过程中的不足，尤其是在教育和科学计算等领域的应用前景广阔。

【AI摘要:】

🔍 新模型突破了现有 PRM 框架的限制，显著提高了数学推理的准确性和泛化能力。

📊 采用共识过滤机制，有效降低了数据噪声约60%，提升了训练数据质量。

🚀 Qwen2.5-Math-PRM 系列在多个评估指标上表现优异，尤其在逐步识别错误的任务中超越了许多专有模型。

6、Kinetix 推出全新AI视频技术可精准控制角色动作

Kinetix最近推出了一项创新的AI视频技术，能够通过结合真人表演和文本指令，实现对数字角色动作的精准控制。这项技术的操作流程简单易懂，用户无需专业的动画制作经验也能快速创作出高质量的动画内容。凭借强大的3D动画数据库支持和合成数据生成管道，Kinetix不仅大幅缩短了制作时间，还降低了成本。

【AI摘要:】

🤖 通过结合真人表演视频和文本指令，Kinetix的AI技术实现了对数字角色动作的精确操控。

💡 系统支持多种动作和表情的精准捕捉，用户可调节动作的速度、幅度和节奏，提升角色表现效果。

⏱️ 制作时间从传统的数周缩短至数小时，降低制作成本，使中小型团队和个人创作者也能轻松实现专业动画。

详情链接:https://www.kinetix.tech/character-motion-control-for-video-generation-models

7、线稿上色的新技术MangaNinja:输入线稿和参考图，精准给线稿上色

MangaNinja是一种创新的线稿上色技术，通过输入线稿和参考图像，能够实现高精度的上色效果。该技术基于扩散模型，采用补丁重排模块和点驱动控制方案，显著提升了上色的准确性和图像质量。MangaNinja在处理复杂场景时表现出色，能够有效解决角色姿势变化和颜色混淆等问题，为用户提供了更大的创作灵感和可能性。

【AI摘要:】

🌟 MangaNinja 是一种基于参考图像的线稿上色方法，具备精准匹配和细致控制的能力。

🎨 通过创新的补丁重排模块和点驱动控制方案，MangaNinja 显著提升了上色的准确性与图像质量。

🖌️ 该技术能够应对多样化的上色挑战，包括极端姿势和多参考图像的协调，实现高质量的互动上色体验。

详情链接:https://johanan528.github.io/MangaNinjia/

8、微软AutoGen v0.4发布:AI 智能体灵活性和跨语言能力大提升

微软最新发布的AutoGen v0.4版本显著提升了AI代理的灵活性和可控性，解决了用户在使用过程中遇到的架构限制和效率低下的问题。新版本引入的异步消息传递机制和跨语言互操作性，使得开发者可以更方便地构建复杂的代理网络。

【AI摘要:】

💡 AutoGen v0.4版本增强了 AI 代理的灵活性，解决了用户反馈的问题。

🌐 新版支持异步消息传递和跨语言互操作性，提升了代理之间的协作能力。

🔧 AutoGen Studio 低代码界面的升级，使得用户可以更方便地设计和管理代理。

详情链接:https://www.microsoft.com/en-us/research/blog/autogen-v0-4-reimagining-the-foundation-of-agentic-ai-for-scale-extensibility-and-robustness/

9、腾讯会议全新升级上线AI小助手Pro

腾讯会议近期推出了AI小助手Pro，基于腾讯混元千亿级参数大模型，具备深度理解和快速响应的能力，能够为用户提供精准的会议支持。此次升级还优化了组织协同功能，提升了会议效率，用户可以更方便地管理会议通知和录制分享。同时，新增的个人身份认证和企业认证功能也增强了会议的专业性与安全性。

【AI摘要:】

🤖 AI小助手Pro支持联网搜索和多种任务处理，能深度理解会议内容，提供精准回答。

📅 用户可在会议中直接创建组织，快速添加参会者，提升会议效率。

🔒 新增身份认证功能，增强会议安全性和专业性，提升用户体验。

10、一家初创公司用AI智能体在Reddit大肆刷推广帖还让人毫无察觉

最近，Astral创业公司因利用AI技术在Reddit上发布广告而备受关注。创始人萨瓦娜·费德展示了这项技术的快速应用能力，能够生成与用户讨论相似的内容，从而推销客户的产品。这种手法不仅高效，还能在不被察觉的情况下插入广告信息，引发了人们对网络空间未来的担忧，传统互联网可能被无休止的商业化和垃圾信息所侵蚀。

【AI摘要:】

💡 Astral利用AI技术在Reddit上迅速生成用户相似的广告帖子。

📈 创始人设计AI代理绕过Reddit限制，专注于商业推广而非用户服务。

🚨 此举引发对网络内容未来的担忧，社交媒体可能充斥广告与垃圾信息。

13.智谱发布 GLM-4-Air、GLM-4V-Plus 模型，设立 Flash 全模态免费模型

智谱华章科技公司发布新模型 GLM-4-Air 和 GLM-4V-Plus，并推出全新端到端模型 GLM-Realtime，实现低延迟的视频理解和语音交互。该公司致力于提供高性价比的语言模型解决方案，并设立 Flash 全模态免费模型，支持多种应用场景，助力开发者创新。

【Soraor 提要：】

🌟 推出 GLM-Realtime，具备清唱功能和 2 分钟记忆能力。

💡 GLM-4-Air-0111 全面升级，降低应用门槛至原来 50%。

📈 Flash 全模态免费模型系列，支持多模态理解和生成。

项目入口：bigmodel.cn

如果觉得文章对你有用，请随意赞赏

快讯

AI速递：智谱Realtime、4V、Air新模型齐发；Luma AI Ray2模型逼真度爆表；xAI Grok网页版正式上线

https://soraor.com/archives/ai-today_20250116154251

作者

破晓

发布于

2025-01-16

更新于

2025-01-16

许可协议

CC BY 4.0