欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、上线仅7天,阿里通义千问3问鼎全球开源模型

阿里巴巴的开源大模型“通义千问3”在上线仅七天后便荣登全球开源模型的冠军,展现了其在人工智能领域的重大突破。该模型在指令遵循能力方面超越了许多顶级闭源模型,成为全球首个无法作弊的模型基准测试。通义千问3的混合推理能力和低部署成本,使其在资源利用效率和性能上均表现优异,预示着未来开源AI模型的发展潜力。

【AI摘要:】

🏅 通义千问3上线七天即成为全球开源模型冠军,展现阿里在AI领域的突破。

📊 该模型在指令遵循能力上超越多个顶级闭源模型,成为无法作弊的基准测试。

💡 通义千问3结合快思考与慢思考模式,提升算力效率,降低部署成本。

2、月之暗面 Kimi 长思考模型 API 正式发布

月之暗面科技有限公司推出了其最新的长思考模型API——kimi-thinking-preview,具备多模态和通用推理能力,能够高效解决复杂的代码问题和数学难题。该模型的独特之处在于其API响应中包含了推理过程的展示,帮助用户理解模型的思考逻辑。

image

【AI摘要:】

🛠️ Kimi-thinking-preview模型具备深度推理能力,能有效解决复杂问题。

💡 模型API响应中包含reasoning_content字段,展示推理过程,帮助用户理解逻辑。

🚀 目前处于预览阶段,存在一些限制,但已展现出强大的潜力。

详情链接:https://platform.moonshot.cn/docs/guide/use-kimi-thinking-preview-model

3、OpenAI发布新一代GPT-4.1模型,和智谱Z.ai撞期

OpenAI正式推出了其最新的GPT-4.1模型,带来了显著的性能提升,特别是在编码能力和指令跟踪方面。同时,智谱也发布了GLM系列模型,进一步加剧了人工智能领域的竞争。GPT-4.1支持高达100万个上下文tokens,能够处理复杂任务和长篇文本,且使用成本较前代降低了26%。

【AI摘要:】

🚀 GPT-4.1模型在编码能力和指令跟踪方面显著提升,得分达54.6%。

💡 支持高达100万个上下文tokens,适用于大型代码库和长篇文档处理。

💰 使用成本降低26%,智谱的Z.ai平台也提供了强大功能,增强了市场竞争。

4、Google 发布升级版 Gemini2.5Pro AI 模型 助力开发者提升编码能力

Google 最近推出了 Gemini2.5Pro Preview AI 模型,标志着其在 AI 领域的持续创新与竞争力提升。新模型在编码和构建交互式 Web 应用方面表现优异,尤其在代码转换和编辑任务上。Gemini2.5Pro Preview 还在视频理解性能上取得了显著进展,帮助开发者提升编码能力并解决了许多关键问题。

image

【AI摘要:】

🚀 Gemini2.5Pro Preview 在多项基准测试中表现优异,提升了市场竞争力。

💻 新版本在编码性能上显著提升,解决了开发者反馈的关键问题。

🎥 在视频理解方面,Gemini2.5Pro Preview 在热门基准测试中获得了高分。

5、联想发布“天禧超级智能体”:开启混合式AI新纪元

在2025联想创新科技大会上,联想集团CEO杨元庆与大张伟探讨AI的发展,强调AI将增强而非取代人类的创造力。联想发布的天禧超级智能体,具备多模态感知、复杂决策和自主执行能力,旨在提升个人与企业的创造力和增长潜力。

image

【AI摘要:】

🌟 天禧超级智能体是联想推出的个性化AI超级入口,旨在提升用户创造力。

🧠 具备感知与交互、认知与决策、自主与演进三大核心能力,能够理解用户意图并自动执行任务。

🚀 此次发布标志着联想在AI个性化体验和智能生态系统建设上迈出关键一步。

6、腾讯元宝上线「对话分组」:全平台同步 完全免费、不限次数

腾讯元宝推出了新功能「对话分组」,旨在提升用户的聊天记录管理体验。用户可以根据项目、主题或任务创建不同的对话文件夹,使得信息的查找更加高效。此外,用户还可以将历史对话迁移至相应分组,并为每个分组设定独立的提示词指令,从而在不同角色之间切换自如。

image

【AI摘要:】

📁 用户可以为与元宝的聊天创建分组,方便管理和查找聊天记录。

💬 支持将历史对话迁移到相应的分组,集中管理灵感和想法。

🎯 每个分组可设定特定的语气和风格,使用户在不同任务间切换更顺畅。

7、Klavis AI 推出开源 MCP 集成,支持大规模用户和自定义工具

Klavis AI 最近推出了全新的开源MCP集成解决方案,旨在为开发者提供高效、稳定的环境,以快速集成和部署AI应用。该项目在GitHub上发布后迅速获得了开发者的关注,具备多种核心特点,如稳定的MCP服务器、内置身份验证和高品质保障。通过支持多种客户端集成和100多种工具的定制。

image

【AI摘要:】

💻 稳定的MCP服务器确保100%连接可靠性,提升用户体验。

🔒 内置OAuth流程和机密管理,保障开发者及用户的安全。

⚙️ 支持100多种工具集成,满足不同用户需求,丰富开发选择。

8、360开源升级自研7B参数模型360Zhinao3-7B

360集团宣布开源其自研的7B参数模型360Zhinao3-7B,并已在Github上线,供免费商用。该模型在数学、科学等领域表现优异,并在通用能力上展现出强大潜力,特别是在端侧应用方面。通过增量训练高质量token,模型效果显著提升,同时降低了推理成本。

image

【AI摘要:】

🧠360Zhinao3-7B模型通过增量训练700B高质量token,显著提升效果,降低推理成本。

📊 数据筛选和配比优化,增加数学、代码等数据比例,提升指令遵循和推理能力。

📈 模型在长文本处理和多轮对话上表现出色,适用于广泛的端侧应用。

详情链接:https://github.com/Qihoo360/360zhinao3

9、Hugging Face 发布免费云端 AI 助手,功能初现但表现不佳

Hugging Face 最近推出的 Open Computer Agent 是一款免费的云端 AI 助手,用户可以通过自然语言指令与其交互。然而,尽管助手在处理简单任务时表现尚可,但在面对复杂请求时却常常出现失误,且用户在使用过程中需要经历虚拟队列的等待。

【AI摘要:】

🌐 Hugging Face 推出的 Open Computer Agent 是一款免费的云端 AI 助手,但在执行复杂任务时表现不尽人意。

⌛ 用户在使用助手时需要等待一段时间,具体等待时间视需求而定。

📈 尽管存在不足,AI 代理技术仍吸引了越来越多企业的关注和投资。

详情链接:https://huggingface.co/spaces/smolagents/computer-agent

10、英伟达新开源模型 Llama-Nemotron 震撼发布,推理性能超越 DeepSeek-R1

英伟达最新推出的Llama-Nemotron系列模型在推理能力、内存效率和吞吐量等方面实现了显著提升,尤其是LN-Ultra模型在科学推理任务中表现优异。该系列模型采用了创新的训练方法和架构设计,尤其是引入的“推理开关”功能,极大地提升了用户交互体验。

image

【AI摘要:】

🧠 Llama-Nemotron系列模型包括LN-Nano8B、LN-Super49B和LN-Ultra253B,尤其是LN-Ultra在推理任务中表现优异。

⚙️ 该模型采用合成数据监督微调与强化学习的方法,显著提升了推理能力,尤其在科学推理方面表现突出。

🔄 英伟达首次推出“推理开关”功能,用户可通过提示词轻松切换推理模式,满足不同用户需求。

详情链接:https://arxiv.org/pdf/2505.00949

11、Cursor宣布免费向学生开放一年Pro会员,助力AI编程教育

Cursor于2025年5月6日宣布向全球学生免费开放为期一年的Pro会员,旨在降低AI编程工具的使用门槛,促进编程教育与技术创新。学生通过教育邮箱和SheerID验证身份后,可享受价值192美元的服务。此举不仅减轻了学生的经济负担,还为他们提供了强大的学习和项目开发支持,显示出Cursor在教育市场的积极布局。

image

【AI摘要:】

🎉 免费Pro会员服务为全球学生提供一年使用,降低了AI编程工具的使用门槛。

💻 Cursor集成先进语言模型,Pro会员用户可享受无限量AI查询和项目级上下文理解。

🌍 此政策覆盖多个国家,包括中国,吸引了大量学生关注,推动AI编程教育的普及。

详情链接:https://cursor.com/students

12、Lightricks推出视频新模型LTXV-13B,AI视频生成速度提升30倍、消费级硬件就能跑

Lightricks的新AI视频生成模型LTXV-13B以其130亿参数的设计,显著提升了视频生成的速度和效率,使得普通消费级硬件也能轻松运行。这一创新的多尺度渲染技术使得创作者能够在标准设备上制作高质量视频,降低了对昂贵硬件的依赖。

image

【AI摘要:】

🚀 LTXV-13B模型在普通硬件上实现高质量视频生成,速度提升30倍。

🔧 采用多尺度渲染技术,逐步生成视频细节,显著提高效率。

🤝 开源并免费授权给年收入低于1000万美元的初创企业,促进技术普及。

详情链接:https://huggingface.co/Lightricks/LTX-Video

13、新兴混合 AI 模型 CausVid:几秒钟内生成高质量视频

CausVid是麻省理工学院与Adobe Research合作开发的创新AI模型,能够在几秒钟内生成高质量视频,标志着视频创作领域的重大突破。该模型结合全序列扩散模型和自回归模型,显著提高了视频生成的速度和质量。CausVid不仅支持通过文本提示生成视频,还能将静态图片转化为动态场景,适用于多种视频编辑任务。

image

【AI摘要:】

🌟 CausVid 是一个新开发的混合 AI 模型,能够在几秒钟内生成高质量视频。

⚡ 它结合了全序列扩散模型和自回归模型的优势,实现快速而一致的视频输出。

🚀 CausVid 在生成视频的速度和质量上均超过了其他现有模型,未来有望实现即时生成。

详情链接:https://github.com/tianweiy/CausVid