欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、通义万相开源视频生成模型Wan2.1:8.2G显存即可生成480P视频

通义万相最新发布的Wan2.1模型专注于高质量视频生成,凭借其卓越的性能和创新技术,成为创作者和企业用户的首选工具。该模型在Vbench评测中取得了86.22%的高分,领先于其他视频生成模型,展现出显著的性能优势。Wan2.1通过高效的3D因果VAE模块和Diffusion Transformer架构,优化了视频生成和推理效率,为用户提供了灵活的开发和部署选择。

image

【AI摘要:】

🚀 Wan2.1模型在Vbench评测中以86.22%成绩位列第一,领先其他视频生成模型。

💡 采用3D因果VAE模块,实现256倍无损视频隐空间压缩,提高了视频重建速度。

🔧 支持多种主流框架,开发者可通过Gradio快速体验,简化推理与部署流程。

详情链接:https://github.com/Wan-Video

2、360智脑发布Tiny-R1-32B:5%参数逼近Deepseek-R1满血性能

360智脑团队与北京大学联合推出的Tiny-R1-32B-Preview模型,凭借仅5%的参数量,成功接近Deepseek-R1的性能,展现了小型模型在高效推理中的潜力。该模型在数学、编程和科学领域的评测中均表现优异,尤其在AIME2024评测中取得了78.1分,显示出其在多个任务上的均衡优化能力。研发团队承诺将开放完整的模型资源,推动技术的普惠发展。

image

【AI摘要:】

📊 Tiny-R1-32B-Preview模型以5%的参数量接近Deepseek-R1的性能,展现小模型的高效推理潜力。

💻 在数学、编程和科学领域,该模型在多个评测中表现优异,超越当前最佳开源70B模型。

🔗 研发团队承诺公开完整模型仓库,推动技术普惠,并已将模型上传至Hugging Face平台。

详情链接:https://huggingface.co/qihoo360/TinyR1-32B-Preview

3、DeepSeek开源周第3天:发布DeepGEMM,FP8GEMM库助力AI训练与推理

在开源周的第三天,中国人工智能公司DeepSeek推出了DeepGEMM,这是一款支持FP8通用矩阵乘法的开源库,旨在为密集型和混合专家模型提供支持。该库在NVIDIA Hopper GPU上实现了超过1350TFLOPS的FP8计算性能,且核心代码仅300行,展现出极高的效率与简洁性。

image

【AI摘要:】

🚀 DeepGEMM是一个开源库,专为密集型和混合专家矩阵运算设计,支持FP8通用矩阵乘法。

💻 在NVIDIA Hopper GPU上,DeepGEMM可实现高达1350+ TFLOPS的FP8计算性能,展现出卓越的效率。

🌐 该库的发布不仅提升了DeepSeek模型的性能,也为全球开发者提供了一个高效、易用的矩阵运算工具。

详情链接:https://github.com/deepseek-ai/DeepGEMM

4、百度无代码开发工具“秒哒”开启用户邀测

百度于2月25日正式宣布其无代码开发工具“秒哒”已开启用户邀测,用户可通过收到的邀测邮件访问秒哒首页,体验H5页面开发和网站开发等功能。该工具于2024年11月12日在百度世界2024大会上发布,具备无代码编程、多智能体协作和多工具调用等特性。申请测试的企业用户数量已突破2万,百度后续将开放更多功能,用户可在百度智能云官网申请加入测试排队。

image

【AI摘要:】

🚀 用户可通过邀测邮件访问秒哒,体验多种开发功能。

📈 申请测试的企业用户数量已突破2万,显示出市场的强烈需求。

🔧 秒哒具备无代码编程和多智能体协作等核心特性,提升开发效率。

详情链接:https://digital.cloud.baidu.com/mF/commonLandingPage/CTA/889605a4883041b98b16538350ea33f8?pushId=bBDCrkwdYZ6bP8TE44JbCM1

5、谷歌超低价AI模型Gemini2.0Flash-Lite正式上线

谷歌最近推出了Gemini2.0Flash-Lite,这是其AI模型系列中最具成本效益的选项,旨在为预算有限的开发者提供高性价比的解决方案。该模型在处理大规模文本输出任务时表现出色,定价策略极具竞争力,输入和输出tokens的费用远低于市场同类产品。虽然它不支持高级功能,但其在文本生成领域的高效性和实用性使其成为初创公司和小团队的理想选择。

image

【AI摘要:】

💰 Gemini2.0Flash-Lite的输入tokens定价为每百万0.075美元,输出tokens为每百万0.30美元,具有极高的性价比。

📈 该模型在性能上优于Gemini1.5Flash,能够处理100万tokens的上下文窗口,适合高频任务。

📝 尽管不支持图像或音频输出,Gemini2.0Flash-Lite仍专注于文本生成,能够为约40,000张照片生成单行标题,成本不到1美元。

6、幻方量化回应DeepSeek-R2模型提前发布:以官方消息为准

近日,幻方量化针对DeepSeek新一代AI模型R2提前发布的传闻作出回应,强调一切以官方消息为准。幻方量化于2023年7月成立深度求索AI公司,并在今年1月发布了DeepSeek-R1模型。路透社报道称,DeepSeek正在加速推进R2模型的发布,计划提前至5月,且新模型在代码生成和多语言推理能力上有望实现提升。

【AI摘要:】

🔍 幻方量化表示会以官方消息为准,回应DeepSeek-R2模型提前发布的传闻。

🚀 DeepSeek于2023年7月成立深度求索AI公司,并于1月成功发布DeepSeek-R1模型。

🌐 新一代DeepSeek-R2模型有望在代码生成和多语言推理能力上实现提升。

7、微软开源全新多模态 AI Agent “Magma”:可自动下单与行为预测

微软最近在官网上开源了名为“Magma”的多模态AI Agent基础模型。Magma能够跨越数字和物理世界,处理图像、视频和文本等多种数据类型,并具备心理预测功能,能够更准确地理解人物或物体的意图。这款AI的应用场景非常广泛,不仅可以帮助用户进行日常操作如自动下单和查询天气,还能控制实体机器人并提供实时帮助。Magma的推出标志着智能助手和机器人技术的重大进步,特别适合用于AI驱动的助手或机器人,提升其学习能力和实用性。

image

【AI摘要:】

🌐 跨模态能力:Magma能够处理图像、视频和文本等多种数据类型,提升智能助手的功能。

🤖 智能应用:用户可通过Magma自动下单、查询天气,以及控制实体机器人。

📚 学习适应性:Magma帮助机器人学习新任务,并为虚拟助手生成操作指南,增强了其实用性。

详情链接:https://microsoft.github.io/Magma/

8、与DeepSeek和Claude竞争升级!OpenAI深度研究功能面向所有付费ChatGPT用户开放

OpenAI最近扩展了其深度研究功能,向所有ChatGPT Plus、Team、Education和Enterprise用户开放。这一功能被认为是自ChatGPT以来最具变革性的AI助手,能够进行复杂的研究任务并生成专业报告。与此同时,中国的DeepSeek通过开源新模型挑战OpenAI的商业模式,促使市场竞争加剧。

image

【AI摘要:】

💻 OpenAI将深度研究功能扩展至多个用户层级,增强AI助手的研究能力。

🔍 中国DeepSeek通过开源新模型挑战OpenAI的订阅商业模式。

📈 深度研究在效率与局限性之间创造了新的商业机会,促使企业重塑信息处理流程。

9、PhotoDoodle AI 只需几个提示即可将您的照片变成异想天开的艺术作品

字节跳动与中国和新加坡大学研究团队联合推出的PhotoDoodle,利用Flux.1模型重新定义图像创作。该系统通过少量样本学习艺术风格,精准执行编辑指令,极大地提高了创意表达的可能性。核心技术包括位置编码克隆,确保新元素自然融入原始图像,同时研究团队正在探索更高效的单图像训练方法。

image

【AI摘要:】

🖌️ PhotoDoodle基于Flux.1模型,能够从少量样本中学习艺术风格并执行编辑指令。

✨ 位置编码克隆技术使AI能记住每个像素位置,确保新元素自然融入背景。

📊 研究团队已发布包含六种艺术风格的数据集,并探索更高效的单图像训练方法。

详情链接:https://github.com/showlab/PhotoDoodle

10、OpenAI免费开放ChatGPT高级语音聊天模式

OpenAI于2月26日在X平台上宣布,ChatGPT的高级语音模式正式向用户免费开放。该模式基于GPT-4o mini模型,通过优化计算效率,性能已接近完整版GPT-4o。现在,macOS和Windows10、11系统的ChatGPT桌面应用程序都支持此模式,用户可以选择5种语音,并享受自定义提示和对话内容回顾功能。

image

【AI摘要:】

🎤高级语音模式基于GPT-4o mini模型,性能接近完整版GPT-4o。

💻 目前支持macOS及Windows10、11系统的ChatGPT桌面应用程序。

🚀 提供5种语音选择,支持自定义提示与对话内容回顾功能。

11、萌翻全网!AI“魔法”让校园地标秒变毛绒玩偶,创意特效火爆出圈!

最近,一款名为“快来惹毛我”的AI特效在社交媒体上引发热潮,能够将现实建筑转化为可爱的毛绒玩偶风格。该特效的简单操作和惊艳效果吸引了众多用户,尤其是在高校和文旅机构中广受欢迎。尽管生成效果存在随机性,但用户可以通过筛选不同风格的毛绒效果图片,获得更符合心意的最终效果。

image

【AI摘要:】

🎉 这款AI特效“快来惹毛我”能将现实建筑转化为毛绒玩偶风格,效果可爱逼真。

📈 在社交平台上,该特效迅速走红,吸引大量用户参与并分享生成的视频。

🛠️ 用户可通过筛选不同风格的生成图片,确保最终效果更符合个人喜好。

12、支持联网搜索!OPPO ColorOS接入满血版DeepSeek-R1

今日,ColorOS官方宣布接入满血版DeepSeek-R1推理模型,覆盖40款OPPO/一加机型。新版本的小布助手功能显著提升,支持一键AI唤醒、语音对话、联网搜索及结果导出。OPPO通过本地化网络部署提升了系统流畅度,用户体验更佳。ColorOS设计总监强调小布助手与DeepSeek的强结合,展现了OPPO在技术创新方面的实力与决心。

【AI摘要:】

🤖 小布助手接入DeepSeek-R1,功能显著提升,支持AI唤醒和语音对话。

🌐 OPPO进行了本地化网络部署,显著提升系统流畅度,用户体验更佳。

⚙️ ColorOS展现出独特的AI能力,避免用户繁琐的手动切换步骤。