信息差

抖音联手豆包AI，即梦融合DeepSeek，Grok语音模式全面开放！AI领域再掀新浪潮

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:soraor.com

1、抖音打通豆包AI，字节跳动开启超级AI生态战略

抖音App正在测试接入豆包AI，标志着字节跳动加速推进AI生态布局。通过在短视频界面和消息列表中开放入口，抖音旨在打破AI产品与流量平台的壁垒，提升AI能力并引入更多用户流量。字节内部还在推进多条AI产品业务线，展现出全方位的AI产品生态系统。

【AI摘要:】

📱 抖音正在测试接入豆包AI，开放两个战略性入口，提升AI能力和用户流量。

💡 字节跳动内部推进多条AI产品线，覆盖多个领域，展现全方位的AI生态系统。

🏆 互联网巨头对AI技术在内容生态中的应用高度重视，开启新的AI服务生态时代。

2、强强联合!即梦接入DeepSeek 从提示词到绘画一步到位

即梦与DeepSeek的合作为AI绘画爱好者带来了极大的便利。通过DeepSeek的智能提示词生成功能，用户不再需要为创作灵感而烦恼，只需简单输入需求，便能获得精准的提示词，进而生成高质量的图像。这一创新的联动不仅提升了创作效率，还让绘画过程变得更加流畅和愉悦。

【AI摘要:】

🖌️ 即梦接入DeepSeek，提供智能提示词生成功能，解决用户创作难题。

✨ 用户只需输入简单需求，DeepSeek即可生成详细精准的提示词，提升创作效率。

🌟 DeepSeek生成的提示词质量高，能够有效引导AI生成高质量图像，用户反馈良好。

3、Grok 语音模式全面开放:11种模式上线，自带字幕成英语学习利器

xAI公司的AI助手Grok正式向所有用户开放其备受期待的语音模式，带来了11种独特的语音交互模式和语音字幕功能。这一更新不仅增强了用户的互动体验，还为英语学习者提供了新的学习工具。用户对这一更新反响热烈，虽然目前仅支持英文，但Grok的多样化表达和流畅度已获得用户的高度评价，未来扩展语言支持的期待也在不断增加。

【AI摘要:】

🎤 Grok的语音模式现已向所有用户开放，提供11种独特的交互风格，包括2种18+限制模式。

📚 新增的语音字幕功能帮助用户更好地理解内容，成为英语学习的实用工具。

🌍 用户对Grok的流畅度和情感表达给予高度评价，期待未来能支持更多语言。

4、vivo重组调整，成立新AI部门并将大模型训练转向端侧

vivo最近在其组织架构上进行了重要调整，成立了新的AI部门，显示出其在人工智能领域的持续投入与战略布局。新部门将专注于大模型的端侧训练，并且暂停了对商业化的考核，反映出vivo对AI技术长远发展的重视。此外，vivo还推出了DeepSeek-R1，提升了AI助手的智能化水平，进一步推动了用户体验的提升。

【AI摘要:】

🆕 vivo新设立AI部门，标志着公司在人工智能技术上的持续投入和战略布局。

📉 由于管理干预，vivo决定暂时不对AI大模型的商业化进行考核，并暂停资金投入。

🚀最新推出的DeepSeek-R1提升了AI助手的智能化水平，用户体验得到了显著改善。

5、全新技术 Fast3R :实现千张图片一键3D 重建，速度惊人!

Fast3R是一种创新的多视角3D重建技术，能够在一次前向传播中处理多达1500张图片，显著提高重建速度。与传统的DUSt3R方法相比，Fast3R利用基于Transformer的架构并行处理视图信息，省去复杂的对齐过程，提升了推理速度并减少误差积累。

【AI摘要:】

🌟 Fast3R技术可以在一次前向传播中处理多达1500张图片，大幅提高3D重建速度。

⚡ Fast3R的Transformer架构支持并行处理，省去传统方法的复杂对齐过程。

🚀 与DUSt3R相比，Fast3R在时间和内存使用上展现出显著优势，适用于大规模3D重建应用。

详情链接:https://fast3r-3d.github.io/

6、音乐创作领域投下核弹!DiffRhythm 炸裂问世:10秒 AI 神曲，人声伴奏一键搞定!

DiffRhythm的问世标志着音乐创作的新时代，它通过扩散模型实现了端到端的自动生成音乐，用户只需输入歌词和风格，即可在短短10秒内获得一首完整的歌曲。DiffRhythm不仅能生成伴奏，还能自动创作歌词，完美契合旋律，颠覆了传统音乐创作的模式，开启了AI音乐创作的新纪元。

【AI摘要:】

🎤 DiffRhythm通过扩散模型实现端到端的音乐创作，用户只需输入歌词和风格即可生成完整歌曲。

⚡ 生成速度极快，仅需10秒钟便可完成一首4分45秒的歌曲，速度是传统方法的50倍。

🎼 内置强大的大语言模型，能够自动创作歌词并与旋律完美匹配，彻底颠覆传统作曲方式。

详情链接:https://huggingface.co/spaces/ASLP-lab/DiffRhythm

7、微软开源图片模型ART，可生成多图层透明图片

在图像生成领域，微软研究人员推出的“Anonymous Region Transformer”（ART）技术，革新了用户与生成模型的互动方式。通过匿名区域布局，ART能够根据全球文本提示直接生成多层透明图像，并引入逐层区域裁剪机制，大幅提升生成效率，速度比传统方法快12倍。

【AI摘要:】

🌟 ART可根据全球文本提示和匿名区域布局，直接生成多层透明图像。

⚡️ 采用逐层区域裁剪机制，显著提高了图像生成效率，比传统方法快12倍。

💡 新型高质量自编码器支持多层透明图像的精确控制与生成，推动交互式内容创作。

详情链接:https://art-msra.github.io/

8、AI思维导图神器 MindMapper :扔个链接就能生成交互式思维导图

在信息爆炸的时代，Mind Mapper 应用程序成为了思维整理的得力助手。它能够将用户的想法转化为生动的思维导图，只需输入网址、YouTube 视频链接或文本提示，便能快速生成互动式思维导图。

【AI摘要:】

🖥️ Mind Mapper 能够将想法转化为生动的思维导图，支持网址、视频链接和文本提示输入。

🎨 采用 Mermaid.js 技术，思维导图不仅美观，还具备动态交互功能，用户可轻松获取详细信息。

📤 提供将思维导图下载为 PNG 图片的功能，方便用户分享知识和灵感。

详情链接:https://github.com/misbahsy/MindMapper

9、雷军亮相首场代表通道:小米将把最新的AI技术应用到各个终端上

在全国人大十四届三次会议的首场“代表通道”上，小米创办人雷军接受了记者提问，深入探讨了小米在制造业中的角色及科技创新方向。他强调制造业是国家的基石，小米将加大研发投入，特别是在人工智能领域，以提升消费者的科技体验，并助力中国式现代化。

【AI摘要:】

🏭 制造业是国家立国之本，小米将坚定走科技创新和高端化发展道路。

💰 小米计划在2021至2025年间投入1050亿元用于研发，2025年预计投入300亿元，AI相关业务占四分之一。

🌍 小米致力于将最新的AI技术应用于手机、汽车和智能家居等领域，提升全球市场的影响力。

10、爱诗科技完成A5轮融资，剑指AI视频生成领域新高地

爱诗科技近日宣布完成A5轮融资，由靖亚资本独家投资，融资额已超4亿元，成为AI视频生成领域的明星企业。公司成立于2023年，由前字节跳动视觉技术负责人王长虎创立，团队背景强大，迅速获得多方投资者青睐。此次融资将用于加速研发和引进人才，致力于打造领先的AI视频生成大模型及应用。

【AI摘要:】

📈 爱诗科技完成A5轮融资，融资额已超4亿元，成为AI视频生成领域的明星企业。

🌍 其产品PixVerse已拥有超过4000万用户，月活跃用户达1500万，技术实力领先。

💼 公司计划加速模型研发与高端人才引进，积极拓展B端企业服务，面临商业化挑战。

如果觉得文章对你有用，请随意赞赏

快讯

抖音联手豆包AI，即梦融合DeepSeek，Grok语音模式全面开放！AI领域再掀新浪潮

https://soraor.com/archives/ai-today_20250305153424

作者

破晓

发布于

2025-03-05

更新于

2025-03-05

许可协议

CC BY 4.0