信息差

百度文小言重磅升级！多模型融合调度+新语音大模型震撼发布

在刚刚结束的百度 AI DAY 上，百度文小言正式宣布了品牌焕新和功能升级的消息。此次升级不仅包括全新的视觉形象，更重要的是引入了多模型融合调度技术，这将极大增强其语音识别和图片问答的能力。

文小言的多模型融合调度是本次升级的核心亮点。通过整合百度自研的文心 X1、文心4.5等模型，并引入了诸如 DeepSeek-R1和可灵等第三方优质模型，用户可以根据需求灵活选择使用最适合的模型。用户只需轻松点击 “自动模式”，系统就会智能选择最佳模型组合，显著提高响应速度与任务处理能力，真正实现了一键解决问题的理想体验

在语音能力方面，全新升级的语音大模型支持多种方言对话、复杂知识问答，甚至可以随时打断对话。这意味着用户不仅可以通过语音获取知识回答，还可以进行趣味角色扮演，交互体验更为丰富。百度语音首席架构师贾磊指出，这款模型是行业首个基于全新互相关注意力（Cross-Attention）技术的端到端语音语言大模型，相比行业平均水平，其调用成本降低了50%-90%。同时，该模型的推理响应速度极快，等待时间缩短至1秒左右，让用户的交互体验更加流畅。

此外，文小言还推出了创新的图片问答功能，用户可以通过拍照或上传图片，直接以文字或语音提问，获取详细解析。例如，用户拍摄一道数学题，可以实时获得解题思路与视频解析;上传商品图片则能帮助比较参数和价格，方便购物决策。新增的 “图个冷知识” 功能更是富有趣味，用户可以预设 “历史学者” 或 “科技达人” 等视角，从多维度解读同一图片，提升了互动的乐趣。

百度文小言的这次升级无疑为用户带来了更为智能和便捷的体验，未来的互动将会更加多样化。

如果觉得文章对你有用，请随意赞赏

快讯

百度文小言重磅升级！多模型融合调度+新语音大模型震撼发布

https://soraor.com/archives/ai-today_20250331163619

作者

破晓

发布于

2025-03-31

更新于

2025-03-31

许可协议

CC BY 4.0