OpenAI 宣布其高级语音 Advanced Voice 功能升级,显著提升了语音交互的自然性和流畅度,用户与 ChatGPT 之间的对话变得更为轻松自如,使得用户在与模型交流时仿佛在与真人对话。
更重要的是,更新版本强化了语音翻译功能。用户可以通过语音直接与 ChatGPT 进行多轮对话,在无需重复提示的情况下,模型能持续进行语言翻译,直到用户明确发出停止指令。这意味着 ChatGPT 现在在语音处理方面具备了更好的上下文保持能力,特别适合旅行、国际商务、语言学习等使用场景。
此次更新已面向所有付费用户开放使用。
语音更像真人说话了
- 语调更自然:AI 不再是“平铺直叙”地讲话,而是有起伏、有强调。
- 节奏更真实:说话过程中加入了自然停顿和重音处理,听起来不像机器人。
情绪表达更丰富:例如:
- 可以听出同理心(Empathy),如“我理解你的感受”不再机械。
- 能表达讽刺(Sarcasm),如“当然,这是你最棒的主意🙄”语气变化明显。
即时语音翻译功能
ChatGPT 现在可以在语音对话中充当**“双语翻译官”**,例如:
- 你说英语,它即时翻译成葡萄牙语对话。
- 对方说葡萄牙语,它再翻译回英语说给你听。
- 无需重复开启,它可以持续翻译,直到你说“停止翻译”。
- 适用场景包括:国际出行、远程办公、多语种协作。
使用方式
- 该功能已面向 所有平台(Web、iOS、Android、桌面端)推出。
- 在对话输入区点击“语音图标”即可启动。
- 系统会启用最新版本的语音引擎,自动支持语言识别与翻译。
⚠️ 已知限制(Known Limitations)
- 某些语音选项下,可能会出现音质轻微下降、语调/语速偶发不稳定。
- 极少数情况下,语音模式可能“幻觉化地”输出非预期内容,如背景音乐、杂音或广告样音。
- 官方正在持续修复这些异常,以提高一致性与用户体验。
官方说明:https://help.openai.com/en/articles/6825453-chatgpt-release-notes