在今年的世界移动通信大会(MWC)上,谷歌宣布为其 Gemini 助手新增实时视频分析和屏幕共享功能。Gemini Advanced 的 Google One AI Premium 订阅用户将于本月晚些时候率先体验这项新功能。

此次更新将赋予 Gemini Live 两大核心能力:一是通过外部摄像头实时分析视频内容,二是支持屏幕共享,让 AI 助手能够直接解读用户手机上的信息并提供反馈。通过这些功能,用户可以与 AI 进行更具互动性的视觉交流,例如让 AI 识别物体、解析屏幕内容或提供实时建议。

image

新功能将首先在 Android 设备上推出,并支持多种语言。谷歌在 MWC 现场演示了这些功能在各大 Android 设备中的集成,进一步巩固其在 AI 助手领域的竞争力。

此次更新也标志着 AI 助手向现实世界交互迈出关键一步。谷歌的长期目标是 Project Astra——一个能够实时处理文本、视频、音频并具备短期记忆能力的通用多模态 AI 助手,预计 Astra 未来将与谷歌搜索、Lens 和地图等工具深度结合。

随着 Gemini Live 的推出,谷歌与 OpenAI 之间的竞争愈发激烈。自去年12月起,ChatGPT 已支持高级语音模式的实时视频和屏幕共享功能,而谷歌此次更新无疑是对其正面迎战的一步。Gemini 能否借助这项新功能进一步巩固 AI 领先地位,值得持续关注。