Meta 发布了其下一代智能眼镜 Aria Gen 2的最新成果,作为 Project Aria 计划的一部分。这款眼镜旨在为学术和商业研究实验室提供工具,以推动机器感知、以自我为中心的 AI(egocentric AI)以及机器人技术的发展。

Aria Gen 2 不是消费级产品,而是专为研究人员设计的实验平台,计划于 2026 年初开始分发给研究合作伙伴。

自 2020 年首次亮相以来,Project Aria 已通过第一代设备与包括卡内基梅隆大学、宝马等在内的合作伙伴展开合作。如今,Aria Gen 2 在硬件、传感器和 AI 能力上进行了显著升级,旨在加速未来增强现实(AR)设备的开发。

主要特点与升级

  1. 先进的传感器套件

    • 摄像头:配备 RGB 摄像头、支持 6 自由度(6DOF)的 SLAM(同时定位与地图构建)摄像头,以及眼动追踪摄像头,用于捕捉视觉数据和用户注视方向。
    • 麦克风:包括空间麦克风和新增的鼻垫接触式麦克风,后者能区分佩戴者的声音与旁人的声音,提升语音识别的精准性。
    • 其他传感器:惯性测量单元(IMU)、气压计、磁力计和全球导航卫星系统(GNSS),提供全面的环境感知能力。
    • 新功能:鼻垫中嵌入的光电容积描记法(PPG)传感器,可实时监测心率,这是智能眼镜中的首次应用。
  2. 硬件设计

    • 重量与续航:仅重 75 克,电池续航达 6-8 小时,适合全天佩戴。
    • 可折叠设计:方便携带和使用。
    • 定制芯片:Meta 自研芯片支持本地处理,包括 SLAM、手势追踪、眼动追踪和语音识别,提升效率并降低功耗。
  3. AI 与机器感知能力

    • 本地处理:支持手势追踪、眼动追踪和语音识别,所有数据处理在设备上完成,无需依赖云端。
    • SLAM 技术:通过视觉定位系统(VPS),可在室内外环境中构建地图并导航,尤其适用于 GPS 信号较弱的场所(如商场或机场)。
    • 上下文理解:通过多传感器数据,Aria Gen 2 能更深入理解佩戴者的环境和行为,为个性化 AI 应用奠定基础。
  4. 音频体验

    • 配备开放式、力抵消扬声器,用于系统原型设计,提供空间音频体验,同时避免干扰周围环境。

应用场景与合作案例

  • 学术与商业研究:Aria Gen 2 将提供给研究人员,用于开发新的人机交互技术、机器人导航系统和 AI 模型。例如,通过 SLAM 技术,研究人员可以探索室内导航或物体定位的应用。
  • 实际案例:Meta 与初创公司 Envision 合作,利用 Aria Gen 2 开发“个人无障碍助理”,帮助盲人和低视力用户在室内导航、寻找物品。例如,通过空间音频引导用户找到超市中的特定商品(如红洋葱或苹果)。

对无障碍的贡献

Aria Gen 2引入了一系列新技术,这些技术在无障碍领域具有突破性意义:

  • Aria Gen 2配备空间麦克风和开放式扬声器,支持空间音频技术。声音通过耳机播放时,仿佛从环境中特定位置传来,用户可以根据声音方向进行导航。
  • 无障碍应用

    • 室内导航:传统GPS在室内失效,而Aria的SLAM(同步定位与建图)技术结合空间音频,能实时绘制室内地图并通过声音引导用户。例如,帮助盲人在超市找到苹果或红洋葱。
    • 直观体验:相比语音描述(如“向左走5米”),空间音频提供更自然的“跟随声音走”的方式,减少认知负担。
  • 与传统无障碍技术的对比

    传统无障碍工具(如盲杖、导盲犬或基于GPS的导航应用)在某些场景下存在局限,而Aria Gen 2提供了显著改进:

    • 盲杖与导盲犬:依赖物理接触或训练,难以提供具体物品信息或复杂路径指引。Aria通过声音和AI描述环境,覆盖更广的需求。
    • GPS导航:室内无效,且缺乏细节。Aria的SLAM和空间音频填补这一空白。
    • 现有智能眼镜:如第一代Aria或某些消费级产品,功能单一(如仅拍照或录音)。Gen 2的多模态集成和实时性更强。

实际案例与用户反馈

  • 合作项目:Meta与Envision、旧金山灯塔组织合作,测试Aria Gen 2的无障碍功能。
  • 用户体验:盲人测试者Sharon使用Aria在超市购物,通过语音交互和空间音频找到苹果和红洋葱。她反馈:“能自由走进杂货店找到想要的东西,效率高、速度快,太棒了。”
  • 技术细节

    • 用户说:“嘿,Meta,帮我挑点苹果。”设备回应:“跟着声音走”,并播放引导音。
    • 到达后,用户提问:“这儿有哪些苹果?”设备回答:“有Granny Smith、Cosmic Crisp和Honeycrisp。”
    • 确认时,用户问:“这是红洋葱吗?”设备通过相机识别后回应:“是的。”