SimularAI 团队发布了他们的创新产品——Simular,这是一款专为 Mac 用户设计的本地 AI 智能体,号称是“第一个能和你一起上网”的 AI。

与传统的云端 AI 助手不同

  • 本地运行:Simular 并不把你的数据上传到云端服务器,而是在你自己的 Mac 电脑上直接运行,所以更安全、更快。
  • 像真人一样操作网页:它的 AI 能理解网页上的各种内容,比如按钮、输入框、图片,并且能“自己”去点、去填表、去复制粘贴。
  • 和你一起操作:你和 AI 可以同时控制电脑,互不干扰,你可以随时改主意、插手,AI 也会尊重你的操作。

Simular AI 由 Ang Li(前 Google DeepMind 研究员)和 Jiachen Yang(合作 AI 专家)于 2023 年创立。

Simular 的主要亮点是其灵活的协作模式:你可以让 AI 自动帮助你处理信息、查找内容、整理任务等,也可以随时打断并亲自操作,实现“人机协作”的自由切换。

这种设计既保证了效率,也让用户始终掌控自己的数字生活,数据隐私更有保障。

Simular 主要功能详解

1. 本地嵌入式 AI 浏览器

  • Simular 不是传统的云端服务,而是在你的 Mac 上本地运行,利用原生 WebKit 浏览器环境。
  • 所有数据和操作都在本地进行,隐私安全更有保障,不会上传到云端。

2. 人机协同操作

  • 用户可以随时介入或与 AI 同时操作,比如在智能体执行任务时,自己也可以点击、输入,不需要 AI“让位”或交接控制权。
  • 例如:你让 AI 帮你填写表单,但过程中随时可以补充或修改内容。

3. 自动化网页操作

  • Simular 能自动浏览网页、搜索信息、填写表单、点击按钮、切换标签页等,适合日常生活和工作中的重复性操作。
  • 如自动帮你查找、对比商品、整理清单、下单购物,甚至跨多个网站收集整理信息。

4. 安全的账号管理与登录

  • 由于是本地运行,你可以放心让 AI 帮你登录各种网站,无需担心账号密码泄漏问题。

5. 高效的信息整合与内容生成

  • 能快速抓取和整合网页上的信息,例如:

    • 汇总新闻热点,自动生成播客内容。
    • 提取并整理网页上的关键信息。

6. 任务透明和可控

  • 用户对 AI 所做的每一步操作都能实时看到,并可随时打断或修正。
  • 避免 AI 盲目执行或失控,确保操作的安全性和结果的可控性。

7. 多场景实用示例

  • 网购助手:帮助规划购物清单、加购物车、下单前请示用户。
  • 政策/数据检索:比如自动查找汽车关税变动,为你提供购车建议。
  • 自动化办事:如政务网站自动查缴税信息。
  • 新闻整合:批量整理资讯,快速推送重要事件。

它能帮我做哪些具体事?举几个案例

  • 帮你一键生成购物清单并加购,不用自己一件件搜索。
  • 自动帮你查找和整合新闻热点,一键输出成播客稿。
  • 助你在复杂的政府/银行/保险网站导航、自动查缴费、查政策等。
  • 关税让购车变得棘手。Simular 提供的购买日韩汽车的实用建议,这些建议基于实时关税更新。

核心技术

Simular 背后的核心技术框架是S2(Simular S2),这是一个面向实际桌面和移动端任务的开源多智能体(multi-agent)系统。

S2 框架强调“人机共存”,不仅仅是让 AI 单独完成任务,而是支持多智能体协作,以及与真实用户协作。

  • 它能在电脑和手机上,自动执行各种人类常做的事情。
  • 不仅仅是脚本工具,更像“AI帮你操作一切”:

    • 可以打开应用、切换窗口、输入内容、搜索资料、保存文件、拖动鼠标、点击按钮……
    • 它能“看见”屏幕(通过AI识别)、理解软件界面,然后做决策,就像一个聪明的远程助手。

S2 的技术亮点:

  • 面向真实世界交互的多模态能力:不仅能处理文本,还能理解和操作图形界面、按钮、输入框等复杂网页元素。
  • 高性能的环境感知:S2 能实时捕捉浏览器界面的状态变化,确保每一步操作都与网页反馈精准匹配。
  • 任务分解与流程自动化:S2 能将复杂的用户需求自动拆分成多个子任务,并高效协同完成。
  • 可扩展性与兼容性:支持不同类型的桌面和移动设备(目前优先支持 macOS)。

权威基准测试结果

  • OSWorld Benchmark(桌面任务基准)
    Simular 的 S2 框架在 OSWorld 基准测试(主要评测真实桌面操作任务的 AI 能力)中,表现超越了 Anthropic 和 OpenAI 等主流大厂的 AI 智能体,说明其在实际电脑环境中的自动化和适应能力极强。
  • AndroidWorld Benchmark(移动端任务基准)
    在面向智能手机端操作的 AndroidWorld 基准测试中,S2 框架同样取得领先成绩,说明其技术不仅局限于桌面端,在跨平台适应性和多模态操作方面也表现优异。
  • WebVoyager Benchmark(浏览器任务权威测试)
    Simular 浏览器智能体在 WebVoyager 权威基准测试中,多智能体协同模式下达到了 90.05% 的分数优于 OpenAI 的 Operator 等顶尖系统,在自动化网页操作领域处于业界领先水平。

官网:https://www.simular.ai/

下载