SimularAI 团队发布了他们的创新产品——Simular,这是一款专为 Mac 用户设计的本地 AI 智能体,号称是“第一个能和你一起上网”的 AI。
与传统的云端 AI 助手不同
- 本地运行:Simular 并不把你的数据上传到云端服务器,而是在你自己的 Mac 电脑上直接运行,所以更安全、更快。
- 像真人一样操作网页:它的 AI 能理解网页上的各种内容,比如按钮、输入框、图片,并且能“自己”去点、去填表、去复制粘贴。
- 和你一起操作:你和 AI 可以同时控制电脑,互不干扰,你可以随时改主意、插手,AI 也会尊重你的操作。
Simular AI 由 Ang Li(前 Google DeepMind 研究员)和 Jiachen Yang(合作 AI 专家)于 2023 年创立。
Simular 的主要亮点是其灵活的协作模式:你可以让 AI 自动帮助你处理信息、查找内容、整理任务等,也可以随时打断并亲自操作,实现“人机协作”的自由切换。
这种设计既保证了效率,也让用户始终掌控自己的数字生活,数据隐私更有保障。
Simular 主要功能详解
1. 本地嵌入式 AI 浏览器
- Simular 不是传统的云端服务,而是在你的 Mac 上本地运行,利用原生 WebKit 浏览器环境。
- 所有数据和操作都在本地进行,隐私安全更有保障,不会上传到云端。
2. 人机协同操作
- 用户可以随时介入或与 AI 同时操作,比如在智能体执行任务时,自己也可以点击、输入,不需要 AI“让位”或交接控制权。
- 例如:你让 AI 帮你填写表单,但过程中随时可以补充或修改内容。
3. 自动化网页操作
- Simular 能自动浏览网页、搜索信息、填写表单、点击按钮、切换标签页等,适合日常生活和工作中的重复性操作。
- 如自动帮你查找、对比商品、整理清单、下单购物,甚至跨多个网站收集整理信息。
4. 安全的账号管理与登录
- 由于是本地运行,你可以放心让 AI 帮你登录各种网站,无需担心账号密码泄漏问题。
5. 高效的信息整合与内容生成
能快速抓取和整合网页上的信息,例如:
- 汇总新闻热点,自动生成播客内容。
- 提取并整理网页上的关键信息。
6. 任务透明和可控
- 用户对 AI 所做的每一步操作都能实时看到,并可随时打断或修正。
- 避免 AI 盲目执行或失控,确保操作的安全性和结果的可控性。
7. 多场景实用示例
- 网购助手:帮助规划购物清单、加购物车、下单前请示用户。
- 政策/数据检索:比如自动查找汽车关税变动,为你提供购车建议。
- 自动化办事:如政务网站自动查缴税信息。
- 新闻整合:批量整理资讯,快速推送重要事件。
它能帮我做哪些具体事?举几个案例
- 帮你一键生成购物清单并加购,不用自己一件件搜索。
- 自动帮你查找和整合新闻热点,一键输出成播客稿。
- 助你在复杂的政府/银行/保险网站导航、自动查缴费、查政策等。
- 关税让购车变得棘手。Simular 提供的购买日韩汽车的实用建议,这些建议基于实时关税更新。
核心技术
Simular 背后的核心技术框架是S2(Simular S2),这是一个面向实际桌面和移动端任务的开源多智能体(multi-agent)系统。
S2 框架强调“人机共存”,不仅仅是让 AI 单独完成任务,而是支持多智能体协作,以及与真实用户协作。
- 它能在电脑和手机上,自动执行各种人类常做的事情。
不仅仅是脚本工具,更像“AI帮你操作一切”:
- 可以打开应用、切换窗口、输入内容、搜索资料、保存文件、拖动鼠标、点击按钮……
- 它能“看见”屏幕(通过AI识别)、理解软件界面,然后做决策,就像一个聪明的远程助手。
S2 的技术亮点:
- 面向真实世界交互的多模态能力:不仅能处理文本,还能理解和操作图形界面、按钮、输入框等复杂网页元素。
- 高性能的环境感知:S2 能实时捕捉浏览器界面的状态变化,确保每一步操作都与网页反馈精准匹配。
- 任务分解与流程自动化:S2 能将复杂的用户需求自动拆分成多个子任务,并高效协同完成。
- 可扩展性与兼容性:支持不同类型的桌面和移动设备(目前优先支持 macOS)。
权威基准测试结果
- OSWorld Benchmark(桌面任务基准)
Simular 的 S2 框架在 OSWorld 基准测试(主要评测真实桌面操作任务的 AI 能力)中,表现超越了 Anthropic 和 OpenAI 等主流大厂的 AI 智能体,说明其在实际电脑环境中的自动化和适应能力极强。 - AndroidWorld Benchmark(移动端任务基准)
在面向智能手机端操作的 AndroidWorld 基准测试中,S2 框架同样取得领先成绩,说明其技术不仅局限于桌面端,在跨平台适应性和多模态操作方面也表现优异。 - WebVoyager Benchmark(浏览器任务权威测试)
Simular 浏览器智能体在 WebVoyager 权威基准测试中,多智能体协同模式下达到了 90.05% 的分数,优于 OpenAI 的 Operator 等顶尖系统,在自动化网页操作领域处于业界领先水平。