Cloudflare 推出了一个全托管的 RAG 系统:AutoRAG ,让你可以很容易地让 AI(如 Claude、ChatGPT)连接你的数据源,读懂你自己的资料,比如 PDF 文档、网页、图片、CSV 表格等,并且能“根据这些内容给你更精准和准确的回答”。
- 完全托管 RAG 系统:无需搭建繁琐流程
- 支持网页内容 ingestion:通过 Worker+Browser API 轻松抓取网页
- 灵活集成:可作为 Claude 等工具的智能问答底座
- 面向开发者的控制能力:AI Gateway、可视化调试、日志监控
背景:RAG 是什么?为何需要 AutoRAG?
Retrieval-Augmented Generation (RAG) 是一种结合向量检索与大语言模型(LLM)的 AI 技术框架,可用于提升问答质量,特别是涉及私有数据或实时数据的场景。
传统方式存在问题:
- LLM 无法访问用户私有数据
- 精调 LLM 成本高昂且维护困难
- System prompt 增大会话上下文,受限于 token 上限
RAG 的核心思想: 在推理时动态查询用户数据源,将其内容与用户问题一起送入 LLM,生成“有根据”的答案。
例如你问一个 AI:“我们公司的退换货政策是什么?”
- 普通的 AI 不知道,因为它没看过你公司的文档;
- 如果你把公司文档给它,它就能从里面“找出答案再回答你”;
- 这就是 RAG 的作用 —— 把用户的数据接入 AI。
AutoRAG 简介:Cloudflare 推出的托管式 RAG 服务
AutoRAG 是 Cloudflare 推出的 全托管式 RAG 管道服务,开发者无需手动搭建复杂的索引/检索/嵌入/调用流程,仅需指向数据源即可快速构建上下文感知的 AI 系统。
核心特点
- 无需 glue code:无需手动连接嵌入模型、向量库、LLM 等
- 自动更新:数据变动时自动重新嵌入、重索引
- Cloudflare 原生平台构建,依托全球边缘网络
- 全栈组件可见(非黑盒)
- Beta 阶段免费
🔍 有啥特别之处?
✅ 极简部署:不用写检索系统、不需要搭向量库,几分钟就能用上,不用管服务器。
✅ 自动更新:你的文件更新了,数据变了,AutoRAG 会自动重新处理
✅ 不限制内容格式:文本、表格、图片都能转成 AI 能理解的格式
✅ 安全可控:你的数据不会被送去公开模型或第三方,运行在你自己的 Cloudflare 账户里
✅ 集成灵活:Claude、Cursor、你自己写的 Worker 应用都能对接,可以用在客服机器人、内部搜索、企业知识库等。
✅ 省钱:公测期间免费,每个账户能建 10 个 AutoRAG,最多处理 10 万个文件。
总结一句话:
AutoRAG = AI+你的数据,一键生成问答系统,自动更新、免维护,马上可用。
架构组成:AutoRAG 的核心组件与流程
🔧 核心组件
AutoRAG 工作机制详解
1️⃣ Indexing(索引过程)
自动后台运行的异步流程,负责处理和结构化输入数据。
步骤如下:
索引(后台跑):
当你把文件上传到 Cloudflare(R2),AutoRAG 会做以下事:
- 读取文件(PDF、HTML、CSV、图片等)
- 转成 Markdown 文本(图像会转成描述性文字)
- 把文章切块(一整篇文档分成一段段小段落)
- 每段转成“向量”(AI 用来理解语义的数字形式)
- 把向量保存到数据库中(Cloudflare 的 Vectorize)
这一步是在后台自动运行的,AutoRAG 会不断检测你的内容是否有变化并更新索引。
✅ 支持文档格式:PDF、TXT、HTML、Markdown、CSV、图像等
2️⃣ Querying(查询过程)
同步执行的流程,响应用户查询。
流程如下:
查询(实时答):
当你或用户向 AutoRAG 提出问题,比如:
“我们支持多少种付款方式?”
AutoRAG 会自动:
- 接收问题(你通过 Claude、API、前端发过来)
- (可选)优化问题表达,让检索更准
- 将问题转成向量(和之前处理的内容一样的格式)
- 在向量数据库中查找最匹配的内容段落
- 把找到的内容和你的问题一起发给 AI 模型
- AI 返回“有根据”的回答
快速上手教程(集成网页内容)
🕸️ 步骤 1:抓取网站内容并上传至 R2
- 使用 Cloudflare Worker + Puppeteer 抓取网页 HTML
- 存储至新建的 R2 bucket 中,如 html-bucket
🔧 步骤 2:创建 AutoRAG 实例
通过 Cloudflare Dashboard:
- 选择数据源:如上一步的 html-bucket
- 选择嵌入模型(默认即可)
- 选择生成模型(默认即可)
- 创建 AI Gateway 与 API Token
- 命名并创建 AutoRAG
💬 步骤 3:测试并集成
- 使用 Playground 提问验证效果
在应用中通过 aiSearch() 或 search() 方法集成查询
``` const answer = await env.AI.autorag('my-rag').aiSearch({ query: 'What is AutoRAG?' });
```
应用场景
发展计划(Roadmap)
Cloudflare 正计划扩展 AutoRAG 功能:
- ✅ 支持更多数据源(如直接爬网站、Cloudflare D1 数据库)
- ✅ 提高回答质量(增加 rerank、recursive chunking 等机制)
- ✅ 提供爬虫端点(自动抓取整个网站)
- ✅ 增强监控和访问控制能力
官方介绍:https://blog.cloudflare.com/introducing-autorag-on-cloudflare/