谷歌最近正式推出了 Vertex AI RAG 引擎,这是一款旨在简化从知识库中检索相关信息并将其输入大型语言模型(LLM)的复杂流程的开发工具。作为 Vertex AI 平台的一部分,Vertex AI RAG 引擎被定义为一种托管的编排服务和数据框架,专为开发上下文增强的 LLM 应用而设计。
在1月15日的博客中,谷歌提到,尽管生成式人工智能和大型语言模型正在变革各行各业,但仍然存在一些挑战,例如虚假信息(生成不准确或无意义的信息)和超出训练数据的知识局限性,这些都可能阻碍企业的采纳。而 Vertex AI RAG 引擎则通过实现检索增强生成(RAG)技术,帮助软件和人工智能开发者构建有根据的生成式人工智能解决方案。
谷歌强调了 Vertex AI RAG 引擎的几个关键优势。首先,它的使用非常简便,开发者可以通过 API 迅速入手,进行原型设计和实验。
其次,RAG 引擎提供了托管的编排功能,能够有效处理数据检索和 LLM 集成。此外,开发者还可以根据需求选择解析、分块、注释、嵌入、向量存储以及开源模型等组件,甚至可以自定义自己的组件,展现了极大的灵活性。
另外,Vertex AI RAG 引擎也支持多种向量数据库的连接,例如 Pinecone 和 Weaviate,或者直接使用 Vertex AI 搜索。
谷歌在博客中提到,该引擎在金融服务、医疗和法律等行业的应用案例,显示了其广泛的适用性。同时,谷歌也提供了丰富的资源,包括入门笔记、与 Vertex AI 向量搜索、Vertex AI 特征库、Pinecone 和 Weaviate 的示例集成,以及检索超参数调优的指南,帮助开发者更好地掌握和应用这款新工具。