企业在数百个数据源上构建RAG,而不是仅仅一个! - 微软在M365产品中提供它。 - 谷歌在其Vertex AI Search中提供它。 - AWS在其Amazon Q Business中提供它。 让我们在200多个源(100%本地)上构建一个MCP驱动的RAG:
企业数据分散在多个来源。 今天,我们将构建一个统一的MCP服务器,可以从一个接口查询200多个来源。 技术栈: - @mcpuse 用于构建本地MCP客户端 - @MindsDB 用于连接数据源 - @ollama 用于本地提供GPT-oss服务 让我们开始吧!
工作流程如下: - 用户提交查询。 - 代理连接到 MindsDB MCP 服务器以查找工具。 - 根据用户的查询选择合适的工具并调用它。 - 最后,返回一个上下文相关的响应。 现在,让我们深入代码吧!
1️⃣ Docker 设置 MindsDB 提供可以在 Docker 容器中运行的 Docker 镜像。 通过在终端中运行命令,使用 Docker 镜像在本地安装 MindsDB。 查看这个 👇
2️⃣ 启动 MindsDB GUI 安装 Docker 镜像后,在浏览器中访问 localhost 端口 47334 以访问 MindsDB 编辑器。 通过此界面,您可以连接到超过 200 个数据源并对其运行 SQL 查询。 查看这个 👇
3️⃣ 集成数据源 让我们开始通过将数据源连接到 MindsDB 来构建我们的联合查询引擎。 我们使用 Slack、Gmail、GitHub 和 Hacker News 作为我们的联合数据源。 看看这个 👇
4️⃣ MCP 服务器配置 在构建联邦查询引擎后,让我们通过将数据源连接到 MindsDB 的 MCP 服务器来统一我们的数据源。 将 MCP 服务器配置添加到如下所示的 JSON 文件中。 查看这个 👇
5️⃣ 将客户端连接到服务器 我们通过 mcp-use 设置本地客户端,并仅用 4 行代码将其连接到 MCP 服务器。 1. 从配置文件初始化 MCP 客户端。 2. 通过 Ollama 连接本地 LLM。 3. 使用 LLM 和客户端创建代理。 4. 运行查询。 查看这个 👇
完成! 我们的 MindsDB MCP 服务器现在通过 mcp-use 连接到本地客户端! 它提供了两个工具: - list_databases:列出所有连接到 MindsDB 的数据源。 - query:回答用户对联邦数据的查询。 查看这个 👇
最后,我们将我们的设置包装在一个 Streamlit 界面中,在这里我们可以动态更改 MCP 配置并直接与代理聊天。 查看这个演示👇
结束了! 如果你觉得这很有启发性,请与您的网络分享。 找到我 → @_avichawla 每天,我都会分享关于数据科学、机器学习、大型语言模型和检索增强生成的教程和见解。
Avi Chawla
Avi Chawla8月8日 14:33
企业在数百个数据源上构建RAG,而不是仅仅一个! - 微软在M365产品中提供它。 - 谷歌在其Vertex AI Search中提供它。 - AWS在其Amazon Q Business中提供它。 让我们在200多个源(100%本地)上构建一个MCP驱动的RAG:
104.97K