企業在超過 100 個數據來源上構建 RAG,而不是僅僅一個! - 微軟在 M365 產品中提供它。 - 谷歌在其 Vertex AI Search 中提供它。 - AWS 在其 Amazon Q Business 中提供它。 讓我們在 200 多個來源上構建一個 MCP 驅動的 RAG(100% 本地):
企業數據分散在許多來源中。 今天,我們將建立一個統一的 MCP 伺服器,可以從一個介面查詢 200 多個來源。 技術棧: - @mcpuse 用於構建本地 MCP 客戶端 - @MindsDB 用於連接數據來源 - @ollama 用於本地提供 GPT-oss 讓我們開始吧!
這是工作流程: - 使用者提交查詢。 - 代理連接到 MindsDB MCP 伺服器以尋找工具。 - 根據使用者的查詢選擇適當的工具並調用它。 - 最後,返回一個與上下文相關的回應。 現在,讓我們深入了解代碼!
1️⃣ Docker 設定 MindsDB 提供可以在 Docker 容器中運行的 Docker 映像。 通過在終端中運行命令來本地安裝 MindsDB,使用 Docker 映像。 查看這個 👇
2️⃣ 開始 MindsDB GUI 安裝 Docker 映像後,請在瀏覽器中訪問 localhost 端口 47334 以訪問 MindsDB 編輯器。 通過此界面,您可以連接超過 200 個數據源並對其運行 SQL 查詢。 查看這個 👇
3️⃣ 整合數據來源 讓我們開始通過將數據來源連接到 MindsDB 來構建我們的聯邦查詢引擎。 我們使用 Slack、Gmail、GitHub 和 Hacker News 作為我們的聯邦數據來源。 看看這個 👇
4️⃣ MCP 伺服器配置 在建立聯邦查詢引擎後,讓我們通過將數據源連接到 MindsDB 的 MCP 伺服器來統一我們的數據源。 將 MCP 伺服器配置添加到如下所示的 JSON 文件中。 查看這個 👇
5️⃣ 將客戶端連接到伺服器 我們通過 mcp-use 設置本地客戶端,並僅用 4 行代碼將其連接到 MCP 伺服器。 1. 從配置文件初始化 MCP 客戶端。 2. 通過 Ollama 連接本地 LLM。 3. 使用 LLM 和客戶端創建代理。 4. 執行查詢。 查看這個 👇
完成! 我們的 MindsDB MCP 伺服器現在已通過 mcp-use 連接到本地客戶端! 它提供了兩個工具: - list_databases:列出所有連接到 MindsDB 的數據源。 - query:回答用戶對聯邦數據的查詢。 查看這個 👇
最後,我們將設置包裝在 Streamlit 界面中,在這裡我們可以動態更改 MCP 配置並直接與代理聊天。 查看這個演示👇
這就結束了! 如果你覺得這很有見地,請與你的網絡分享。 找到我 → @_avichawla 每天,我會分享有關數據科學、機器學習、大型語言模型和檢索增強生成的教程和見解。
Avi Chawla
Avi Chawla8月8日 14:33
企業在超過 100 個數據來源上構建 RAG,而不是僅僅一個! - 微軟在 M365 產品中提供它。 - 谷歌在其 Vertex AI Search 中提供它。 - AWS 在其 Amazon Q Business 中提供它。 讓我們在 200 多個來源上構建一個 MCP 驅動的 RAG(100% 本地):
104.97K