让我们使用 gpt-oss(100% 本地)构建一个浏览器自动化代理:
浏览器仍然是最通用的界面,每天有43亿个页面被访问! 这是我们如何完全自动化它的快速演示! 技术栈: - @stagehanddev 开源AI浏览器自动化 - @crewAIInc 进行编排 - @ollama 运行gpt-oss 开始吧!🚀
系统概述: - 用户输入自动化查询。 - 规划代理创建自动化计划。 - 浏览器自动化代理使用 Stagehand 工具执行该计划。 - 响应代理生成响应。 现在,让我们深入代码吧!
1️⃣ 定义 LLM 我们使用三个 LLM: - 计划 LLM:为自动化任务创建结构化计划。 - 自动化 LLM:使用 Stagehand 工具执行计划。 - 响应 LLM:综合最终响应。 查看这个 👇
2️⃣ 定义自动化规划代理 规划代理从用户那里接收自动化任务,并为浏览器代理创建一个结构化的执行布局。 查看这个 👇
3️⃣ 定义 Stagehand 浏览器工具 一个自定义的 CrewAI 工具利用 AI 与网页互动。 它利用 Stagehand 的计算机使用代理能力,能够自主导航 URL,执行页面操作,并提取数据以回答问题。 查看这个 👇
4️⃣ 定义浏览器自动化代理 浏览器自动化代理利用上述的 Stagehand 工具进行自主浏览器控制和计划执行。 查看这个 👇
5️⃣ 定义响应合成代理 合成代理作为最终质量控制,精炼来自浏览器自动化代理的输出,以生成精致的响应。 查看这个 👇
6️⃣ 创建 CrewAI 代理流程 最后,我们通过 CrewAI 流程将我们的代理连接在一起。 查看这个 👇
完成了!让我们看看我们的多代理浏览器自动化工作流程如何运作!🚀 查看这个 👇
您可以在下面共享的 GitHub 仓库中找到所有代码和您所需的一切。 查看这个 👇
回顾一下,这里是供您参考的系统概述: - 用户输入自动化查询。 - 规划代理创建自动化计划。 - 浏览器自动化代理使用 Stagehand 工具执行该计划。 - 响应代理生成响应。 查看这个👇
如果您觉得这篇文章有启发性,请与您的网络分享。 找到我 → @akshay_pachaar ✔️ 获取更多关于LLM、AI代理和机器学习的见解和教程!
Akshay 🚀
Akshay 🚀8月10日 20:51
让我们使用 gpt-oss(100% 本地)构建一个浏览器自动化代理:
87.03K