Давайте створимо агента автоматизації браузера за допомогою gpt-oss (100% локально):
Браузер як і раніше залишається найбільш універсальним інтерфейсом з 4,3 мільярдами сторінок, які відвідують щодня! Ось коротка демонстрація того, як ми можемо повністю автоматизувати це! Технологічний стек: - @stagehanddev автоматизацію браузера зі штучним інтелектом з відкритим вихідним кодом - @crewAIInc для оркестровки - @ollama запустити gpt-oss Пішли!🚀
Огляд системи: - Користувач вводить запит на автоматизацію. - Planner Agent створює план автоматизації. - Агент автоматизації браузера виконує його за допомогою інструменту Stagehand. - Агент реагування генерує відповідь. А тепер давайте зануримося в код!
1️⃣ Визначення LLM Ми використовуємо три LLM: - Planner LLM: створює структурований план для завдання автоматизації. - Автоматизація LLM: виконує план за допомогою інструменту Stagehand. - Response LLM: Синтезує кінцеву відповідь. Перевірте 👇 це
2️⃣ Визначити агента Automation Planner Агент планувальника отримує від користувача завдання автоматизації та створює структурований макет для виконання агентом браузера. Перевірте 👇 це
3️⃣ Визначте інструмент браузера Stagehand Спеціальний інструмент CrewAI використовує штучний інтелект для взаємодії з веб-сторінками. Він використовує агентські можливості Stagehand, що використовуються на комп'ютері, для автономної навігації за URL-адресами, виконання дій на сторінці та вилучення даних для відповідей на запитання. Перевірте 👇 це
4️⃣ Визначити агента автоматизації браузера Browser Automation Agent використовує вищезгаданий інструмент Stagehand для автономного керування браузером і виконання планів. Перевірте 👇 це
5️⃣ Визначте синтезатор реакції Synthesis Agent діє як остаточний контроль якості, уточнюючи вихідні дані з агента автоматизації браузера для отримання відшліфованої відповіді. Перевірте 👇 це
6️⃣ Створення агентного потоку CrewAI Нарешті, ми підключаємо наших агентів у робочий процес за допомогою CrewAI Flows. Перевірте це 👇
Зробити! Давайте подивимося на наш робочий процес автоматизації браузера з багатьма агентами в дії! 🚀 Перевірте це 👇
Ви можете знайти весь код і все, що вам потрібно, у репозиторії GitHub, опублікованому нижче. Перевірте 👇 це
Підбиваючи підсумки, наведемо огляд системи для довідки: - Користувач вводить запит на автоматизацію. - Planner Agent створює план автоматизації. - Агент автоматизації браузера виконує його за допомогою інструменту Stagehand. - Агент реагування генерує відповідь. Перевірте це👇
Якщо ви вважаєте її корисною, надішліть запит у свою мережу. Знайди мене → @akshay_pachaar ✔️ Щоб отримати більше інформації та навчальних посібників про LLM, агентів штучного інтелекту та машинне навчання!
Akshay 🚀
Akshay 🚀10 серп., 20:51
Давайте створимо агента автоматизації браузера за допомогою gpt-oss (100% локально):
87,02K