Zbudujmy Agenta Automatyzacji Przeglądarki używając gpt-oss (100% lokalnie):
Przeglądarka jest wciąż najbardziej uniwersalnym interfejsem z 4,3 miliardami odwiedzanych stron każdego dnia! Oto szybka demonstracja, jak możemy to całkowicie zautomatyzować! Stos technologiczny: - @stagehanddev open-source AI do automatyzacji przeglądarek - @crewAIInc do orkiestracji - @ollama do uruchamiania gpt-oss Zaczynajmy!🚀
Przegląd systemu: - Użytkownik wprowadza zapytanie automatyzacji. - Agent planowania tworzy plan automatyzacji. - Agent automatyzacji przeglądarki wykonuje go za pomocą narzędzia Stagehand. - Agent odpowiedzi generuje odpowiedź. Teraz zanurzmy się w kod!
1️⃣ Zdefiniuj LLM Używamy trzech LLM: - LLM Planowania: Tworzy strukturalny plan dla zadania automatyzacji. - LLM Automatyzacji: Wykonuje plan za pomocą narzędzia Stagehand. - LLM Odpowiedzi: Syntetyzuje ostateczną odpowiedź. Sprawdź to 👇
2️⃣ Zdefiniuj Agenta Planowania Automatyzacji Agent planowania otrzymuje zadanie automatyzacji od użytkownika i tworzy uporządkowany układ do wykonania przez agenta przeglądarki. Sprawdź to 👇
3️⃣ Zdefiniuj narzędzie przeglądarki Stagehand Narzędzie CrewAI wykorzystuje AI do interakcji z stronami internetowymi. Wykorzystuje agentowe zdolności komputerowe Stagehand do autonomicznego nawigowania po URL-ach, wykonywania działań na stronach i wydobywania danych w celu udzielenia odpowiedzi na pytania. Sprawdź to 👇
4️⃣ Zdefiniuj Agenta Automatyzacji Przeglądarki Agent Automatyzacji Przeglądarki wykorzystuje wspomniane narzędzie Stagehand do autonomicznej kontroli przeglądarki i realizacji planu. Sprawdź to 👇
5️⃣ Zdefiniuj Agenta Syntezy Odpowiedzi Agent Syntezy działa jako ostateczna kontrola jakości, udoskonalając wyniki z agenta automatyzacji przeglądarki, aby wygenerować dopracowaną odpowiedź. Sprawdź to 👇
6️⃣ Utwórz Agentic Flow w CrewAI Na koniec łączymy nasze Agenty w ramach przepływu roboczego za pomocą CrewAI Flows. Sprawdź to 👇
Zrobione! Zobaczmy nasz wieloagentowy proces automatyzacji przeglądarki w akcji! 🚀 Sprawdź to 👇
Możesz znaleźć cały kod i wszystko, czego potrzebujesz w repozytorium GitHub udostępnionym poniżej. Sprawdź to 👇
Aby podsumować, oto przegląd systemu do Twojej wiadomości: - Użytkownik wprowadza zapytanie automatyzacji. - Agent planowania tworzy plan automatyzacji. - Agent automatyzacji przeglądarki wykonuje go za pomocą narzędzia Stagehand. - Agent odpowiedzi generuje odpowiedź. Sprawdź to👇
Jeśli uważasz go za wnikliwy, udostępnij go ponownie w swojej sieci. Znajdź mnie → @akshay_pachaar ✔️ Aby uzyskać więcej szczegółowych informacji i samouczków na temat LLM, agentów AI i uczenia maszynowego!
Akshay 🚀
Akshay 🚀10 sie, 20:51
Zbudujmy Agenta Automatyzacji Przeglądarki używając gpt-oss (100% lokalnie):
87,04K