Czy istnieje jakiś plac zabaw lub jego odpowiednik, aby zobaczyć użycie narzędzi / wydajność agentów różnych modeli? Chcę zasadniczo podać 5 narzędzi i mój zwykły prompt A plac zabaw generuje ~5-10 przypadków i uruchamia wszystkie wybrane modele A potem obserwuję + zmieniam model, prompt
4,59K