Existuje nějaké hřiště nebo ekvivalent pro sledování používání nástroje / agentního výkonu různých modelů? Chci mu v podstatě dát 5 nástrojů a můj obvyklý podnět A hřiště generuje ~5-10 případů a spouští všechny vybrané modely A pak pozoruji+změna modelu, výzva
4,6K