Slipper litt bonusinnhold relatert til vår "full-stack"-fortreffelighet 😁 Vi presenterte nylig på @COLM_conf 2025 i Montréal – i samarbeid med @Princeton og @UTAustin – som fremmer langsiktig resonnement, koordinering av flere agenter og sosial strategi. SPIN-Bench er en enhetlig målestokk for strategisk planlegging, interaksjon og forhandling, som spenner over PDDL-planlegging, konkurranse-/samarbeidsspill og forhandlinger i diplomatisk stil. 🧵 Dykk dypere for å finne ut hvorfor vi bygde SPIN-Bench og hvordan det fremmer grensesprengende AI-resonnement.