Představujeme LLM hry 🕹️ od Ramp Labs Postavili jsme proti sobě modely GPT-5, Grok-4, o3, Gemini-2.5 a další, abychom si zahráli Connect Four. GPT-5 high rozdrtil všechny modely – vyhrál 14/14 her. Jak hry postupují, modely přemýšlejí mnohem déle. Podívejte se na kompletní záznamy zápasů níže.
24,23K