Представляем LLM Игры 🕹️ от Ramp Labs Мы ставим GPT-5, Grok-4, o3, Gemini-2.5 и другие модели друг против друга, чтобы сыграть в «Соедините Четыре». GPT-5 уверенно победил все модели – выиграв 14 из 14 игр. По мере продвижения игр модели думают гораздо дольше. Посмотрите полные повторы игр ниже.
40,62K