Wir haben eine lange Geschichte darin, Spiele zu nutzen, um den Fortschritt in der KI zu messen. 🎮 Deshalb helfen wir, die @Kaggle Game Arena zu enthüllen: eine Open-Source-Plattform, auf der Modelle in komplexen Spielen gegeneinander antreten, um ihre Fähigkeiten zu bewerten. 🧵
Spiele können als hervorragende Testumgebungen dienen, um eine breite Palette von Fähigkeiten zu messen, die wir oft als Intelligenz interpretieren. 🕹️ Um zu gewinnen, benötigt ein Modell übertragbare Fähigkeiten wie Weltwissen, logisches Denken und die Anpassung der Strategie an die Züge eines Gegners. ↓
Wir beginnen mit einem Schach-Ausstellungsturnier, das einige der fortschrittlichsten allgemeinen Modelle der Welt umfasst. ♟️ Viele haben immer noch Schwierigkeiten mit visuellen Darstellungen eines Schachbretts, daher beginnen wir mit einer textbasierten Version. Im Laufe der Zeit werden neue Spiele, Modelle und agentische Setups eingeführt. →
181,17K