Goldmedaille-niveau Leistung bei der Internationalen Mathematik-Olympiade 2025 von unserem neuesten experimentellen reasoning LLM. Das Modell arbeitete in natürlicher Sprache (d.h. gibt Beweise in natürlicher Sprache aus) unter denselben Regeln wie Menschen (z.B. 4,5 Stunden pro Sitzung, keine Werkzeuge). Erstaunlicher Meilenstein!
Alexander Wei
Alexander Wei19. Juli 2025
1/N Ich freue mich, Ihnen mitteilen zu können, dass unser neuestes @OpenAI LLM für experimentelles Denken eine langjährige große Herausforderung in der KI erreicht hat: Leistungen auf Goldmedaillenniveau beim prestigeträchtigsten Mathematikwettbewerb der Welt – der Internationalen Mathematikolympiade (IMO).
Das Bemerkenswerteste ist, dass dieses System einen sehr allgemeinen Ansatz verwendet, der auf Verstärkungslernen und der Skalierung der Rechenleistung zur Testzeit basiert:
Alexander Wei
Alexander Wei19. Juli 2025
Neben dem Ergebnis selbst bin ich begeistert von unserem Ansatz: Wir erreichen dieses Fähigkeitsniveau nicht durch enge, aufgabenbezogene Methodik, sondern indem wir Neuland im allgemeinen Verstärkungslernen und in der Skalierung der Rechenleistung zur Testzeit betreten.
122,09K