Kultamitalitason suoritus vuoden 2025 kansainvälisissä matematiikan olympialaisissa viimeisimmästä kokeellisesta päättelystä LLM. Malli toimii luonnollisella kielellä (eli tuottaa luonnollisen kielen todisteita) samoilla säännöillä kuin ihmiset (esim. 4,5 tuntia per istunto, ei työkaluja). Hämmästyttävä virstanpylväs!
Alexander Wei
Alexander Wei19.7.2025
1/N Olen innoissani voidessani kertoa, että uusin @OpenAI kokeellisen päättelyn LLM on saavuttanut pitkäaikaisen suuren haasteen tekoälyssä: kultamitalitason suorituksen maailman arvostetuimmassa matematiikkakilpailussa – kansainvälisissä matematiikan olympialaisissa (IMO).
Merkittävintä on, että tämä järjestelmä käyttää hyvin yleistä lähestymistapaa, jossa käytetään vahvistusoppimista ja testiaikalaskennan skaalausta:
Alexander Wei
Alexander Wei19.7.2025
5/N Besides the result itself, I am excited about our approach: We reach this capability level not via narrow, task-specific methodology, but by breaking new ground in general-purpose reinforcement learning and test-time compute scaling.
122,14K