Výkon na úrovni zlaté medaile na Mezinárodní matematické olympiádě 2025 z našeho nejnovějšího experimentálního uvažování LLM. Model provozovaný v přirozeném jazyce (tj. výstupem jsou korektury v přirozeném jazyce) podle stejných pravidel jako lidé (např. 4,5 hodiny na relaci, žádné nástroje). Úžasný milník!
Alexander Wei
Alexander Wei19. 7. 2025
1/N S potěšením se s vámi podělím o to, že naše nejnovější @OpenAI experimentální uvažování LLM dosáhlo dlouhodobé velké výzvy v oblasti umělé inteligence: výkonu na úrovni zlaté medaile na nejprestižnější matematické soutěži na světě – Mezinárodní matematické olympiádě (IMO).
Nejpozoruhodnější je, že tento systém používá velmi obecný přístup, který využívá zpětnovazební učení a škálování výpočtů testovacího času:
Alexander Wei
Alexander Wei19. 7. 2025
5/N Besides the result itself, I am excited about our approach: We reach this capability level not via narrow, task-specific methodology, but by breaking new ground in general-purpose reinforcement learning and test-time compute scaling.
122,12K