Prestazione da medaglia d'oro all'Olimpiade Internazionale di Matematica 2025 dal nostro ultimo LLM di ragionamento sperimentale. Il modello ha operato in linguaggio naturale (cioè produce dimostrazioni in linguaggio naturale) secondo le stesse regole degli esseri umani (ad esempio, 4,5 ore per sessione, senza strumenti). Traguardo straordinario!
Alexander Wei
Alexander Wei19 lug 2025
1/N Sono entusiasta di condividere che il nostro ultimo @OpenAI ragionamento sperimentale LLM ha raggiunto una grande sfida di lunga data nell'intelligenza artificiale: prestazioni a livello di medaglia d'oro nella competizione matematica più prestigiosa del mondo: le Olimpiadi internazionali di matematica (IMO).
Ciò che è più notevole è che questo sistema utilizza un approccio molto generale, impiegando l'apprendimento per rinforzo e la scalabilità del calcolo durante il test:
Alexander Wei
Alexander Wei19 lug 2025
5/N Besides the result itself, I am excited about our approach: We reach this capability level not via narrow, task-specific methodology, but by breaking new ground in general-purpose reinforcement learning and test-time compute scaling.
122,12K