Gouden medaille-niveau prestaties op de Internationale Wiskunde Olympiade 2025 van ons nieuwste experimentele redeneermodel. Model werkte in natuurlijke taal (d.w.z. genereert natuurlijke taal bewijzen) onder dezelfde regels als mensen (bijv. 4,5 uur per sessie, geen hulpmiddelen). Geweldig mijlpaal!
Alexander Wei
Alexander Wei19 jul 2025
1/N Ik ben verheugd om te delen dat onze nieuwste @OpenAI experimentele redeneren LLM een al lang bestaande grote uitdaging in AI heeft bereikt: prestaties op gouden medailleniveau op 's werelds meest prestigieuze wiskundecompetitie - de Internationale Wiskunde Olympiade (IMO).
Wat het meest opmerkelijk is, is dat dit systeem een zeer algemene benadering gebruikt, met gebruik van versterkend leren en opschaling van de rekentijd tijdens tests:
Alexander Wei
Alexander Wei19 jul 2025
5/N Besides the result itself, I am excited about our approach: We reach this capability level not via narrow, task-specific methodology, but by breaking new ground in general-purpose reinforcement learning and test-time compute scaling.
122,14K