Prestasjoner på gullmedaljenivå på den internasjonale matematikkolympiaden 2025 fra vår siste eksperimentelle resonnement LLM. Modellen opererte i naturlig språk (dvs. sender ut bevis på naturlig språk) under de samme reglene som mennesker (f.eks. 4,5 timer per økt, ingen verktøy). Fantastisk milepæl!
Alexander Wei
Alexander Wei19. juli 2025
1/N Jeg er glad for å dele at vår siste @OpenAI eksperimentelle resonnement LLM har oppnådd en langvarig stor utfordring innen AI: gullmedaljenivå på verdens mest prestisjefylte matematikkkonkurranse – International Math Olympiad (IMO).
Det som er mest bemerkelsesverdig er at dette systemet bruker en veldig generell tilnærming, ved å bruke forsterkende læring og skalering av testtidsberegning:
Alexander Wei
Alexander Wei19. juli 2025
5/N Besides the result itself, I am excited about our approach: We reach this capability level not via narrow, task-specific methodology, but by breaking new ground in general-purpose reinforcement learning and test-time compute scaling.
122,13K