Złoty medal na Międzynarodowej Olimpiadzie Matematycznej 2025 dzięki naszemu najnowszemu modelowi LLM do rozumowania eksperymentalnego. Model działał w naturalnym języku (tj. generuje dowody w naturalnym języku) na tych samych zasadach co ludzie (np. 4,5 godziny na sesję, bez narzędzi). Niesamowity kamień milowy!
Alexander Wei
Alexander Wei19 lip 2025
1/N Cieszę się, że mogę podzielić się tym, że nasz najnowszy @OpenAI eksperymentalne rozumowanie LLM osiągnął wieloletnie wielkie wyzwanie w dziedzinie sztucznej inteligencji: złoty medal na najbardziej prestiżowym konkursie matematycznym na świecie - Międzynarodowej Olimpiadzie Matematycznej (IMO).
Najbardziej niezwykłe jest to, że ten system wykorzystuje bardzo ogólne podejście, stosując uczenie przez wzmocnienie i skalowanie obliczeń w czasie testu:
Alexander Wei
Alexander Wei19 lip 2025
5/N Besides the result itself, I am excited about our approach: We reach this capability level not via narrow, task-specific methodology, but by breaking new ground in general-purpose reinforcement learning and test-time compute scaling.
122,14K