Nawet nie brąz: ocena LLM na Międzynarodowej Olimpiadzie 🥉 Matematycznej 2025 Fajny wpis na blogu od zespołu stojącego za MathArena: Ocena LLM na nieskażonych zawodach matematycznych () zapewniający niezależną analizę wydajności LLM na IMO.
Wygląda na to, że zaawansowana wersja Gemini z Deep Think właśnie rozwiązała 5 z 6 problemów IMO, zdobywając łącznie 35 punktów i oficjalnie osiągając poziom złotego medalu. Gratulacje z osiągnięcia @lmthang❗️ Nie mogę się doczekać, aby pobawić się tym modelem.
42,63K