Non neanche di bronzo: Valutazione degli LLM alle Olimpiadi Internazionali di Matematica 2025 🥉 Bel post sul blog del team dietro MathArena: Valutazione degli LLM su competizioni matematiche incontaminate () che fornisce un'analisi indipendente delle prestazioni degli LLM all'IMO.
Sembra che una versione avanzata di Gemini con Deep Think abbia appena risolto 5 dei 6 problemi IMO, guadagnando 35 punti totali e raggiungendo ufficialmente prestazioni a livello di medaglia d'oro. Congratulazioni per il risultato @lmthang❗️ Non vedo l'ora di giocare con questo modello
42,72K