Non neanche di bronzo: Valutazione degli LLM alle Olimpiadi Internazionali di Matematica 2025 🥉 Bel post sul blog del team dietro MathArena: Valutazione degli LLM su competizioni matematiche incontaminate () che fornisce un'analisi indipendente delle prestazioni degli LLM all'IMO.
It looks like an advanced version of Gemini with Deep Think just solved 5 out of the 6 IMO problems, earning 35 total points, and officially achieving gold-medal level performance. Congrats on the achievement @lmthang❗️ Can’t wait to play with this model
42,71K