No incluso bronce: Evaluando LLMs en la Olimpiada Internacional de Matemáticas 2025 🥉 Buen artículo del equipo detrás de MathArena: Evaluando LLMs en Competencias Matemáticas No Contaminadas () proporcionando un análisis independiente del rendimiento de LLM en la OIM.
Parece que una versión avanzada de Gemini con Deep Think acaba de resolver 5 de los 6 problemas de la OMI, ganando 35 puntos en total y logrando oficialmente un rendimiento de nivel de medalla de oro. Felicitaciones por el logro @lmthang❗️ No puedo esperar para jugar con este modelo
42,68K