Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Harmonic
Construyendo superinteligencia matemática
RECIÉN LLEGADO: El análisis revela que Putnam es 4 veces más fácil / requiere mucho menos razonamiento que la IMO.
La longitud media de la prueba de Aristóteles Lean4 para los 10 problemas de Putnam resueltos fue de ~250 líneas, en comparación con ~1000 en la OMI, una reducción del 75%.
Estamos explorando la aplicación de computación extendida a las otras dos (A5 y B4), para cuantificar con mayor precisión la dificultad relativa.
Algunas advertencias: ha habido mejoras en modelos y algoritmos desde el resultado de medalla de oro de Aristóteles en mi opinión, pero también la versión para consumidores disponible para el público es mucho más débil que la que se usó internamente para resolver los problemas de la IMO.
Como aficionados de Putnam, incluso nosotros debemos admitir — en mi opinión sigue siendo el rey. 👑

Harmonic11 dic, 06:56
ÚLTIMA HORA: La versión para consumidores de Aristóteles destroza a Putnam, resolviendo y verificando formalmente 10 de 12 problemas en @leanprover.
Enhorabuena al matemático aficionado @namrata_anand2, que utilizó la versión de Aristóteles para consumidores con una temprana publicación pública de los problemas. Parece que Aristóteles se los comió en el desayuno, resolviendo 10/12 de forma completamente autónoma.
Actualmente estamos investigando los archivos y compartiremos más detalles más adelante, pero hay dos cosas útiles que destacar ahora mismo:
▪️Estas parecen ser las primeras soluciones totalmente formalizadas a los problemas de Putnam de 2025 que se han hecho públicas.
▪️Todos estos usaban la interfaz de lenguaje natural recién lanzada, en la que Aristóteles recibía la pregunta en lenguaje natural, luego la autoformalizaba en una afirmación Lean4 y completaba la demostración, completamente autónoma sin ningún humano en el bucle. En el pasado, nos centramos en las capacidades de demostración de teoremas de última generación de Aristóteles, pero también se está volviendo bastante capaz de autoformalización.
Estamos entrando en un nuevo amanecer para la IA y las matemáticas. Despacio... ¡Y luego todo de golpe!
66.37K
ÚLTIMA HORA: La versión para consumidores de Aristóteles destroza a Putnam, resolviendo y verificando formalmente 10 de 12 problemas en @leanprover.
Enhorabuena al matemático aficionado @namrata_anand2, que utilizó la versión de Aristóteles para consumidores con una temprana publicación pública de los problemas. Parece que Aristóteles se los comió en el desayuno, resolviendo 10/12 de forma completamente autónoma.
Actualmente estamos investigando los archivos y compartiremos más detalles más adelante, pero hay dos cosas útiles que destacar ahora mismo:
▪️Estas parecen ser las primeras soluciones totalmente formalizadas a los problemas de Putnam de 2025 que se han hecho públicas.
▪️Todos estos usaban la interfaz de lenguaje natural recién lanzada, en la que Aristóteles recibía la pregunta en lenguaje natural, luego la autoformalizaba en una afirmación Lean4 y completaba la demostración, completamente autónoma sin ningún humano en el bucle. En el pasado, nos centramos en las capacidades de demostración de teoremas de última generación de Aristóteles, pero también se está volviendo bastante capaz de autoformalización.
Estamos entrando en un nuevo amanecer para la IA y las matemáticas. Despacio... ¡Y luego todo de golpe!

Namrata Anand11 dic, 06:27
Aristóteles de @HarmonicMath acertó 10 de 12 problemas en 7 horas en Putnam, la competición de matemáticas más dura del mundo para estudiantes de grado.
¿Cómo lo sé? Bueno, yo mismo ejecuté Aristotle a través de la API pública de Harmonic. ¡Y tardé unos 10 minutos en empezar y arrancar!
9 de cada 10 problemas se completaron en menos de 3 horas. La décima (B5) duró 7 horas, una hora más de lo que se les asigna a los concursantes.
Para los 10 problemas, di a Aristóteles las enunciaciones del problema en inglés — y autoformalizó las afirmaciones, las probó y produjo resultados verificados de forma autónoma, sin retroalimentación humana.
Como alguien que ama las matemáticas pero no es un experto, ¡es emocionante tener una herramienta tan poderosa al alcance de la mano! 1/
130.07K
Populares
Ranking
Favoritas