Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Harmonic
Costruire la superintelligenza matematica
JUST IN: L'analisi rivela che il Putnam è 4 volte più facile / richiede molto meno ragionamento rispetto all'IMO.
La lunghezza media della prova di Aristotle Lean4 per i 10 problemi risolti del Putnam era di ~250 righe, rispetto a ~1000 per l'IMO, una riduzione del 75%.
Stiamo esplorando l'applicazione di calcoli estesi per gli altri due (A5 e B4), per quantificare più precisamente la difficoltà relativa.
Alcuni caveat: ci sono stati miglioramenti nei modelli / algoritmi da quando il risultato di Aristotle al livello di medaglia d'oro dell'IMO, ma anche la versione consumer disponibile al pubblico è molto più debole rispetto a quella utilizzata internamente per risolvere i problemi dell'IMO.
Essendo noi stessi fan del Putnam, dobbiamo ammettere che l'IMO è ancora il re. 👑

Harmonic11 dic, 06:56
ULTIME NOTIZIE: La versione consumer di Aristotle supera Putnam, risolvendo e verificando formalmente 10/12 problemi in @leanprover.
Congratulazioni all'amateur matematico @namrata_anand2, che ha utilizzato la versione consumer di Aristotle con una prima release pubblica dei problemi. Sembra che Aristotle li abbia mangiati a colazione, risolvendo 10/12 in modo completamente autonomo.
Attualmente stiamo esaminando i file e condivideremo ulteriori dettagli più tardi, ma ci sono due cose utili da sottolineare in questo momento:
▪️Questi sembrano essere i primi risultati completamente formalizzati ai problemi di Putnam 2025 rilasciati pubblicamente.
▪️Tutti hanno utilizzato l'interfaccia in linguaggio naturale recentemente rilasciata, in cui ad Aristotle è stata fornita la domanda in linguaggio naturale, poi l'ha autoformalizzata in una dichiarazione Lean4, e infine ha completato la dimostrazione, completamente autonomamente senza alcun intervento umano. In passato, ci siamo concentrati sulle capacità di dimostrazione teoretica all'avanguardia di Aristotle, ma sta diventando piuttosto capace anche nell'autoformalizzazione.
Stiamo entrando in una nuova era per l'AI e la matematica. Lentamente... poi tutto in una volta!
66,37K
ULTIME NOTIZIE: La versione consumer di Aristotle supera Putnam, risolvendo e verificando formalmente 10/12 problemi in @leanprover.
Congratulazioni all'amateur matematico @namrata_anand2, che ha utilizzato la versione consumer di Aristotle con una prima release pubblica dei problemi. Sembra che Aristotle li abbia mangiati a colazione, risolvendo 10/12 in modo completamente autonomo.
Attualmente stiamo esaminando i file e condivideremo ulteriori dettagli più tardi, ma ci sono due cose utili da sottolineare in questo momento:
▪️Questi sembrano essere i primi risultati completamente formalizzati ai problemi di Putnam 2025 rilasciati pubblicamente.
▪️Tutti hanno utilizzato l'interfaccia in linguaggio naturale recentemente rilasciata, in cui ad Aristotle è stata fornita la domanda in linguaggio naturale, poi l'ha autoformalizzata in una dichiarazione Lean4, e infine ha completato la dimostrazione, completamente autonomamente senza alcun intervento umano. In passato, ci siamo concentrati sulle capacità di dimostrazione teoretica all'avanguardia di Aristotle, ma sta diventando piuttosto capace anche nell'autoformalizzazione.
Stiamo entrando in una nuova era per l'AI e la matematica. Lentamente... poi tutto in una volta!

Namrata Anand11 dic, 06:27
Aristotele di @HarmonicMath ha risolto 10/12 problemi in 7 ore al Putnam, la competizione di matematica per laureati più difficile al mondo!
Come lo so? Beh, ho eseguito Aristotele io stesso tramite l'API pubblica di Harmonic. E ci sono voluti circa 10 minuti per iniziare e farlo partire!
9 problemi su 10 completati in meno di 3 ore. Il decimo (B5) ha richiesto 7 ore, un'ora in più rispetto al tempo assegnato ai concorrenti.
Per tutti e 10 i problemi, ho fornito ad Aristotele le enunciazioni dei problemi in inglese — e ha autoformalizzato le enunciazioni, le ha dimostrate e ha prodotto output verificati in modo autonomo, senza alcun feedback umano.
Essendo qualcuno che ama la matematica ma non è un esperto, è emozionante avere uno strumento così potente a portata di mano! 1/
130,07K
Principali
Ranking
Preferiti