Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Bartosz Naskręcki
Matematico | Vice-Preside @ Università Adam Mickiewicz di Poznań|Unire la matematica rigorosa con la programmazione e il ML|Appassionato di ciò che l'IA capisce davvero
Qui presento una completa auto-formalizzazione di un recente articolo di matematica (di nuovo!)
Barańczuk, Stefan. "Ridurre il numero di equazioni che definiscono un sottoinsieme dello spazio n su un campo finito." Annales de la Faculté des sciences de Toulouse : Mathématiques, ser. 6, vol. 33, no. 1 (2024): 177–182.
Ho trascorso alcuni giorni su questo progetto. Prima, ho eseguito Aristotle di @HarmonicMath, che in circa 15 ore ha completamente auto-formalizzato la dimostrazione. Poi, con l'ottimo aiuto di @PietroMonticone, sono riuscito a impostare una versione blueprint della dimostrazione. Questa è una versione in cui tutte le parti della documentazione in LaTeX diventano interattive e possono essere ispezionate e studiate. Possiamo vedere le dipendenze nella dimostrazione e studiare le loro relazioni.
Nella fase di post-elaborazione, ho anche utilizzato Grok Heavy e Codex CLI con GPT-5.2 in modalità xhigh per scrivere un'analisi riga per riga della dimostrazione formale. Questo è un grande aiuto per le persone che non sono programmatori professionisti di Lean 4. Puoi davvero interiorizzare tutti i passaggi della dimostrazione.
Voglio riassumere le mie impressioni e ciò che ho imparato da questa esperienza. @vladtenev @Leonard41111588 @HarmonicMath @llllvvuu @littmath @AlexKontorovich @jdlichtman @KenOno691 @CarinaLHong @gdb @hongyuan_mei




5
I documenti matematici necessitano di una validazione formale. Questo di solito viene fatto informalmente da un revisore. Ma cosa succederebbe se potessimo fare affidamento su qualcosa di più robusto come l'auto-formalizzazione in Lean 4, dove il ruolo del revisore sarebbe ridotto a un controllo meticoloso delle formulazioni delle definizioni e dei teoremi? La compilazione del codice generato automaticamente diventerebbe un certificato di prova. Questo è ciò che è accaduto in un progetto più lungo che ho fatto con Aristotele da @HarmonicMath.
Grazie a @PietroMonticone e @llllvvuu per aver aiutato con la configurazione del progetto. Qui presento un'auto-formalizzazione completa e corretta di un articolo del mio amico Stefan Barańczuk riguardo alle sequenze di divisibilità di Chebyshev. Il codice è di circa 5000 righe di Lean altamente non banale. Corregge tutte le incoerenze e le lacune nel documento principale (inclusa la dimostrazione di alcune proposizioni delegate).
Pubblicherò una serie di esperimenti di questo tipo, dimostrando che in alcune aree della matematica, inclusa la teoria dei numeri elementare, la combinatoria e l'analisi (tutte le cose coperte da Mathlib), non siamo lontani da un cambiamento massiccio nella documentazione della validità delle prove. Penso che quest'anno sarà frenetico!



43
Se fossi uno studente oggi, interagire con LLM all'avanguardia sembrerebbe quasi un imbroglio. Questa mattina ho scattato casualmente una foto della lavagna e ho chiesto a ChatGPT-5.2-Pro di spiegare il contesto, la soluzione e alcune osservazioni sul famoso teorema di Chevalley sui set costruttibili. Quello che ho ricevuto è stato un rapporto straordinariamente profondo, sintetizzando materiale di alta qualità sulla geometria algebrica tratto da tutto il web.
Questo solleva una domanda seria: qual è il vero sforzo e la sfida per gli studenti di oggi? Il costo è certamente un fattore, ma una volta che l'accesso a questi modelli è disponibile, come si dovrebbe imparare in questa terra di abbondanza, dove spiegazioni, riferimenti ed esplorazione interattiva sono tutti istantaneamente accessibili?
Forse la lotta non riguarda più l'ottenere informazioni o anche comprendere singoli argomenti, ma sviluppare un giudizio: sapere quali domande porre, quali spiegazioni fidarsi, come riconoscere la profondità rispetto alla plausibilità superficiale e come interiorizzare le idee piuttosto che consumarle semplicemente. In un ambiente in cui le risposte sono abbondanti, la vera difficoltà potrebbe risiedere nel formare il gusto, l'intuizione matematica e la capacità di navigare - piuttosto che affogare in - questo improvviso eccesso di conoscenza.



171
Principali
Ranking
Preferiti
