Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Bartosz Naskręcki
Matematiker | Vicedekanus @ Adam Mickiewicz-universitetet i Poznań|Att överbrygga rigorös matematik med programmering &ML|Brinner för vad AI verkligen förstår
Här presenterar jag en fullständig autoformalisering av en nyligen publicerad matematikuppsats (igen!)
Barańczuk, Stefan. "Reducerar antalet ekvationer som definierar en delmängd av n-rummet över ett ändligt fält." Annales de la Faculté des sciences de Toulouse: Mathématiques, serie 6, vol. 33, nr 1 (2024): 177–182.
Jag har lagt några dagar på det här projektet. Först körde jag Aristoteles av @HarmonicMath , som på ungefär 15 timmar helt autoformaliserade beviset. Sedan, med stor hjälp av @PietroMonticone, lyckades jag sätta upp en ritningsversion av beviset. Detta är en version där alla delar av dokumentationen i LaTeX blir interaktiva och kan granskas och studeras. Vi kan se beroendena i beviset och studera deras relationer.
I efterbearbetningsfasen använde jag också Grok Heavy och Codex CLI med GPT-5.2 i xhigh-läge för att skriva en rad-för-rad-analys av det formella beviset. Detta är till stor hjälp för personer som inte är professionella Lean 4-programmerare. Du kan verkligen internalisera alla bevisens steg.
Jag vill sammanfatta mina intryck och vad jag lärde mig av denna erfarenhet. @vladtenev @Leonard41111588 @HarmonicMath @llllvvuu @littmath @AlexKontorovich @jdlichtman @KenOno691 @CarinaLHong @gdb @hongyuan_mei




7
Matematiska artiklar behöver formell validering. Detta görs vanligtvis informellt av en domare. Men tänk om vi kunde förlita oss på något mer robust som autoformalisering till Lean 4 där granskarens roll skulle reduceras till noggrann kontroll av formuleringarna av definitioner och satser? Kompilering av automatiskt genererad kod skulle bli ett beviscertifikat. Det här var vad som hände i en längre period som jag gjorde med Aristoteles av @HarmonicMath.
Tack till @PietroMonticone och @llllvvuu för hjälpen med installationen av ritningen. Här presenterar jag en fullständig korrekt autoformalisering av en artikel av min vän Stefan Barańczuk om Chebyshevs delbarhetssekvenser. Koden består av cirka 5000 rader av mycket icke-trivial Lean. Den rättar till alla inkonsekvenser och luckor i huvudartikeln (och bevisar till och med vissa delegerade påståenden).
Jag kommer att publicera en serie sådana experiment som visar att inom vissa områden av matematiken, inklusive elementär talteori, kombinatorik och analys (alla möjliga saker som Mathlib täcker), är vi inte långt ifrån en massiv förändring i dokumentationen av bevisens giltighet. Jag tror att det här kommer bli ett hektiskt år!



45
Om jag vore student idag skulle det nästan kännas som fusk att interagera med toppmoderna LLM:er. I morse tog jag slumpmässigt en bild av svarta tavlan och bad ChatGPT-5.2-Pro förklara sammanhanget, lösningen och några sidokommentarer om den berömda Chevalley-satsen om konstruerbara mängder. Det jag fick var en anmärkningsvärt djupgående rapport, som sammanfattade högkvalitativt material om algebraisk geometri hämtat från hela internet.
Detta väcker en allvarlig fråga: vad är den verkliga ansträngningen och utmaningen för studenter idag? Kostnaden är förstås en faktor, men när tillgång till dessa modeller väl är tillgänglig, hur ska man då lära sig i detta rikliga land, där förklaringar, referenser och interaktiv utforskning är omedelbart tillgängliga?
Kanske handlar kampen inte längre om att få information eller ens förstå enskilda argument, utan om att utveckla omdöme: att veta vilka frågor man ska ställa, vilka förklaringar man ska lita på, hur man känner igen djup kontra ytlig trovärdighet, och hur man internaliserar idéer istället för att bara konsumera dem. I en miljö där svaren finns gott om kan den verkliga svårigheten ligga i att forma smak, matematisk intuition och förmågan att navigera – snarare än att drunkna i – denna plötsliga överflöd av kunskap.



173
Topp
Rankning
Favoriter
