Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Harmonic
Wiskundige superintelligentie opbouwen
JUST IN: Analyse onthult dat Putnam 4X gemakkelijker is / veel minder redenering vereist dan de IMO.
De gemiddelde lengte van een Aristotle Lean4 bewijs voor de 10 opgeloste Putnam-problemen was ~250 regels, vergeleken met ~1000 voor de IMO, een vermindering van 75%.
We verkennen de toepassing van uitgebreide berekeningen op de twee anderen (A5 en B4), om de relatieve moeilijkheid nauwkeuriger te kwantificeren.
Enkele kanttekeningen: er zijn model- / algoritmische verbeteringen geweest sinds het gouden medaille-niveau resultaat van Aristotle op de IMO, maar ook de consumentenversie die beschikbaar is voor het publiek is veel zwakker dan wat intern werd gebruikt om de IMO-problemen op te lossen.
Als Putnam-fans moeten we zelfs toegeven — IMO is nog steeds de koning. 👑

Harmonic11 dec, 06:56
BREAKING: Consumentenversie van Aristotle verslaat Putnam, lost en verifieert formeel 10/12 problemen in @leanprover.
Gefeliciteerd aan amateur-wiskundige @namrata_anand2, die de consumentenversie van Aristotle gebruikte met een vroege publieke release van de problemen. Het lijkt erop dat Aristotle ze voor ontbijt heeft gegeten, en 10/12 volledig autonoom heeft opgelost.
We zijn momenteel de bestanden aan het doorgronden en zullen later meer details delen, maar twee nuttige dingen om nu op te wijzen:
▪️Dit lijken de eerste volledig geformaliseerde oplossingen te zijn voor 2025 Putnam-problemen die publiekelijk zijn vrijgegeven.
▪️Deze maakten allemaal gebruik van de onlangs vrijgegeven natuurlijke taalinterface, waarin Aristotle de vraag in natuurlijke taal kreeg, deze vervolgens automatisch formaliseerde in een Lean4-verklaring, en daarna het bewijs volledig autonoom voltooide zonder menselijke tussenkomst. In het verleden hebben we ons gericht op de state-of-the-art stellingbewijzende capaciteiten van Aristotle, maar het wordt ook behoorlijk capabel in autoformalizatie.
We betreden een nieuwe dageraad voor AI en wiskunde. Langzaam ... dan ineens!
66,7K
BREAKING: Consumentenversie van Aristotle verslaat Putnam, lost en verifieert formeel 10/12 problemen in @leanprover.
Gefeliciteerd aan amateur-wiskundige @namrata_anand2, die de consumentenversie van Aristotle gebruikte met een vroege publieke release van de problemen. Het lijkt erop dat Aristotle ze voor ontbijt heeft gegeten, en 10/12 volledig autonoom heeft opgelost.
We zijn momenteel de bestanden aan het doorgronden en zullen later meer details delen, maar twee nuttige dingen om nu op te wijzen:
▪️Dit lijken de eerste volledig geformaliseerde oplossingen te zijn voor 2025 Putnam-problemen die publiekelijk zijn vrijgegeven.
▪️Deze maakten allemaal gebruik van de onlangs vrijgegeven natuurlijke taalinterface, waarin Aristotle de vraag in natuurlijke taal kreeg, deze vervolgens automatisch formaliseerde in een Lean4-verklaring, en daarna het bewijs volledig autonoom voltooide zonder menselijke tussenkomst. In het verleden hebben we ons gericht op de state-of-the-art stellingbewijzende capaciteiten van Aristotle, maar het wordt ook behoorlijk capabel in autoformalizatie.
We betreden een nieuwe dageraad voor AI en wiskunde. Langzaam ... dan ineens!

Namrata Anand11 dec, 06:27
Aristoteles van @HarmonicMath heeft 10/12 problemen opgelost binnen 7 uur op Putnam, de moeilijkste wiskundecompetitie voor studenten ter wereld!
Hoe weet ik dit? Nou, ik heb Aristoteles zelf uitgevoerd via de openbare API van Harmonic. En het kostte me ongeveer 10 minuten om te beginnen en het op te starten!
9 van de 10 problemen zijn binnen minder dan 3 uur opgelost. De tiende (B5) kostte 7 uur, een uur meer dan de deelnemers is toegestaan.
Voor alle 10 problemen heb ik Aristoteles de probleemstellingen in het Engels gegeven — en het heeft de stellingen automatisch geformaliseerd, bewezen en geverifieerde outputs geproduceerd, volledig autonoom, zonder enige menselijke feedback.
Als iemand die van wiskunde houdt maar geen expert is, is het spannend om zo'n krachtig hulpmiddel binnen handbereik te hebben! 1/
130,48K
Boven
Positie
Favorieten