Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Harmonic
Membangun Kecerdasan Super Matematika
JUST IN: Analisis mengungkapkan Putnam 4X lebih mudah / membutuhkan penalaran yang jauh lebih sedikit daripada IMO.
Panjang bukti rata-rata Aristoteles Lean4 untuk 10 Masalah Putnam yang dipecahkan adalah ~250 baris, dibandingkan dengan ~1000 untuk IMO, pengurangan 75%.
Kami sedang mengeksplorasi penerapan komputasi yang diperluas ke dua lainnya (A5 dan B4), untuk mengukur kesulitan relatif dengan lebih tepat.
Beberapa peringatan: ada peningkatan model / algoritmik sejak hasil IMO tingkat medali emas Aristoteles, tetapi juga versi konsumen yang tersedia untuk publik jauh lebih lemah daripada yang digunakan secara internal untuk menjalankan masalah IMO.
Sebagai penggemar Putnam sendiri, bahkan kita harus mengakui - IMO masih menjadi raja. 👑

Harmonic11 Des, 06.56
BREAKING: Aristoteles versi konsumen menghancurkan Putnam, memecahkan dan memverifikasi masalah 10/12 secara resmi dalam @leanprover.
Selamat kepada matematikawan amatir @namrata_anand2, yang menggunakan versi Aristoteles kelas konsumen dengan rilis publik awal dari masalah tersebut. Tampaknya Aristoteles memakannya untuk sarapan, menyelesaikan 10/12 secara mandiri.
Saat ini kami sedang menggali file dan akan membagikan detail lebih lanjut nanti, tetapi dua hal berguna untuk ditunjukkan sekarang:
▪️Ini tampaknya menjadi solusi formal pertama untuk masalah Putnam 2025 yang dirilis secara publik.
▪️Ini semua menggunakan antarmuka bahasa alami yang baru-baru ini dirilis, di mana Aristoteles diberi makan pertanyaan dalam bahasa alami, kemudian memformalkannya secara otomatis menjadi pernyataan Lean4, dan kemudian menyelesaikan pembuktian, sepenuhnya mandiri tanpa manusia dalam lingkaran. Di masa lalu, kami telah berfokus pada kemampuan pembuktian teorema Aristoteles yang canggih, tetapi juga menjadi cukup mampu dalam autoformalisasi.
Kita memasuki fajar baru untuk AI dan matematika. Pelan-pelan... lalu sekaligus!
65,99K
BREAKING: Aristoteles versi konsumen menghancurkan Putnam, memecahkan dan memverifikasi masalah 10/12 secara resmi dalam @leanprover.
Selamat kepada matematikawan amatir @namrata_anand2, yang menggunakan versi Aristoteles kelas konsumen dengan rilis publik awal dari masalah tersebut. Tampaknya Aristoteles memakannya untuk sarapan, menyelesaikan 10/12 secara mandiri.
Saat ini kami sedang menggali file dan akan membagikan detail lebih lanjut nanti, tetapi dua hal berguna untuk ditunjukkan sekarang:
▪️Ini tampaknya menjadi solusi formal pertama untuk masalah Putnam 2025 yang dirilis secara publik.
▪️Ini semua menggunakan antarmuka bahasa alami yang baru-baru ini dirilis, di mana Aristoteles diberi makan pertanyaan dalam bahasa alami, kemudian memformalkannya secara otomatis menjadi pernyataan Lean4, dan kemudian menyelesaikan pembuktian, sepenuhnya mandiri tanpa manusia dalam lingkaran. Di masa lalu, kami telah berfokus pada kemampuan pembuktian teorema Aristoteles yang canggih, tetapi juga menjadi cukup mampu dalam autoformalisasi.
Kita memasuki fajar baru untuk AI dan matematika. Pelan-pelan... lalu sekaligus!

Namrata Anand11 Des, 06.27
Aristoteles dari @HarmonicMath mendapat 10/12 soal dalam waktu 7 jam di Putnam, kompetisi matematika sarjana tersulit di dunia!
Bagaimana saya tahu ini? Nah, saya menjalankan Aristoteles sendiri melalui API publik Harmonic. Dan saya membutuhkan waktu sekitar 10 menit untuk memulai dan memulainya!
9 dari 10 masalah diselesaikan dalam waktu kurang dari 3 jam. Yang kesepuluh (B5) memakan waktu 7 jam, satu jam lebih banyak dari yang dialokasikan kepada kontestan.
Untuk semua 10 masalah, saya memberi Aristoteles pernyataan masalah dalam bahasa Inggris - dan itu secara otomatis memformalkan pernyataan, membuktikannya, dan menghasilkan output terverifikasi secara mandiri, tanpa umpan balik manusia.
Sebagai seseorang yang menyukai matematika tetapi bukan seorang ahli, sangat menyenangkan memiliki alat sekuat ini di ujung jari saya! 1/
130,06K
Teratas
Peringkat
Favorit