Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
AI di Olimpiade Matematika: Era Baru Pemecahan Masalah Matematika
IMO telah lama menjadi kompetisi matematika terberat di dunia untuk siswa terbaik.
Sekarang, itu juga menjadi tolok ukur untuk penalaran AI. 👇
Tahun ini menandai tonggak sejarah:
Model AI dari Google DeepMind dan OpenAI mencapai kinerja medali emas pada masalah IMO — level yang sama dengan kontestan manusia teratas.
Lompatan sejati dalam kemampuan AI untuk bernalar melalui matematika abstrak.
Garis Waktu Peristiwa:
> Jumat: Berita bocor tentang kinerja medali emas DeepMind
> Sabtu 1 pagi: OpenAI mengumumkan hasil menjelang konfirmasi resmi
> Senin: DeepMind secara resmi mengkonfirmasi status medali emas dengan solusi elegan yang sepenuhnya diverifikasi oleh pejabat IMO. Solusi mereka lebih elegan & diperiksa secara ketat
Pergeseran Teknologi dari 2024 ke 2025
Tahun lalu: Model AI seperti AlphaGeometry membutuhkan terjemahan domain (Lean, dll.) + komputasi 2-3 hari.
Tahun ini: Model Gemini & OpenAI memecahkan masalah secara end-to-end dalam bahasa alami, dalam batas IMO 4,5 jam.
Perbedaan Gaya
Jawaban OpenAI:
> Suara logis, tapi berantakan
> Kurang struktur, istilah yang terlalu sering digunakan seperti "terlarang"
> 400+ baris untuk beberapa masalah
> Tidak dapat dibaca manusia
Bukti Gemini:
> Elegan dan jelas, penilai IMO mengatakan mereka "mudah diikuti"
> Bisa lulus sebagai tulisan manusia
Soal 2 (Geometri) menunjukkan celah:
OpenAI menggunakan geometri koordinat brute-force → bukti 442 baris yang benar namun kikuk
Gemini DeepMind menggunakan pengejaran sudut & teorema Sylvester → solusi ringkas dan berwawasan luas yang mencerminkan manusia yang terampil.
Mengapa Gemini Berhasil
> Pemikiran paralel: Menjelajahi beberapa jalur solusi secara bersamaan
> Teknik pembelajaran penguatan baru yang meningkatkan penalaran multi-langkah
> Akses ke solusi matematika yang dikuratori dengan cermat dan petunjuk strategis
Pendekatan OpenAI?
Penskalaan komputasi RL + waktu pengujian tujuan umum.
Apa Artinya Ini
Memecahkan masalah IMO sangat mengesankan, tetapi matematika nyata lebih dalam:
> Penalaran abstrak
> Pembuatan konsep
> Intuisi penelitian
Kami belum sampai di sana—tetapi ini adalah langkah maju yang nyata.
Untuk benar-benar mendorong kemampuan matematika AI ke depan, kita memerlukan:
> Fungsi hadiah terperinci
> Pipa RL khusus
> Atau mungkin... teknik wildcard yang tidak ada yang melihat datang
Saat AI mendorong ke dalam matematika, sains, dan penelitian — kebutuhan akan komputasi meledak.
Itulah sebabnya akses ke infrastruktur GPU yang terjangkau dan dapat diskalakan sangat penting.
Mari kita buat masa depan itu dapat diakses oleh semua orang.
Lihat blog lengkapnya di sini:
Podcast lengkap kami dengan Ruang Laten di sini:
1,04K
Teratas
Peringkat
Favorit