AI di Olimpiade Matematika: Era Baru Pemecahan Masalah Matematika IMO telah lama menjadi kompetisi matematika terberat di dunia untuk siswa terbaik. Sekarang, itu juga menjadi tolok ukur untuk penalaran AI. 👇
Tahun ini menandai tonggak sejarah: Model AI dari Google DeepMind dan OpenAI mencapai kinerja medali emas pada masalah IMO — level yang sama dengan kontestan manusia teratas. Lompatan sejati dalam kemampuan AI untuk bernalar melalui matematika abstrak.
Garis Waktu Peristiwa: > Jumat: Berita bocor tentang kinerja medali emas DeepMind > Sabtu 1 pagi: OpenAI mengumumkan hasil menjelang konfirmasi resmi > Senin: DeepMind secara resmi mengkonfirmasi status medali emas dengan solusi elegan yang sepenuhnya diverifikasi oleh pejabat IMO. Solusi mereka lebih elegan & diperiksa secara ketat
Pergeseran Teknologi dari 2024 ke 2025 Tahun lalu: Model AI seperti AlphaGeometry membutuhkan terjemahan domain (Lean, dll.) + komputasi 2-3 hari. Tahun ini: Model Gemini & OpenAI memecahkan masalah secara end-to-end dalam bahasa alami, dalam batas IMO 4,5 jam.
Perbedaan Gaya Jawaban OpenAI: > Suara logis, tapi berantakan > Kurang struktur, istilah yang terlalu sering digunakan seperti "terlarang" > 400+ baris untuk beberapa masalah > Tidak dapat dibaca manusia Bukti Gemini: > Elegan dan jelas, penilai IMO mengatakan mereka "mudah diikuti" > Bisa lulus sebagai tulisan manusia
Soal 2 (Geometri) menunjukkan celah: OpenAI menggunakan geometri koordinat brute-force → bukti 442 baris yang benar namun kikuk Gemini DeepMind menggunakan pengejaran sudut & teorema Sylvester → solusi ringkas dan berwawasan luas yang mencerminkan manusia yang terampil.
Mengapa Gemini Berhasil > Pemikiran paralel: Menjelajahi beberapa jalur solusi secara bersamaan > Teknik pembelajaran penguatan baru yang meningkatkan penalaran multi-langkah > Akses ke solusi matematika yang dikuratori dengan cermat dan petunjuk strategis
Pendekatan OpenAI? Penskalaan komputasi RL + waktu pengujian tujuan umum.
Apa Artinya Ini Memecahkan masalah IMO sangat mengesankan, tetapi matematika nyata lebih dalam: > Penalaran abstrak > Pembuatan konsep > Intuisi penelitian Kami belum sampai di sana—tetapi ini adalah langkah maju yang nyata.
Untuk benar-benar mendorong kemampuan matematika AI ke depan, kita memerlukan: > Fungsi hadiah terperinci > Pipa RL khusus > Atau mungkin... teknik wildcard yang tidak ada yang melihat datang
Saat AI mendorong ke dalam matematika, sains, dan penelitian — kebutuhan akan komputasi meledak. Itulah sebabnya akses ke infrastruktur GPU yang terjangkau dan dapat diskalakan sangat penting. Mari kita buat masa depan itu dapat diakses oleh semua orang.
Lihat blog lengkapnya di sini:
Podcast lengkap kami dengan Ruang Laten di sini:
1,04K