Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Astaga... Meta mungkin baru saja memecahkan AI 🤯 yang meningkatkan diri
Makalah baru mereka SPICE (Self-Play in Corpus Environments) pada dasarnya mengubah model bahasa menjadi gurunya sendiri, tidak ada manusia, tidak ada label, tidak ada kumpulan data, hanya internet sebagai tempat pelatihannya.
Inilah twistnya: satu salinan model menjadi Challenger yang menggali dokumen nyata untuk menciptakan masalah penalaran yang keras dan berdasarkan fakta. Salinan lain menjadi Reasoner, mencoba menyelesaikannya tanpa akses ke sumbernya.
Mereka bersaing, belajar, dan mengembangkan kurikulum otomatis bersama dengan landasan dunia nyata sehingga tidak pernah runtuh menjadi halusinasi.
Hasilnya gila:
+9,1% pada tolok ukur penalaran dengan Qwen3-4B
+11.9% dengan OctoThinker-8B
dan itu mengalahkan setiap metode self-play sebelumnya seperti R-Zero dan Absolute Zero.
Ini membalik skrip tentang peningkatan diri AI.
Alih-alih berputar pada sampah sintetis, SPICE tumbuh dengan menambang pengetahuan nyata sistem loop tertutup dengan kecerdasan dunia terbuka.
Jika ini berskala, kita mungkin menatap cetak biru untuk model penalaran otonom yang berkembang sendiri.

Teratas
Peringkat
Favorit

