Siapa yang memutuskan apakah model AI benar-benar bagus?
@gensynai baru saja meluncurkan Judge - sistem evaluasi AI pertama di mana Anda dapat menantang hasil yang dihasilkan AI di depan umum 🔥
Benang 🧵 👇
Judge lebih dari sekadar eval, ini adalah primitif untuk menyelesaikan ketidaksepakatan dunia nyata.
Masa depan kepercayaan adalah putusan AI yang transparan dan dapat diverifikasi.
Hakim mendemonstrasikan penyelesaian langsung sengketa dunia nyata menggunakan model AI yang telah dilakukan sebelumnya
kami mendemonstrasikannya hari ini dengan pasar prediksi melalui game pengungkapan progresif di Gensyn Testnet
di masa depan, umat manusia akan mengandalkan AI untuk menyelesaikan perselisihan, kontrak, pasar, dll