Model hakim yang diverifikasi secara formal dapat menyelesaikan pasar atau berfungsi sebagai sumber kebenaran dalam konteks lain. Ini memiliki implikasi yang mendalam --> 1. Luangkan waktu untuk membangun model hakim yang diperiksa dengan tepat (sebaiknya open source) untuk kasus penggunaan. 2. Rancang prompt yang sesuai, seperangkat alat+sumber yang dapat dipanggil, dan kondisi untuk "memicu penilaian". 3. Pastikan semuanya terlihat baik bagi semua pihak yang terlibat (atau mekanisme audit yang mereka setujui) 3. Kodifikasi semuanya dalam kontrak pintar dan terapkan. Setelah itu Anda menunggu "pemicu" dan, jika semuanya disepakati secara terbuka/transparan, hasilnya sulit untuk dibantah.
gensyn
gensyn27 Agu, 23.13
1/ Memperkenalkan Judge: Sistem evaluasi AI Gensyn yang dapat diverifikasi. Evaluator tradisional mengandalkan API tertutup - buram, diperbarui secara diam-diam, dan tidak mungkin direproduksi. Judge mengeksekusi model AI deterministik yang telah disepakati sebelumnya terhadap input dunia nyata dan berkomitmen untuk ditantang di depan umum.
2,8K