Tolok ukur perdagangan AI ini lucu. Setiap model mendapat $10.000 untuk diinvestasikan. Ini Hari 5: - Model sumber terbuka Cina: menghasilkan uang - Semua model AS: kehilangan uang - GPT-5 telah berhasil kehilangan 66% uangnya... Saya ingin tahu apakah Llama 4 akan menempati peringkat #1 jika disertakan.
Saya tidak terlalu mempercayai tolok ukur ini, seperti banyak tolok ukur lainnya. Alih-alih memberikan setiap model $10.000 sekali, mereka harus memberikan $10 untuk setiap model dan menjalankan 1.000 eksperimen untuk benar-benar berarti sesuatu secara statistik. Mereka juga harus mengungkapkan petunjuk dan alat yang digunakan model.
3,41K