Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Saya telah melihat banyak orang berbicara tentang bagaimana mereka menemukan GPT-5 sebagai langkah lebih rendah dari model sebelumnya. Saya tidak bisa berbicara tentang pengalaman mereka, tetapi pengalaman saya sendiri adalah sebaliknya.
Kemarin saya meminta GPT-5 Thinking merancang bahasa khusus domain yang rumit untuk saya untuk menentukan semantik instruksi mesin di CPU. (Tujuan dari hal ini adalah untuk mempermudah pembuatan dan pemeliharaan emulator untuk komputer lama, yang merupakan hobi saya.)
LLM tidak sempurna tetapi melakukan pekerjaan yang sangat baik dan menunjukkan kreativitas nyata dalam tugas itu. DSL yang dihasilkan sangat baik dan akan membutuhkan banyak pekerjaan jika saya melakukannya dengan tangan. Saya belum sepenuhnya selesai bekerja dengan LLM pada spesifikasi, tetapi ketika saya melakukannya, saya menduga bahwa itu akan dapat menembak sebagian besar kompiler.
Mungkin bagi sebagian orang hal itu bekerja dengan buruk; Saya tidak tahu apa yang mereka coba lakukan. Saya juga tidak dapat berbicara dengan selera mereka tentang hal-hal seperti "kepribadian", dan selain itu, prompt sistem saya secara implisit meminta model untuk menjadi sangat profesional dan hambar. (Saya juga tidak tertarik pada AI yang memberi saya persahabatan atau dukungan emosional dan tidak ingin memiliki hubungan parasosial dengannya.)
Bagi saya, itu tentu saja melakukan pekerjaan yang sangat baik, dan pada tugas teknis yang sangat rumit.
Perhatikan bahwa saya memahami pekerjaan yang saya minta sistem untuk dilakukan dengan sangat baik, saya berada dalam posisi untuk menangkap kesalahan yang dibuatnya dan memperbaikinya, dan saya menganggap pekerjaan yang 95% selesai setelah beberapa iterasi menjadi hasil yang sangat baik karena saya dapat memperbaiki sisanya.
Mungkin jika Anda mencoba untuk membuat sesuatu yang ditemui dengan desain sirkuit yang berfungsi dan Anda tidak tahu teknik elektro, hal itu masih tidak melakukan apa yang Anda inginkan. Namun, bagi saya, ini adalah alat yang luar biasa, dan merupakan peningkatan yang berbeda dibandingkan o3.
Saya melihat banyak keluhan tentang kepribadian yang "seperti sekretaris yang terlalu banyak bekerja", dan saya belum pernah mengalami hal seperti itu, tetapi sekali lagi, saya menggunakan prompt sistem dan tampaknya kebanyakan orang tidak, dan saya tidak pernah menggunakan model non-penalaran, dan tampaknya kebanyakan orang hanya menggunakan versi model non-penalaran.
42,46K
Teratas
Peringkat
Favorit