Jadi setelah bermain dengan ini hampir sepanjang hari, tidak ada yang bisa melakukannya (diharapkan) tetapi GPT5 melalui Codex menyerah banyak dan hanya akan mogok (contoh di bawah). Konon, yang akhirnya berhasil adalah meminta GPT5 membuat spesifikasi terperinci berdasarkan makalah arxiv dan kemudian meninjau kode opus
xjdr
xjdr10 Agu, 00.50
"Bagaimana Anda membandingkan model baru?"
Anda harus tahu apa yang Anda lakukan untuk mengarahkan lalu lintas dan saya harus membuat harness uji dan lulus kriteria sendiri, tetapi kekuatan mereka digabungkan membuat sesuatu yang menyaingi versi saya yang ada. tes awal yang cukup mengesankan jika saya jujur ...
23,87K