Saya mendapatkan game multi-agen saya dari 83% eksekusi yang berhasil menjadi sedikit di atas 92%. Peningkatan besar! Berikut adalah pelajaran terpenting yang saya pelajari: Pindahkan fungsionalitas sebanyak mungkin ke dalam alat dan biarkan LLM menggunakannya. Semakin sedikit LLM yang harus dilakukan, semakin baik. LLM jauh lebih baik dalam memutuskan alat mana yang akan digunakan daripada melakukan pekerjaan alat itu sendiri, bahkan ketika itu adalah pekerjaan sederhana. Saya mengurangi prompt 100 baris menjadi 25 baris dan 3 fungsi Python yang mengimplementasikan semua fungsionalitas. Kelemahannya adalah lebih banyak kode, tetapi keuntungannya adalah keandalan naik hampir 10%.