3 thực hành tốt nhất để viết đánh giá AI: 1. Cân bằng giữa tốc độ và độ chính xác Bắt đầu với một tá trường hợp thử nghiệm và lặp lại từ đó. Đừng xây dựng hàng trăm khi bạn vẫn đang thực hiện những thay đổi lớn về prompt. Xác định và khắc phục các chế độ thất bại lớn nhất, sau đó mở rộng phạm vi. 2. Ám ảnh về tiêu chí đánh giá và nhãn thủ công Tiêu chí đánh giá và tập dữ liệu vàng của bạn là nền tảng của mọi thứ khác. Không có cách nào để tránh công việc thủ công này trong bảng tính - hãy ám ảnh về việc làm cho nhãn của bạn tốt. 3. Đừng mở rộng thẩm phán LLM quá sớm Hướng tới ~80% sự đồng thuận giữa thẩm phán LLM của bạn và những người gán nhãn thủ công trước khi mở rộng. Kiểm tra kết quả thường xuyên - đừng giả định rằng nó luôn đúng. Ngày mai, tôi sẽ chia sẻ một hướng dẫn cho người mới bắt đầu về đánh giá AI mà đi qua một ví dụ từng bước mà bất kỳ ai cũng có thể theo dõi. 📌 Đăng ký để nhận nó trong hộp thư đến của bạn: (P.S. Đây là cách tôi tưởng tượng một thẩm phán LLM trông như thế nào)
4,72K