GPT-5 được quảng cáo là giảm thiểu ảo giác và có vẻ như nó đã thực hiện được. 99.5 -> 99.9 là giảm 80% lỗi. Tôi không hiểu tại sao mọi người không làm lớn chuyện này hơn. Ảo giác là một trong những vấn đề lớn nhất của LLM và một số người nghĩ rằng chúng không thể giải quyết được.
OpenRouter
OpenRouter00:29 15 thg 8
Sau một tuần, GPT-5 đã đứng đầu bảng xếp hạng mô hình độc quyền của chúng tôi về độ chính xác khi gọi công cụ🥇 Đứng thứ hai là Claude 4.1 Opus, với 99.5% Chi tiết 👇
135,35K