GPT-5 被宣傳為減少幻覺,看來它確實做到了。99.5 -> 99.9 是減少了 80% 的錯誤。 我不知道為什麼人們沒有對此大驚小怪。幻覺是大型語言模型最大的問題,有些人認為這是無法解決的。
OpenRouter
OpenRouter8月15日 00:29
經過一週,GPT-5 在我們專有模型的工具調用準確率排行榜上名列第一🥇 第二名是 Claude 4.1 Opus,準確率為 99.5% 詳情 👇
135.35K