O GPT-5 foi anunciado como uma solução para reduzir alucinações e parece que está a cumprir. 99,5 -> 99,9 é 80% menos erros. Não sei por que as pessoas não estão a dar mais importância a isso. As alucinações são um dos maiores problemas dos LLMs e alguns pensavam que eram insolúveis.
OpenRouter
OpenRouter15/08, 00:29
Após uma semana, o GPT-5 liderou as nossas tabelas de modelos proprietários em precisão de chamadas de ferramentas🥇 Em segundo lugar está o Claude 4.1 Opus, com 99,5% Detalhes 👇
135,49K