GPT-5 fue anunciado como una solución para reducir las alucinaciones y parece que lo está logrando. 99.5 -> 99.9 es un 80% menos de errores. No sé por qué la gente no está haciendo un mayor escándalo sobre esto. Las alucinaciones son uno de los mayores problemas de los LLMs y algunos pensaban que eran insuperables.
OpenRouter
OpenRouter15 ago, 00:29
Después de una semana, GPT-5 ha liderado nuestras tablas de modelos propietarios en precisión de llamadas a herramientas🥇 En segundo lugar está Claude 4.1 Opus, con un 99.5% Detalles 👇
135,35K