¡Resultados de GPT-5! + Actualización de escritura en formato largo: Agregué nuevas instrucciones para ayudar al juez a notar y castigar el uso excesivo de metáforas incoherentes, y volví a ejecutar la tabla de clasificación. Se estaba convirtiendo en un problema con muchos modelos de frontera convergiendo en este desorden. Algunos cambios en el rango; ahora Opus 4.1 es el #1.
9.13K