Risultati di GPT-5! + Aggiornamento sulla scrittura lunga: ho aggiunto nuove istruzioni per aiutare il giudice a notare e punire l'uso eccessivo di metafore incoerenti, e ho ripetuto la classifica. Stava diventando un problema con molti modelli all'avanguardia che convergevano su questo scempio. Alcuni cambiamenti di posizione; ora Opus 4.1 è al #1
9,13K