Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La reducción de alucinaciones es excelente, pero algunos de estos puntos de referencia parecen ser mejoras relativamente pequeñas en una comparación directa.
En Aider Polyglot, sin pensar, 5 es 0.9 puntos más alto que 4o.
En MMMU, 2.2 puntos más alto que 4o.

8 ago, 01:12
Los benchmarks de GPT-5 acaban de salir
– mucho mejor en programación
– razonamiento visual más alto que el de los PhDs humanos
– gran disminución en las alucinaciones
Veremos cómo se desarrollan estos benchmarks, pero se ven increíbles



¡Todavía emocionado de usarlo!
3.04K
Populares
Ranking
Favoritas