Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La reducción de alucinaciones es excelente, pero algunos de estos puntos de referencia parecen ser mejoras relativamente pequeñas en una comparación directa.
En Aider Polyglot, sin pensar, 5 es 0.9 puntos más alto que 4o.
En MMMU, 2.2 puntos más alto que 4o.

8 ago 2025
GPT-5 benchmarks just dropped
– much better at coding
– visual reasoning higher than human phds
– huge drop in hallucination
We'll see how these benchmarks play out, but they look crazy



¡Todavía emocionado de usarlo!
3.07K
Populares
Ranking
Favoritas

