Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤖Presentamos OptimalThinkingBench 🤖
📝:
- Los LLMs que piensan utilizan muchos tokens y piensan en exceso; los LLMs que no piensan piensan poco y rinden por debajo de lo esperado.
- Introducimos un benchmark que puntúa modelos en la búsqueda de la mejor combinación.
- OptimalThinkingBench informa la puntuación F1 combinando OverThinkingBench (consultas simples en 72 dominios) y UnderThinkingBench (11 tareas de razonamiento desafiantes).
- Evaluamos 33 modelos SOTA diferentes y encontramos que se necesitan mejoras!
🧵1/5

61,15K
Parte superior
Clasificación
Favoritos