Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
O último blog de Nous sobre eficiência de desbaste entre modelos foi citado apenas dois dias após sua postagem 🤗
Confira esse blog aqui:


19 de ago., 10:15
🤖Apresentando o OptimalThinkingBench 🤖
📝:
- LLMs pensantes usam muitos tokens e pensam demais; LLMs que não pensam subestimam e têm um desempenho inferior.
- Apresentamos um benchmark que pontua os modelos na busca para encontrar a melhor combinação.
- O OptimalThinkingBench relata a pontuação F1 misturando OverThinkingBench (consultas simples em 72 domínios) e UnderThinkingBench (11 tarefas de raciocínio desafiadoras).
- Avaliamos 33 modelos SOTA diferentes e achamos que são necessárias melhorias!
🧵1/5

8,68K
Melhores
Classificação
Favoritos