トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤖OptimalThinkingBench 🤖の紹介
📝:
- 思考する LLM は多くのトークンを使用し、考えすぎます。思考しない LLM は過小評価し、パフォーマンスが低くなっています。
- 最適な組み合わせを見つけるためにモデルをスコアリングするベンチマークを導入します。
- OptimalThinkingBench は、OverThinkingBench (72 のドメインでの単純なクエリ) と UnderThinkingBench (11 の挑戦的な推論タスク) を混合して F1 スコアを報告します。
- 33 の異なる SOTA モデルを評価し、改善が必要であることがわかりました。
🧵1/5

61.12K
トップ
ランキング
お気に入り