Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Onko kukaan kokeillut tätä ByteDancen agenttisen ajattelijan LLM:ää? 👀
Vai onko avoimen lähdekoodin kiinalaisten mallien ympärillä oleva hype vähentynyt?
36B Instruct and Based -mallit (jopa pohja ilman synteettistä dataa) hienoilla (SOTA?) penkeillä 🤔
Käsittelemme huomenna @thursdai_pod


21.8. klo 04.02
ByteDance julkaisee Seed-OSS:n (Apache-2.0): avoimen LLM-sarjan (12T-tokenit), jotka on optimoitu 512K ctx:lle, päättelylle, agenttitehtäville, i18n:lle (kansainvälinen käyttö). Julkaisu sisältää Seed-OSS-36B-Base (ilman synteettistä dataa) ja Seed-OSS-36B-Instruct
- Kaari: 36B parametrit, 64L, piilotettu 5120, sanasto 155K, GQA (80/8/8, pää 128), SwiGLU, RMSNorm, RoPE-kanta 1e7
- Ajattelubudjetti: Hallitse päättelyn pituutta (512:n kerrannaiset), CoT-itsereflektio, 0 = suorat vastaukset, oletus = rajoittamaton
36B-kanta (ilman syntiä)
- MMLU-Pro 65.1 / 60.4 | MMLU 84,9 / 84,8 | TriviaQA 82.1 / 81.9 | GPQA-D 31.7 / 35.2
- BBH 87,7 / 87,2 | AGIEval-fi 70.7 / 70.1
- GSM8K 90,8 / 90,3 | MATH 81.7 SOTA / 61.3
- MBPP 80,6 / 74,6 | HumanEval 76,8 / 75,6
36B-ohje
- MMLU-Pro 82.7 | MMLU 87,4 | GPQA-D 71.4 | SuperGPQA 55.7
- AIME24 91.7 SOTA | AIME25 84,7 | Beyond AIME 65
- ArcAGI V2 40.6 | KORBench 70,6
- LiveCodeBench v6 67.4 SOTA | HLE 10.1
- IFEval 85.8 | TAU1-Vähittäismyynti 70.4 SOTA | TAU1-lentoyhtiö 46
- SWE-penkki vahvistettu 56 SOTA | Multi-SWE-penkki 17
- MMMLU 78.4 | VIIVAIN (128K) 94.6 SOTA | AIR-penkki 75.6
Päättely: Muuntajat, vLLM (≥0.10.0), FlashAttention2, 4/8-bittinen kvantisointi

165
Johtavat
Rankkaus
Suosikit