Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Noen som prøver denne agentiske langkonteksttenkeren LLM fra ByteDance? 👀
Eller er hypen rundt kinesiske modeller med åpen kildekode nede?
36B Instruksjons- og Base-modeller (til og med base uten syntetiske data) med noen flotte (SOTA?) benker 🤔
Vi skal dekke morgendagen på @thursdai_pod


21. aug., 04:02
ByteDance lanserer Seed-OSS (Apache-2.0): åpen LLM-serie (12T-tokens) optimalisert for 512K ctx, resonnement, agentoppgaver, i18n (internasjonal bruk). Utgivelsen inkluderer Seed-OSS-36B-Base (uten syntetiske data) og Seed-OSS-36B-Instruct
- Bue: 36B params, 64L, skjult 5120, vokab 155K, GQA (80/8/8, hode 128), SwiGLU, RMSNorm, RoPE base 1e7
- Tenkebudsjett: Kontrollresonnementets lengde (multipler av 512), CoT selvrefleksjon, 0 = direkte svar, standard = ubegrenset
36B-base (med / vs uten syn.)
- MMLU-Pro 65.1 / 60.4 | MMLU 84.9 / 84.8 | TriviaQA 82.1 / 81.9 | GPQA-D 31.7 / 35.2
- BBH 87.7 / 87.2 | AGIEval-no 70.7 / 70.1
- GSM8K 90.8 / 90.3 | MATH 81.7 SOTA / 61.3
- MBPP 80.6 / 74.6 | HumanEval 76.8 / 75.6
36B-instruksjon
- MMLU-Pro 82.7 | MMLU 87.4 | GPQA-D 71.4 | SuperGPQA 55.7
- AIME24 91.7 SOTA | AIME25 84.7 | BeyondAIME 65
- ArcAGI V2 40.6 | KORBench 70.6
- LiveCodeBench v6 67.4 SOTA | HLE 10.1
- IFEval 85.8 | TAU1-Detaljhandel 70.4 SOTA | TAU1-Flyselskap 46
- SWE-Bench Verifisert 56 SOTA | Multi-SWE-Benk 17
- MMMLU 78.4 | LINJAL (128K) 94.6 SOTA | LUFTBENK 75.6
Slutning: Transformatorer, vLLM (≥0.10.0), FlashAttention2, 4/8-bits kvantisering

3,04K
Topp
Rangering
Favoritter