Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Som jag ser det är SWE-bench och T-bench de få benchmarks som har en bra signal när det gäller hur långt vi kommit med modellerna. Den här modellen presterar lika bra som Qwen3 Coder och är bara 10 % sämre än GPT-5, samtidigt som den är en allmän LLM snarare än kodspecialiserad.

11 aug. 11:43
Vi presenterar den tekniska rapporten GLM-4.5! 👇
Detta arbete visar hur vi utvecklade modeller som utmärker sig vid resonemang, kodning och agentiska uppgifter genom ett unikt träningsparadigm i flera steg.
Viktiga innovationer inkluderar expertmodelliteration med självdestillation för att förena kapaciteter, ett hybridresonemangsläge för dynamisk problemlösning och en svårighetsbaserad läroplan för förstärkningsinlärning.

28,63K
Topp
Rankning
Favoriter