DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Som jag ser det är SWE-bench och T-bench de få benchmarks som har en bra signal när det gäller hur långt vi kommit med modellerna. Den här modellen presterar lika bra som Qwen3 Coder och är bara 10 % sämre än GPT-5, samtidigt som den är en allmän LLM snarare än kodspecialiserad.

28,63K

Topp

Rankning

Favoriter