Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
À mon avis, SWE-bench et T-bench sont les rares benchmarks qui ont un bon signal en termes de progrès que nous réalisons avec les modèles. Ce modèle fonctionne aussi bien que Qwen3 Coder et est seulement 10 % moins performant que GPT-5, tout en étant un LLM polyvalent plutôt que spécialisé dans le code.

11 août, 11:43
Présentation du rapport technique GLM-4.5 !👇
Ce travail démontre comment nous avons développé des modèles qui excellent dans le raisonnement, le codage et les tâches agentiques grâce à un paradigme d'entraînement unique en plusieurs étapes.
Les innovations clés incluent l'itération de modèles experts avec auto-distillation pour unifier les capacités, un mode de raisonnement hybride pour la résolution dynamique de problèmes, et un curriculum d'apprentissage par renforcement basé sur la difficulté.

28,61K
Meilleurs
Classement
Favoris