Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Personne n'est prêt pour ce que ce document de Stanford révèle sur l'IA multi-agents.
"Collaboration Latente dans les Systèmes Multi-Agents" montre que les agents n'ont pas besoin de messages, de protocoles ou d'instructions explicites de travail d'équipe. Ils commencent à se coordonner à l'intérieur de leurs propres représentations cachées, une couche de collaboration complète qui n'existe que dans l'espace latent.
Et les comportements sont fous :
• Les agents passent silencieusement des tâches en fonction de qui est le meilleur
• Des rôles apparaissent de nulle part : leader, exécutant, soutien
• Les politiques codent des signaux qui n'apparaissent jamais dans les actions
• Les équipes s'adaptent à de nouveaux environnements sans réentraînement
• La collaboration reste stable même lorsque la communication est impossible
Le détail le plus fou :
Même lorsque vous supprimez tous les canaux de communication, les agents coopèrent toujours. Le "travail d'équipe" ne vit pas dans les messages. Il vit dans le réseau.
Cela renverse complètement le manuel multi-agents.
Nous avons construit des mécanismes de coordination par-dessus…
pendant que la véritable coordination se produit en dessous.
Une nouvelle ère d'intelligence d'équipe émergente est en train de se déployer — et cela se passe dans des endroits où nous ne regardions même pas.
Projet : github. com/Gen-Verse/LatentMAS

30,18K
DeepSeek vient de réaliser le genre de mise à niveau que chaque modèle de raisonnement prétend avoir.
Au lieu de déverser une longue chaîne de pensées en espérant que cela ait du sens, DeepSeek Math V2 effectue une interrogation complète de sa propre logique. Il construit une preuve, l'attaque, vérifie l'attaque, vérifie le vérificateur, corrige les défauts, et boucle jusqu'à ce qu'il ne puisse plus se briser.
Cette idée unique a complètement changé ses performances.
Voici ce que ce niveau d'auto-scrutin a produit :
• Performance de niveau or sur l'IMO 2025
• Performance de niveau or sur le CMO 2024
• 118/120 sur le Putnam 2024, le score le plus élevé rapporté
• Meilleurs résultats que GPT-5 Thinking et Gemini 2.5 Pro dans les catégories les plus difficiles
Le secret n'est pas l'échelle.
C'est l'architecture autour du modèle :
— un vérificateur qui chasse les lacunes logiques
— un méta-vérificateur qui remet en question le vérificateur
— un générateur de preuves conditionné pour éviter le raisonnement faible
— une boucle qui force chaque partie du système à devenir plus précise
Le processus fonctionne comme un broyeur :
- Produire une preuve
- La tester
- Tester le testeur
- Réparer le raisonnement
- Répéter
Ils ont visé le véritable problème dans le raisonnement mathématique : un modèle peut donner la bonne réponse pour de mauvaises raisons. Ainsi, DeepSeek a formé un vérificateur qui évalue le raisonnement, pas les résultats.
La partie sauvage est ce qui se passe au fil du temps :
chaque cycle améliore la qualité de la preuve du modèle sans nettoyage humain.
Il s'améliore parce qu'il refuse d'accepter son premier brouillon comme correct.
C'est une nouvelle direction pour les modèles de raisonnement.
Pas plus de réflexion.
Mieux réfléchir.
Si vous voulez comprendre où le raisonnement de l'IA se dirige, cet article est un aperçu de la prochaine ère.

19,65K
Je lis ce rapport d'Anthropic sur l'utilisation réelle de Claude et les chiffres frappent comme une brique.
Ils ont analysé 100 000 conversations.
Voici la partie qui m'a arrêté :
La plupart des tâches que les gens confient à Claude prennent normalement environ 90 minutes.
Avec Claude, ces mêmes tâches se terminent 80 % plus rapidement.
C'est quelqu'un qui économise des heures chaque semaine sans même essayer.
Ensuite, le rapport va plus loin.
Si vous appliquez ces gains à l'économie américaine, les modèles d'aujourd'hui augmentent la productivité du travail de 1,8 % par an pour la prochaine décennie.
Presque le double du rythme récent.
Et rien de tout cela n'inclut de meilleurs modèles.
C'est juste la façon dont les gens utilisent déjà Claude en ce moment.
C'est peut-être la première fois que nous avons des preuves concrètes de ce que l'IA fait dans de vrais emplois.
Changement silencieux.
Impact massif.
Déjà en cours.

2,97K
Meilleurs
Classement
Favoris

