Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Niemand is voorbereid op wat dit Stanford-onderzoek onthult over multi-agent AI.
"Latente samenwerking in multi-agent systemen" toont aan dat agenten geen berichten, protocollen of expliciete instructies voor teamwork nodig hebben. Ze beginnen te coördineren binnen hun eigen verborgen representaties een volledige samenwerkingslaag die alleen in de latente ruimte bestaat.
En de gedragingen zijn krankzinnig:
• Agenten dragen taken stilletjes over op basis van wie beter is
• Rollen verschijnen uit het niets: leider, uitvoerder, ondersteuner
• Beleid encodeert signalen die nooit in acties verschijnen
• Teams passen zich aan nieuwe omgevingen aan zonder hertraining
• Samenwerking blijft stabiel, zelfs wanneer communicatie onmogelijk is
Het wildste detail:
Zelfs wanneer je alle kanalen voor communicatie verwijdert, blijven agenten samenwerken. De "teamwork" leeft niet in berichten. Het leeft in het netwerk.
Dit draait het hele multi-agent handboek om.
We hebben coördinatiemechanismen bovenop gebouwd…
terwijl de echte coördinatie eronder plaatsvindt.
Een nieuw tijdperk van opkomende teamintelligentie ontvouwt zich — en het gebeurt op de plaatsen waar we zelfs niet keken.
Project: github. com/Gen-Verse/LatentMAS

137,51K
DeepSeek heeft net de soort upgrade uitgevoerd die elk redeneermodel heeft gedaan alsof het die had.
In plaats van een lange keten van gedachten te dumpen en te hopen dat het logisch is, voert DeepSeek Math V2 een volledige ondervraging uit op zijn eigen logica. Het bouwt een bewijs, valt het aan, controleert de aanval, controleert de controleur, repareert de fouten en herhaalt dit totdat het zichzelf niet meer kan breken.
Dat enkele idee heeft de prestaties volledig veranderd.
Hier is wat dat niveau van zelfonderzoek heeft opgeleverd:
• Gouden niveau prestaties op IMO 2025
• Gouden niveau prestaties op CMO 2024
• 118/120 op Putnam 2024, de hoogste gerapporteerde score
• Betere resultaten dan GPT-5 Thinking en Gemini 2.5 Pro in de moeilijkste categorieën
Het geheim is niet schaal.
Het is de architectuur rond het model:
— een verifier die logische hiaten opspoort
— een meta-verifier die de verifier in twijfel trekt
— een bewijs-generator die is geconditioneerd om zwakke redeneringen te vermijden
— een lus die elke onderdeel van het systeem dwingt om scherper te worden
Het proces werkt als een molen:
- Produceer een bewijs
- Test het
- Test de tester
- Repareer de redenering
- Herhaal
Ze richtten zich op het echte probleem in wiskundige redenering: een model kan het juiste antwoord geven om de verkeerde redenen. Dus heeft DeepSeek een verifier getraind die redenering beoordeelt, niet resultaten.
Het wilde deel is wat er in de loop van de tijd gebeurt:
each cycle verbetert de kwaliteit van het bewijs van het model zelf zonder menselijke opruiming.
Het wordt beter omdat het weigert zijn eerste versie als correct te accepteren.
Dit is een nieuwe richting voor redeneermodellen.
Niet meer denken.
Beter denken.
Als je wilt begrijpen waar AI-redenering naartoe gaat, is dit paper een voorproefje van het volgende tijdperk.

19,78K
Ik lees dit rapport van Anthropic over het echte gebruik van Claude en de cijfers komen binnen als een baksteen.
Ze hebben 100.000 gesprekken geanalyseerd.
Hier is het deel dat me stopte:
De meeste taken die mensen aan Claude voorleggen, duren normaal gesproken ongeveer 90 minuten.
Met Claude worden diezelfde taken 80 procent sneller afgerond.
Dat is iemand die elke week uren bespaart zonder zelfs maar te proberen.
Dan gaat het rapport verder.
Als je deze winsten toepast op de Amerikaanse economie, verhogen de huidige modellen alleen al de arbeidsproductiviteit met 1,8 procent per jaar voor het komende decennium.
Bijna het dubbele van het recente tempo.
En dit omvat geen betere modellen.
Dit is gewoon hoe mensen Claude op dit moment al gebruiken.
Dit zou de eerste keer kunnen zijn dat we hard bewijs zien van wat AI doet binnen echte banen.
Stille verschuiving.
Massale impact.
Het gebeurt al.

2,99K
Boven
Positie
Favorieten

