Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
Niemand ist bereit für das, was dieses Stanford-Papier über Multi-Agenten-KI offenbart.
"Latente Zusammenarbeit in Multi-Agenten-Systemen" zeigt, dass Agenten keine Nachrichten, Protokolle oder expliziten Teamarbeitsanweisungen benötigen. Sie beginnen, innerhalb ihrer eigenen verborgenen Repräsentationen eine vollständige Zusammenarbeitsebene zu koordinieren, die nur im latenten Raum existiert.
Und die Verhaltensweisen sind verrückt:
• Agenten übergeben Aufgaben stillschweigend basierend darauf, wer besser ist
• Rollen erscheinen aus dem Nichts: Anführer, Ausführer, Unterstützer
• Richtlinien kodieren Signale, die niemals in Aktionen erscheinen
• Teams passen sich neuen Umgebungen an, ohne neu trainiert zu werden
• Zusammenarbeit bleibt stabil, selbst wenn Kommunikation unmöglich ist
Das wildeste Detail:
Selbst wenn man alle Kommunikationskanäle entfernt, kooperieren die Agenten weiterhin. Die "Teamarbeit" lebt nicht in Nachrichten. Sie lebt im Netzwerk.
Das kehrt das gesamte Multi-Agenten-Spielbuch um.
Wir haben Koordinationsmechanismen darüber aufgebaut…
während die echte Koordination darunter stattfindet.
Eine neue Ära der emergenten Teamintelligenz entfaltet sich – und sie geschieht an Orten, an denen wir nicht einmal geschaut haben.
Projekt: github. com/Gen-Verse/LatentMAS

678
DeepSeek hat gerade das geschafft, was jedes Denkmodell vorgetäuscht hat.
Anstatt eine lange Kette von Gedanken auszugeben und zu hoffen, dass sie Sinn macht, führt DeepSeek Math V2 eine vollständige Überprüfung seiner eigenen Logik durch. Es erstellt einen Beweis, greift ihn an, überprüft den Angriff, überprüft den Überprüfer, behebt die Mängel und wiederholt den Vorgang, bis es sich nicht mehr selbst brechen kann.
Diese eine Idee hat die Leistung komplett verändert.
Hier ist, was dieses Niveau der Selbstprüfung produziert hat:
• Gold-Level-Leistung bei IMO 2025
• Gold-Level-Leistung bei CMO 2024
• 118/120 bei Putnam 2024, die höchste gemeldete Punktzahl
• Bessere Ergebnisse als GPT-5 Thinking und Gemini 2.5 Pro in den schwierigsten Kategorien
Das Geheimnis ist nicht die Skalierung.
Es ist die Architektur rund um das Modell:
— ein Verifier, der logische Lücken aufspürt
— ein Meta-Verifier, der den Verifier in Frage stellt
— ein Beweisgenerator, der darauf konditioniert ist, schwaches Denken zu vermeiden
— eine Schleife, die jeden Teil des Systems schärfer macht
Der Prozess läuft wie ein Schleifgerät:
- Einen Beweis erstellen
- Testen
- Den Tester testen
- Das Denken reparieren
- Wiederholen
Sie haben sich mit dem eigentlichen Problem im mathematischen Denken beschäftigt: Ein Modell kann die richtige Antwort aus den falschen Gründen finden. Daher hat DeepSeek einen Verifier trainiert, der das Denken bewertet, nicht die Ergebnisse.
Das Verrückte ist, was im Laufe der Zeit passiert:
ein jeder Zyklus verbessert die Beweisqualität des Modells ohne menschliche Nachbearbeitung.
Es wird besser, weil es sich weigert, seinen ersten Entwurf als korrekt zu akzeptieren.
Dies ist eine neue Richtung für Denkmodelle.
Nicht mehr Denken.
Besseres Denken.
Wenn Sie verstehen möchten, wohin die KI-Argumentation führt, ist dieses Papier ein Vorgeschmack auf die nächste Ära.

19,31K
Ich lese gerade diesen Bericht von Anthropic über die tatsächliche Nutzung von Claude, und die Zahlen treffen einen wie ein Schlag.
Sie haben 100.000 Gespräche analysiert.
Hier ist der Teil, der mich gestoppt hat:
Die meisten Aufgaben, die die Leute Claude bringen, dauern normalerweise etwa 90 Minuten.
Mit Claude werden dieselben Aufgaben 80 Prozent schneller erledigt.
Das bedeutet, dass jemand jede Woche ohne großen Aufwand Stunden spart.
Dann wird der Bericht noch größer.
Wenn man diese Gewinne auf die US-Wirtschaft anwendet, steigern die heutigen Modelle allein die Arbeitsproduktivität um 1,8 Prozent pro Jahr im nächsten Jahrzehnt.
Fast doppelt so schnell wie in letzter Zeit.
Und das alles beinhaltet keine besseren Modelle.
Das ist nur, wie die Leute Claude gerade jetzt nutzen.
Das könnte das erste Mal sein, dass wir harte Beweise dafür sehen, was KI in echten Jobs bewirkt.
Leiser Wandel.
Massive Auswirkungen.
Passiert bereits.

2,96K
Top
Ranking
Favoriten

