Heilige Scheiße… Meta könnte gerade selbstverbessernde KI gelöst haben 🤯 Ihr neues Papier SPICE (Self-Play in Corpus Environments) verwandelt im Grunde ein Sprachmodell in seinen eigenen Lehrer – keine Menschen, keine Labels, keine Datensätze, nur das Internet als Trainingsgrundlage. Hier ist der Twist: Eine Kopie des Modells wird zu einem Herausforderer, der echte Dokumente durchforstet, um schwierige, faktengestützte Denkprobleme zu erstellen. Eine andere Kopie wird zum Denker, der versucht, sie zu lösen, ohne Zugang zur Quelle zu haben. Sie konkurrieren, lernen und entwickeln sich gemeinsam – ein automatisierter Lehrplan mit realer Grundlage, sodass es niemals in Halluzinationen zusammenbricht. Die Ergebnisse sind verrückt: +9,1 % bei den Denkbenchmarks mit Qwen3-4B +11,9 % mit OctoThinker-8B und es schlägt jede vorherige Selbstspielmethode wie R-Zero und Absolute Zero. Das verändert die Spielregeln für die Selbstverbesserung von KI. Anstatt sich mit synthetischem Müll zu beschäftigen, wächst SPICE, indem es echtes Wissen abbaut – ein geschlossenes System mit offener Weltintelligenz. Wenn das skaliert, könnten wir auf den Plan für autonome, selbstentwickelnde Denkmodelle blicken.