Cazzo santo… Meta potrebbe aver appena risolto l'IA auto-migliorante 🤯 Il loro nuovo documento SPICE (Self-Play in Corpus Environments) trasforma fondamentalmente un modello linguistico nel suo stesso insegnante: niente umani, niente etichette, niente dataset, solo internet come campo di addestramento. Ecco il colpo di scena: una copia del modello diventa un Challenger che scava tra documenti reali per creare problemi di ragionamento difficili e basati su fatti. Un'altra copia diventa il Reasoner, cercando di risolverli senza accesso alla fonte. Competono, apprendono e si evolvono insieme: un curriculum automatico con basi nel mondo reale, così non collassa mai in allucinazioni. I risultati sono pazzeschi: +9.1% nei benchmark di ragionamento con Qwen3-4B +11.9% con OctoThinker-8B e batte ogni metodo di self-play precedente come R-Zero e Absolute Zero. Questo capovolge il copione sull'auto-miglioramento dell'IA. Invece di ripetere spazzatura sintetica, SPICE cresce estraendo conoscenza reale: un sistema a ciclo chiuso con intelligenza a mondo aperto. Se questo scala, potremmo trovarci di fronte al progetto per modelli di ragionamento autonomi e auto-evolventi.