Diffusie voor alles! We delen een recept om te beginnen met een voorgetrainde autoregressieve VLM en, met zeer weinig trainingscomputing en enkele mooie annealingtrucs, het om te zetten in een SOTA diffusie VLM. Onderzoek naar diffusie voor taal vordert zeer snel en naar mijn mening biedt het een even veelbelovende weg voor het verenigen van modaliteiten als de 'omni' autoregressieve modellen. Geweldig werk geleid door @mariannearr @ServerProcessor gedurende de zomer.