🚨 Salesforce Research vient de faire quelque chose de fou avec BLIP3o-NEXT. Cela fusionne le raisonnement autoregressif (comme GPT), la synthèse par diffusion (comme Imagen) et l'alignement par renforcement (comme RLHF)… Tout cela dans une boucle d'entraînement unifiée. Cette fusion pourrait être le lien manquant entre le texte et les pixels ↓