🚨 Salesforce Research 刚刚在 BLIP3o-NEXT 上做了一件疯狂的事情。 它将自回归推理(像 GPT)、扩散合成(像 Imagen)和强化对齐(像 RLHF)合并在一起…… 全部在一个统一的训练循环中。 这种融合可能是文本与像素之间的缺失环节 ↓