🚨 Badania Salesforce właśnie zrobiły coś szalonego z BLIP3o-NEXT. Łączy autoregresywne rozumowanie (jak GPT), syntezę dyfuzji (jak Imagen) i dostosowanie wzmocnienia (jak RLHF)… Wszystko w jednej zintegrowanej pętli treningowej. Ta fuzja może być brakującym ogniwem między tekstem a pikselami ↓