GLM-Image wydany GLM-Image to nowy model generowania obrazów o otwartym kodzie źródłowym, klasy przemysłowej, który łączy auto-regresywne modelowanie semantyczne z dekoderem dyfuzyjnym, aby dostarczać wizualizacje o wysokiej wierności i wiodące w branży renderowanie tekstu. To pierwszy model generowania obrazów o otwartym kodzie źródłowym, klasy przemysłowej, który absolutnie dominuje w benchmarkach renderowania tekstu. GLM-Image zajmuje pierwsze miejsce na liście liderów renderowania tekstu CVTG-2K z dokładnością słów wynoszącą 91,16% – pokonując nawet zamknięte giganty, takie jak GPT Image 1 i Seedream 4.5. W przypadku renderowania tekstu chińskiego na LongText-Bench osiąga imponujące 97,88%, miażdżąc marną 61,9% GPT Image 1.