Vă prezentăm raportul tehnic GLM-4.5! 👇 Această lucrare demonstrează modul în care am dezvoltat modele care excelează în raționament, codificare și sarcini agentice printr-o paradigmă unică de antrenament în mai multe etape. Inovațiile cheie includ iterația modelului expert cu auto-distilare pentru a unifica capabilitățile, un mod de raționament hibrid pentru rezolvarea dinamică a problemelor și un curriculum de învățare prin întărire bazat pe dificultate.
142,62K