Wir kennen das Offline-Training – Pretraining, DPO… Daten sind im Voraus klar.
Wir kennen auch das Online-Training – PPO, GRPO... Daten werden während des Trainings erstellt.
Neu: Humanline-Training – beliebige Daten (offline/onlin) geformt, um der menschlichen Wahrnehmung zu entsprechen → kann Online-Leistung zu geringeren Kosten liefern.