Post-trénink je forma umění. @christinahkim říká, že tvarování chování modelu znamená tvarování charakteru. Každá odměna je kompromisem. GPT-5 byl reset: vyvážení vstřícnosti s upřímností, vřelosti bez patolízalství. Asistent by neměl jen odpovídat. Mělo by to být správné používat.
15,22K