Pretraining er en elegant vitenskap, utført av matematikere som sitter i kjølerom og skriver optimaliseringsteori på tavler, ingeniører med total absorbering av distribuerte systemer av titanisk skala Posttrening er hårreisende cowboyforskning der folk som drikker mye diett cola roper nye hyperparametere for å prøve på hverandre på den andre siden av rommet. det er å gjøre for mange bord! Vibbene blir verre, skru ned knappen! Checkpoint GPT-9-Final-V320-Restart4 kaller meg navn! gåsen er løs