Ich denke, der Grund, warum die Chinesen so nah an der Grenze sind und warum so viel Rechenleistung in die Inferenz fließt, liegt hauptsächlich daran, dass keiner dieser «Grenz»-Leute eine klare Vorstellung von einem $1B Pretraining-Lauf hat. Sie wissen nicht, WAS sie so weit skalieren sollen.
11,29K