我認為中國人如此接近前沿的原因,以及如此多的計算資源投入到推理中的原因,主要是因為這些「前沿」的公司對於一個10億美元的預訓練運行沒有信心的想法。他們不知道該如何將其擴展到那麼大。
11.29K