我认为中国人如此接近前沿的原因,以及如此多的计算资源投入到推理中的原因,主要是因为这些“前沿”公司没有一个自信的想法来进行10亿美元的预训练。他们不知道该如何大规模扩展。
11.28K