鑑於測試時計算和後訓練強化學習的重要性日益增加,Grok-4的絕對主導地位使得成為低成本的代幣生產者比以往任何時候都更為重要。順便提一下,這是我作為科技投資者的職業生涯中,第一次成為任何東西的低成本生產者變得如此重要。 目前,代幣的最低成本生產者是Google(TPUs)和xAI(最大的連貫集群,最低的每個部署GPU的資本支出,幾乎肯定擁有最高的MFU,並且做出了一些非常聰明的架構決策)。在xAI方面,我顯然有偏見。 從純技術的角度來看,擁有最佳的擴展網絡和最有效的KV緩存卸載對於日益增長的大型模型和上下文窗口的成本和延遲最為重要。這些是當前AI基礎設施競爭中最重要的競爭軸心——而不是計算。請注意,當您可以將模型放在單個芯片上(@cerebras)時,封裝內存帶寬最為重要,但對於任何需要多個封裝的真正大型模型,擴展和KV緩存卸載則最為重要。這是每個從事ASIC工作的人都慢慢開始理解的。 這就是為什麼Dynamo和開源NVLink都既重要又聰明。後者可能會導致ASIC市場份額逐漸轉向NVLink合作夥伴。更不用說擁有第二個供應商的自然談判優勢。IMHO,可能會看到更多這樣的情況:
97.59K