Grok-4の絶対的な優位性が示すように、テスト時のコンピューティングとトレーニング後のRLの重要性が非常に大きく、そしてますます高まっていることを考えると、トークンの低コストの生産者であることはこれまで以上に重要になっています。余談ですが、私のテクノロジー投資家としてのキャリアの中で、何かを低コストで提供することが重要になったのはこれが初めてです。 今日、トークンの最も低コストの生産者は、Google(TPU)とxAI(最大のコヒーレントクラスター、デプロイされたGPUあたりの最低の設備投資、ほぼ確実に最高のMFU)であり、非常に賢明なアーキテクチャ上の決定を下しています。私はxAIに関しては明らかに偏見を持っています。 技術的な観点からのみ見ると、最適なスケールアップ ネットワークと最も効率的な KV キャッシュ オフロードを実現することは、ますます大きくなるモデルとコンテキスト ウィンドウのコストとレイテンシの両方にとって最も重要です。これらは、今日のAIインフラストラクチャにおける最も重要な競争軸であり、コンピューティングではありません。モデルを 1 つのチップ (@cerebras) に収めることができる場合、パッケージ上のメモリ帯域幅が最も重要ですが、複数のパッケージを必要とする非常に大きなモデルでは、スケールアップと kv キャッシュ オフロードが最も重要であることに注意してください。ASICに取り組んでいるすべての人が徐々に理解し始めているように。 だからこそ、Dynamo とオープンソースの NVLink は重要であり、賢明だったのです。 後者により、ASICのシェアがNVLinkパートナーに移行する可能性がますます高まる可能性があります。 言うまでもなく、2番目のサプライヤーを持つことの自然な交渉上の利点は言うまでもありません。これらの私見をもっと見る可能性があります:
97.56K