Ein wirklich aufschlussreiches Interview mit einem ehemaligen $ORCL-Mitarbeiter über den Einsatz von $NVDA-GPUs und die dahinterstehenden wirtschaftlichen Aspekte: 1. Seiner Erfahrung nach sind die Benchmarks, die $NVDA bereitstellt, sehr großzügig gegenüber sich selbst. Er erwähnt, dass er sogar Erfahrungen gemacht hat, bei denen sie um 40% abwichen. Generell sind die meisten GPU-Deals für Rechenleistung derzeit langfristige, stark rabattierte Verträge. 2. Er hatte Hunderttausende von GPUs und Clustern, und 15% seiner Flotte waren zu jedem Zeitpunkt außer Betrieb. Als er $NVDA nach Ersatzteilen fragte, bekam er nichts, und er konnte nichts sagen, weil sie ihm sonst seine Zuteilung streichen würden. Er erwähnt, dass $NVDA viele Kunden als Geiseln hält, indem sie sie in der Warteschlange für zukünftige Kapazitäten stehen lassen. Der Grund, warum 15% der Flotte außer Betrieb waren, lag zu 6% an den GPUs, zu 5% an Netzwerkproblemen und an anderen zufälligen Kleinigkeiten in einem Server. 3. In Bezug auf die Nützlichkeit der Lebensdauer dieser GPUs erwähnt er, dass die Leute immer noch die $NVDA Voltas und Pascals verwenden. Aber das größere Problem ist, kann ich diesen Platz und die Energie für etwas Interessanteres nutzen, oder ist dieses Rechenzentrum zu alt und wird ignoriert? 4. Er erwähnt, dass die erste $ORCL $AMD-Ankündigung für $AMDs MI300X, $ORCL behandelt wurde, als $AMD sich verpflichtete, einige dieser GPUs für ihre Ingenieure zurückzumieten. 5. Im Gegensatz zur Sichtweise der Branche erwähnt er, dass es derzeit außerhalb der großen Akteure nicht viel Nachfrage nach Inferenz gibt, da der Übergang zur Inferenz in mittelgroßen Unternehmen und darunter langsam war. Er gibt das aktuelle Beispiel von Lambda, das seinen Inferenz-as-a-Service in Trainingskapazitäten umgewandelt hat, aufgrund mangelnder Nachfrage nach Inferenz. gefunden bei @AlphaSenseInc