Une relation paradoxale dans la technologie, liée au paradoxe de Jevons mais légèrement décalée : Les puces AI sont disponibles aujourd'hui Mais vous pourriez déployer plus efficacement des puces plus efficaces dans 3 ans Pourquoi se presser ? Une technologie en pleine baisse rapide des coûts bifurque presque nécessairement le marché entre ceux qui croient que l'accès à une technologie inférieure aujourd'hui leur donnera une bien meilleure position à l'avenir et ceux qui pensent qu'il est préférable d'opérer un ou deux nœuds en arrière. Le coût de génération de tokens s'effondre. Et pourtant, les fournisseurs de modèles AI paient cher - tout comme leurs utilisateurs - pour générer des tokens aujourd'hui qui sembleront désespérément inefficaces demain. Soit les utilisateurs agressifs sont malavisés, soit le coût temporel de ne pas générer de tokens doit dépasser même la courbe de performance raide que suit la génération de tokens. Sur une base matérielle - en laissant de côté les améliorations architecturales - le coût de génération de tokens est à peu près divisé par deux chaque année. Cela doit signifier que le retour perçu sur la génération de tokens est d'au moins 100 % annualisé. Un gigawatt de calcul aujourd'hui vaut autant que 2 GW l'année prochaine. Cela conduit, presque inévitablement, à l'informatique spatiale. Sensible à divers facteurs, il semble que l'informatique AI basée dans l'espace devienne rentable par rapport à l'informatique AI terrestre sur une base par token à environ 400 $ par kg de coûts de lancement. Bien que ce ne soit pas encore le cas, Starship à des volumes raisonnables - ce que nous nous attendions à ce que SpaceX livre d'ici 2030 avant que l'opportunité de l'informatique spatiale n'émerge - devrait franchir ce seuil de coût. Plus important que le coût, cependant, est le temps. Les entreprises AI manquent de flops maintenant. À l'échelle de l'industrie, nous nous attendons à ce que les centres de données terrestres installent 90 GW en 2030, ayant construit cumulativement 250 GW entre maintenant et alors. C'est possible mais agressif compte tenu de la difficulté à construire de vraies infrastructures dans de vrais endroits peuplés de vraies personnes (qui peuvent se jeter devant un bulldozer parce qu'elles ont lu ce livre qui a exagéré l'utilisation de l'eau des centres de données par 1000 fois.). ...