Una relación paradójica en la tecnología, relacionada con la paradoja de Jevons pero ligeramente torcida: Los chips de IA están disponibles hoy Pero podrías desplegar de manera más eficiente chips más eficientes dentro de 3 años ¿Cuál es la prisa? Una tecnología en medio de una rápida disminución de costos casi necesariamente bifurca el mercado entre aquellos que creen que tener acceso a tecnología inferior hoy les dará una mejor posición en el futuro y aquellos que piensan que es mejor operar uno o dos nodos detrás. El costo de generar tokens está colapsando. Y sin embargo, los proveedores de modelos de IA están pagando caro—al igual que sus usuarios—para generar tokens hoy que parecerán terriblemente ineficientes mañana. O los usuarios agresivos están equivocados, o el costo temporal de no generar tokens debe superar incluso la pronunciada curva de rendimiento que sigue la generación de tokens. En base a hardware—dejando de lado las mejoras arquitectónicas—el costo de generar tokens se está reduciendo aproximadamente a la mitad anualmente. Esto debe significar que el retorno percibido de la generación de tokens es al menos del 100% anualizado. Un gigavatio de computación hoy es tan valioso como 2 GW el próximo año. Esto lleva, casi inevitablemente, a la computación espacial. Sensible a varios insumos, parece que la computación de IA basada en el espacio se vuelve rentable en comparación con la computación de IA terrestre en una base por-token a aproximadamente $400 por kg en costos de lanzamiento. Aunque aún no estamos allí, Starship a volúmenes razonables—lo que esperábamos que SpaceX entregara para 2030 antes de que surgiera la oportunidad de computación espacial—debería cruzar ese umbral de costo. Sin embargo, más importante que el costo es el tiempo. Las empresas de IA están hambrientas de flops ahora. A nivel industrial, esperamos que los centros de datos terrestres instalen 90GW en 2030, habiendo construido acumulativamente 250GW entre ahora y entonces. Esto es posible pero agresivo dado la dificultad de construir infraestructura real en lugares reales poblados por personas reales (que pueden lanzarse frente a una excavadora porque leyeron ese libro que exageradamente sobrestimó el uso de agua de los centros de datos por 1000 veces.). ...