Soy optimista sobre la elasticidad de la demanda de inferencia, pero con la inferencia moviéndose al borde (computadoras portátiles, teléfonos inteligentes), ¿no debería la mayor parte del trabajo de IA ocurrir localmente? Hay un mundo en el que adivinamos correctamente el orden de magnitud de la demanda, pero nos equivocamos en que se quedará principalmente sin centros de datos de hiperescaladores.
4.52K