Soy optimista sobre la elasticidad de la demanda de inferencia, pero con la inferencia moviéndose al borde (portátiles, smartphones), ¿no debería la mayor parte del trabajo de IA realizarse localmente? Hay un mundo en el que acertamos con el orden de magnitud de la demanda, pero erramos al pensar que se ejecutará principalmente desde los centros de datos de hyperscalers.
4,54K