Estou otimista quanto à elasticidade da demanda por inferência, mas com a inferência se movendo para a borda (laptops, smartphones), não deveria a maior parte do trabalho de IA acontecer localmente? Existe um mundo em que acertamos a ordem de grandeza da demanda, mas erramos ao pensar que ela funcionará principalmente a partir de centros de dados de hyperscalers.
4,53K