Sono ottimista riguardo all'elasticità della domanda per l'inferenza, ma con l'inferenza che si sposta verso il bordo (laptop, smartphone), non dovrebbe avvenire la maggior parte del lavoro di intelligenza artificiale localmente? Esiste un mondo in cui indoviniamo correttamente l'ordine di grandezza della domanda, ma sbagliamo nel pensare che verrà principalmente eseguita nei data center degli hyperscaler.
4,54K