Je suis optimiste quant à l'élasticité de la demande pour l'inférence, mais avec l'inférence se déplaçant vers le edge (ordinateurs portables, smartphones), ne devrait-on pas s'attendre à ce que la plupart des travaux d'IA se déroulent localement ? Il existe un monde où nous devinons correctement l'ordre de grandeur de la demande, mais où nous nous trompons sur le fait qu'elle sera principalement exécutée à partir des centres de données hyperscale.
4,53K