Jestem optymistycznie nastawiony do elastyczności popytu na wnioskowanie, ale skoro wnioskowanie przenosi się na krawędź (laptopy, smartfony), czy większość pracy AI nie powinna odbywać się lokalnie? Istnieje świat, w którym trafiamy w odpowiednią wielkość popytu, ale mylimy się co do tego, że głównie będzie to działać z centrów danych hyperscalerów.
4,53K