un modèle de langage de 1 quadrillion de paramètres n'est pas totalement hors de question (en dehors de la question de savoir d'où obtenir toutes ces données) bien que vous auriez probablement besoin de 25 % de GPU en plus que cela pour le contexte et le cache KV 100 000 H100 pourraient probablement le faire