Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Le contrôle vient en dernier cette fois. Mais il arrive.

14 nov. 2024
Je parle souvent de contrôle dans l'IA. Mais j'ai réalisé que parfois les gens pensent que je veux dire "meilleurs prompts". Voici donc mes réflexions sur ce que j'entends par contrôle : nous résolvons les graphiques à l'envers.
L'histoire des graphiques informatiques suit une progression claire : d'abord est venu le contrôle, puis la qualité. Il a fallu des décennies pour établir les bonnes abstractions - courbes, triangles, polygones, maillages - qui nous permettraient de dessiner exactement ce que nous voulions sur un écran. Ces blocs de construction fondamentaux n'ont pas beaucoup changé car ils se sont révélés être les bons. De la main d'Ed Catmull aux moteurs de jeu modernes, les principes fondamentaux de la façon dont nous contrôlons les pixels sont restés remarquablement stables. Les fondamentaux ont émergé non seulement pour le contrôle, mais aussi comme des moyens efficaces de décrire et de rendre des scènes complexes.
La qualité de rendu était la dernière frontière. Un cube modélisé en 1987 avec la première version de Renderman suit les mêmes principes géométriques qu'un cube modélisé dans Blender aujourd'hui. Ce qui est dramatiquement différent, c'est le rendu - l'éclairage, les matériaux, les ombres et les réflexions qui le rendent réel. L'industrie a passé des décennies à combler la vallée dérangeante, construisant des systèmes de rendu de plus en plus sophistiqués pour approcher le photoréalisme. Bien sûr, de nombreuses innovations graphiques ont amélioré à la fois le contrôle et la qualité simultanément, et l'histoire des progrès graphiques est plus complexe que simplement "contrôle puis qualité."
Mais cet ordre n'était pas arbitraire. Le pipeline graphique lui-même l'impose : la géométrie définit ce que nous voulons dessiner, les shaders déterminent à quoi cela ressemble. Même les moteurs en temps réel suivent ce schéma - établissant d'abord des contrôles de niveau de détail, puis améliorant la qualité de rendu dans ces contraintes.
L'IA a complètement inversé cette progression.
Les modèles génératifs d'aujourd'hui atteignent une qualité de rendu photoréaliste qui rivalise ou dépasse les pipelines traditionnels, apprenant efficacement l'ensemble de la pile graphique - de la géométrie à l'illumination globale - grâce à un entraînement à grande échelle. Ils ont effondré la séparation traditionnelle entre modélisation et rendu, créant un système de bout en bout capable de produire des images époustouflantes à partir de descriptions de haut niveau.
Ce qui manque, c'est le contrôle.
Bien que nous puissions générer des scènes photoréalistes en quelques secondes, nous manquons du contrôle précis que des décennies de recherche graphique ont fourni. Nous ne pouvons pas facilement ajuster la géométrie, peaufiner les matériaux ou manipuler l'éclairage avec la granularité que les artistes attendent. La nature déterministe des graphiques traditionnels - où chaque paramètre a un effet prévisible - a été remplacée par des modèles probabilistes.
C'est le problème des graphiques inverses : nous avons résolu le rendu avant de résoudre le contrôle. Nos modèles peuvent créer des images époustouflantes mais manquent des abstractions fondamentales qui ont rendu les graphiques informatiques si puissants - la capacité de faire des changements précis et intentionnels à n'importe quel niveau de détail.
Ce n'est pas une limitation permanente. Tout comme les graphiques informatiques ont finalement résolu le problème du rendu, l'IA résoudra le problème du contrôle. La question n'est pas si, mais comment. Nous trouvons les bonnes abstractions pour contrôler les modèles génératifs - l'équivalent des courbes, triangles et polygones qui ont révolutionné les graphiques informatiques auparavant. Je pense que les solutions pourraient avoir un aspect différent. De nouveaux primitifs pour le contrôle qui sont natifs des réseaux neuronaux pourraient être la bonne réponse plutôt que d'essayer d'imposer des concepts graphiques traditionnels dans ce nouveau paradigme. Bien que je pense aussi qu'il existe des approches hybrides combinant graphiques traditionnels et IA qui valent la peine d'être explorées.
L'objectif reste de fournir le même niveau de prévisibilité et de précision qui a fait des graphiques informatiques un outil fondamental pour l'expression créative. C'est l'objectif ultime, mais mieux : en temps réel, peu coûteux, et avec un contrôle précis qui soit aussi intuitif et polyvalent que possible.
Le contrôle vient en dernier cette fois. Mais il arrive.
5,12K
Meilleurs
Classement
Favoris