يأتي التحكم أخيرا هذه المرة. لكنها قادمة.
Cristóbal Valenzuela
Cristóbal Valenzuela‏14 نوفمبر 2024
غالبا ما أتحدث عن التحكم في الذكاء الاصطناعي. لكنني أدركت أحيانا أن الناس يعتقدون أنني أعني "مطالبات أفضل". إذن ها هي أفكاري حول ما أعنيه بالسيطرة: نحن نحل الرسومات إلى الوراء. يتبع تاريخ رسومات الكمبيوتر تقدما واضحا: جاء التحكم أولا ، ثم الجودة. استغرق الأمر عقودا لإنشاء التجريدات الصحيحة - المنحنيات والمثلثات والمضلعات والشبكات - التي من شأنها أن تسمح لنا برسم ما أردناه بالضبط على الشاشة. لم تتغير هذه اللبنات الأساسية كثيرا لأنها أثبتت أنها الصحيحة. من يد Ed Catmulll إلى محركات الألعاب الحديثة ، ظلت المبادئ الأساسية لكيفية التحكم في وحدات البكسل مستقرة بشكل ملحوظ. ظهرت الأساسيات ليس فقط للتحكم ، ولكن كطرق فعالة لوصف المشاهد المعقدة وتقديمها. كانت جودة التقديم هي الحدود الأخيرة. يتبع المكعب الذي تم تصميمه في عام 1987 باستخدام الإصدار الأول من Renderman نفس المبادئ الهندسية مثل تلك التي تم تصميمها في Blender اليوم. ما يختلف بشكل كبير هو العرض - الإضاءة والمواد والظلال والانعكاسات التي تجعله يبدو حقيقيا. أمضت الصناعة عقودا في إغلاق الوادي الغريب ، وبناء أنظمة عرض متطورة بشكل متزايد للتعامل مع الواقعية الضوئية. بالطبع ، أدت العديد من ابتكارات الرسومات إلى تحسين التحكم والجودة في وقت واحد ، وتاريخ تقدم الرسومات أكثر تعقيدا من مجرد "التحكم ثم الجودة". لكن هذا الأمر لم يكن تعسفيا. يفرضها خط أنابيب الرسومات نفسه: تحدد الهندسة ما نريد رسمه ، وتحدد التظليل كيف تبدو. حتى المحركات في الوقت الفعلي تتبع هذا النمط - أولا إنشاء عناصر تحكم على مستوى التفاصيل ، ثم تحسين جودة العرض ضمن تلك القيود. لقد عكس الذكاء الاصطناعي هذا التقدم تماما. تحقق النماذج التوليدية اليوم جودة عرض واقعية تنافس أو تتجاوز خطوط الأنابيب التقليدية ، وتتعلم بشكل فعال مجموعة الرسومات بأكملها - من الهندسة إلى الإضاءة العالمية - من خلال التدريب على نطاق واسع. لقد قاموا بطيت الفصل التقليدي بين النمذجة والعرض ، مما أدى إلى إنشاء نظام شامل يمكنه إنتاج صور مذهلة من أوصاف عالية المستوى. ما ينقصنا هو السيطرة. بينما يمكننا إنشاء مشاهد واقعية في ثوان ، فإننا نفتقر إلى التحكم الدقيق الذي توفره عقود من أبحاث الرسومات. لا يمكننا بسهولة ضبط الهندسة أو ضبط المواد أو معالجة الإضاءة بالتفاصيل التي يتوقعها الفنانون. تم استبدال الطبيعة الحتمية للرسومات التقليدية - حيث يكون لكل معلمة تأثير يمكن التنبؤ به - بنماذج احتمالية. هذه هي مشكلة الرسومات العكسية: لقد قمنا بحل العرض قبل حل التحكم. يمكن لنماذجنا إنشاء صور مذهلة ولكنها تفتقر إلى التجريدات الأساسية التي جعلت رسومات الكمبيوتر قوية للغاية - القدرة على إجراء تغييرات دقيقة ومقصودة على أي مستوى من التفاصيل. هذا ليس قيدا دائما. مثلما حلت رسومات الكمبيوتر مشكلة العرض في النهاية ، سيحل الذكاء الاصطناعي مشكلة التحكم. السؤال ليس ما إذا كان ، ولكن كيف. نحن نجد التجريدات الصحيحة للتحكم في النماذج التوليدية - ما يعادل المنحنيات والمثلثات والمضلعات التي أحدثت ثورة في رسومات الكمبيوتر من قبل. أعتقد أن الحلول قد تبدو مختلفة. قد تكون البدائيات الجديدة للتحكم الأصلية في الشبكات العصبية هي الحل الصحيح بدلا من محاولة فرض مفاهيم الرسومات التقليدية في هذا النموذج الجديد. على الرغم من أنني أعتقد أيضا أن هناك مناهج هجينة تجمع بين الرسومات التقليدية مع الذكاء الاصطناعي تستحق الاستكشاف. يظل الهدف هو توفير نفس المستوى من القدرة على التنبؤ والدقة التي جعلت رسومات الكمبيوتر أداة أساسية للتعبير الإبداعي. هذا هو الهدف النهائي ، ولكنه أفضل: في الوقت الفعلي ، ورخيص ، وتحكم دقيق بديهي ولأغراض عامة قدر الإمكان. يأتي التحكم أخيرا هذه المرة. لكنها قادمة.
‏‎5.12‏K