Kiểm soát sẽ đến sau cùng lần này. Nhưng nó đang đến.
Cristóbal Valenzuela
Cristóbal Valenzuela14 thg 11, 2024
Tôi thường nói về kiểm soát trong AI. Nhưng tôi nhận ra đôi khi mọi người nghĩ tôi có nghĩa là "các prompt tốt hơn." Vì vậy, đây là những suy nghĩ của tôi về những gì tôi có nghĩa là kiểm soát: Chúng tôi đang giải quyết đồ họa theo chiều ngược lại. Lịch sử của đồ họa máy tính theo một tiến trình rõ ràng: trước tiên là kiểm soát, sau đó là chất lượng. Mất hàng thập kỷ để thiết lập các trừu tượng đúng - đường cong, tam giác, đa giác, lưới - cho phép chúng tôi vẽ chính xác những gì chúng tôi muốn trên màn hình. Những khối xây dựng cơ bản này không thay đổi nhiều vì chúng đã chứng minh là đúng. Từ tay Ed Catmull đến các engine game hiện đại, các nguyên tắc cốt lõi về cách chúng tôi kiểm soát pixel vẫn giữ nguyên sự ổn định đáng kể. Các nguyên tắc cơ bản không chỉ xuất hiện cho kiểm soát, mà còn như những cách hiệu quả để mô tả và render các cảnh phức tạp. Chất lượng render là biên giới cuối cùng. Một khối lập phương được mô hình hóa vào năm 1987 bằng phiên bản đầu tiên của Renderman tuân theo các nguyên tắc hình học giống như một khối được mô hình hóa trong Blender ngày nay. Điều khác biệt đáng kể là việc render - ánh sáng, vật liệu, bóng đổ và phản chiếu khiến nó cảm thấy thực. Ngành công nghiệp đã dành hàng thập kỷ để thu hẹp khoảng cách kỳ lạ, xây dựng các hệ thống render ngày càng tinh vi để tiếp cận photorealism. Tất nhiên, nhiều đổi mới trong đồ họa đã cải thiện cả kiểm soát và chất lượng đồng thời, và lịch sử tiến bộ đồ họa phức tạp hơn chỉ là "kiểm soát rồi đến chất lượng." Nhưng thứ tự này không phải là ngẫu nhiên. Chính quy trình đồ họa tự nó áp đặt điều đó: hình học xác định những gì chúng tôi muốn vẽ, shader xác định cách nó trông như thế nào. Ngay cả các engine thời gian thực cũng tuân theo mẫu này - trước tiên thiết lập các điều khiển mức độ chi tiết, sau đó cải thiện chất lượng render trong những ràng buộc đó. AI đã hoàn toàn đảo ngược tiến trình này. Các mô hình sinh hiện nay đạt được chất lượng render photorealistic mà cạnh tranh hoặc vượt qua các quy trình truyền thống, hiệu quả học toàn bộ stack đồ họa - từ hình học đến chiếu sáng toàn cầu - thông qua đào tạo quy mô lớn. Chúng đã xóa nhòa sự phân tách truyền thống giữa mô hình hóa và render, tạo ra một hệ thống đầu cuối có thể sản xuất hình ảnh tuyệt đẹp từ các mô tả cấp cao. Điều còn thiếu là kiểm soát. Trong khi chúng tôi có thể tạo ra các cảnh photorealistic trong vài giây, chúng tôi thiếu kiểm soát chính xác mà hàng thập kỷ nghiên cứu đồ họa đã cung cấp. Chúng tôi không thể dễ dàng điều chỉnh hình học, tinh chỉnh vật liệu, hoặc thao tác ánh sáng với độ chi tiết mà các nghệ sĩ mong đợi. Bản chất xác định của đồ họa truyền thống - nơi mỗi tham số có một hiệu ứng dự đoán được - đã bị thay thế bởi các mô hình xác suất. Đây là vấn đề đồ họa ngược: chúng tôi đã giải quyết việc render trước khi giải quyết kiểm soát. Các mô hình của chúng tôi có thể tạo ra hình ảnh tuyệt đẹp nhưng thiếu các trừu tượng cơ bản đã làm cho đồ họa máy tính trở nên mạnh mẽ - khả năng thực hiện các thay đổi chính xác, có chủ ý ở bất kỳ mức độ chi tiết nào. Điều này không phải là một giới hạn vĩnh viễn. Cũng như đồ họa máy tính cuối cùng đã giải quyết vấn đề render, AI sẽ giải quyết vấn đề kiểm soát. Câu hỏi không phải là nếu, mà là như thế nào. Chúng tôi đang tìm kiếm các trừu tượng đúng cho việc kiểm soát các mô hình sinh - tương đương với các đường cong, tam giác và đa giác đã cách mạng hóa đồ họa máy tính trước đây. Tôi nghĩ rằng các giải pháp có thể trông khác. Các nguyên thủy mới cho kiểm soát mà là bản địa cho mạng nơ-ron có thể là câu trả lời đúng thay vì cố gắng ép các khái niệm đồ họa truyền thống vào mô hình mới này. Mặc dù tôi cũng nghĩ rằng có những cách tiếp cận lai kết hợp đồ họa truyền thống với AI mà đáng để khám phá. Mục tiêu vẫn là cung cấp cùng một mức độ dự đoán và độ chính xác đã làm cho đồ họa máy tính trở thành một công cụ nền tảng cho sự biểu đạt sáng tạo. Đó là mục tiêu cuối cùng, nhưng tốt hơn: thời gian thực, rẻ và với kiểm soát chính xác mà càng trực quan và đa năng càng tốt. Kiểm soát đến sau cùng lần này. Nhưng nó đang đến.
5,12K