Thật buồn cười khi họ thúc đẩy nội dung thô, không hoàn hảo, "thật sự là bạn" (bây giờ là câu chuyện chung của ngành công nghiệp) ngay khi các nền tảng cần những đoạn video và dữ liệu có độ biến thiên cao hơn để đào tạo AI. Khi cuộc thảo luận định hình sự chuyển mình này như một sự thích ứng văn hóa, cũng đáng để xem xét các động lực của nền tảng đang thúc đẩy nó. Nếu họ thực sự quan tâm đến những gì người dùng muốn, họ đã giữ một sự pha trộn lành mạnh hơn của các bức ảnh trong nguồn cấp dữ liệu, mà người dùng liên tục nói rằng họ nhớ. Nhưng với gần như mọi hình ảnh tĩnh trên internet đã được thu thập để đào tạo các mô hình, hình ảnh đã hiệu quả "được giải quyết." Một hình ảnh tĩnh dạy AI hình dáng của một con chó, nhưng nó không dạy âm thanh của tiếng sủa của chó hay cách nó vẫy đuôi. Video thì dày đặc. Một phút video 60fps chứa 3.600 hình ảnh độc đáo. Để tiếp cận trí thông minh tổng quát, các mô hình cần nắm bắt tốt hơn về nguyên nhân và kết quả. Họ cần khối lượng video khổng lồ ở quy mô lớn. Bằng cách buộc các thuật toán ưu tiên Reels và Shorts trong khi quảng bá "thẩm mỹ thô/chưa chỉnh sửa," các nền tảng khuyến khích người dùng tải lên thực tế có độ trung thực cao hơn ở quy mô lớn. Tuy nhiên, chỉ có kinh nghiệm thôi thì không đủ. Trí thông minh tổng quát yêu cầu cả một mô hình về thế giới và một tín hiệu cho những gì quan trọng. Các nhà sáng tạo cung cấp kinh nghiệm. Người xem cung cấp phản hồi, và sự chú ý của họ vừa thúc đẩy doanh thu quảng cáo vừa cung cấp dữ liệu sở thích. Việc bình thường hóa kính AI và các thiết bị ghi hình luôn bật là bước tiếp theo. Chúng thu hẹp khoảng cách giữa những gì bạn chọn lọc và những gì bạn thực sự thấy. Khi xem xét tổng thể, các động lực là rõ ràng. Hầu hết các nền tảng không còn được tối ưu hóa cho sự kết nối giữa con người. Chúng được tối ưu hóa để khai thác dữ liệu cần thiết để mô phỏng nó.