Только что опубликовал свою лекцию в Гарвардской школе дизайна о будущем креативного ИИ – куда мы движемся и как его использовать:
Темы, которые были рассмотрены:
- Пространственный интеллект: фотограмметрия, нейронные радиационные поля (NeRF) и 3D-гауссовское распыление для цифровизации реальности.
- Визуальный интеллект: оценка позы с помощью ИИ, сегментация, вывод глубины и повторное освещение.
- Гибридные рабочие процессы: кодирование настроения, Протокол контекста модели (MCP) и то, как LLM взаимодействуют с Blender, Unreal и Runway.
- Парадигма контент-контент: переход от текста к видео к полностью персонализированным, динамическим и своевременным медиа.
- Будущее медиа: персонализированные подкасты, AR-экскурсии, генеративные игры ИИ и стирание границ между программным обеспечением и контентом.
Поскольку нано-банан обладает мировыми знаниями Gemini, вы можете просто загружать скриншоты реального мира и просить его аннотировать вещи для вас.
"вы генератор AR-опыта на основе местоположения. выделите [точку интереса] на этом изображении и аннотируйте соответствующую информацию о ней."