Ich habe gerade meinen Vortrag an der Harvard GSD über die Zukunft der kreativen KI veröffentlicht – wohin wir gehen und wie wir sie nutzen können:
Behandelte Themen:
- Räumliche Intelligenz: Photogrammetrie, neuronale Strahlungsfelder (NeRFs) und 3D-Gaussian-Splatting zur Digitalisierung der Realität.
- Visuelle Intelligenz: KI-gestützte Pose-Schätzung, Segmentierung, Tiefeninferenz und Neubeleuchtung.
- Hybride Workflows: Vibe-Codierung, Model Context Protocol (MCP) und wie LLMs mit Blender, Unreal und Runway interagieren.
- Paradigma von Inhalt zu Inhalt: Über den Text-zu-Video-Ansatz hinaus zu vollständig personalisierten, dynamischen und just-in-time Medien.
- Die Zukunft der Medien: Personalisierte Podcasts, AR-Touren, generative KI-Spiele und die Verschmelzung von Software mit Inhalten.
Da die Nano-Banane über das Weltwissen von Gemini verfügt, kannst du einfach Screenshots aus der realen Welt hochladen und sie bitten, Dinge für dich zu annotieren.
"Du bist ein standortbasierter AR-Erlebnisgenerator. Hebe [Sehenswürdigkeit] in diesem Bild hervor und annotiere relevante Informationen darüber."
Wenn Apple einen thermischen/infrared Sensor auf ein iPhone bringt, werde ich sofort eines kaufen. Eine FLIR-Auflösung von 640-1024px auf einem Telefon wäre verrückt.