Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Cristóbal Valenzuela
cofounder ceo @runwayml
Nehmen Sie ein Video-Beispiel von einem alten/frühen Modell und verbessern Sie die Qualität mit Runway Aleph. Dies ist das KI-Äquivalent zur digitalen Remasterisierung von Archivmaterial von einer alten Plattenkamera aus den 1890er Jahren.
"Verbessern Sie die Qualität dieses Videos. Es sollte hochauflösend und ohne Artefakte sein. Ein Boxkampf findet statt."
772
In völlig unrelated Nachrichten wird Gen-4 jetzt drei Monate benötigen, um Ihre Videos zu erstellen, anstatt 20 Sekunden. Das Modell wird auch jeden Pixel erzeugen, indem es sie sorgfältig, einen nach dem anderen, auf dem Bildschirm platziert, unter Verwendung einer alten, vergessenen japanischen Technik. Wir erhöhen den Preis pro Generation auf 5.000 $ pro Sekunde.

Cristóbal Valenzuela10. Aug., 04:57
Dieses Gefühl ist tatsächlich eine ziemlich verbreitete und erforschte kognitive Verzerrung, die als Aufwand-Heuristik oder Arbeitsillusion bezeichnet wird: Menschen schätzen ein Ergebnis höher, wenn sie glauben, dass ein größerer Aufwand oder mehr Zeit in die Produktion geflossen ist, selbst wenn das Ergebnis dasselbe ist. Dies geschieht häufig, wenn der Wert schwer zu bestimmen ist, wenn der Bewertende keine Expertise in dem Thema hat oder das, was Sie beurteilen, völlig neu für Sie ist.


8,62K
Dieses Gefühl ist tatsächlich eine ziemlich verbreitete und erforschte kognitive Verzerrung, die als Aufwand-Heuristik oder Arbeitsillusion bezeichnet wird: Menschen schätzen ein Ergebnis höher, wenn sie glauben, dass ein größerer Aufwand oder mehr Zeit in die Produktion geflossen ist, selbst wenn das Ergebnis dasselbe ist. Dies geschieht häufig, wenn der Wert schwer zu bestimmen ist, wenn der Bewertende keine Expertise in dem Thema hat oder das, was Sie beurteilen, völlig neu für Sie ist.


16,85K
Die Kontrolle kommt diesmal zuletzt. Aber sie kommt.

Cristóbal Valenzuela14. Nov. 2024
Ich spreche oft über Kontrolle in der KI. Aber ich habe festgestellt, dass die Leute manchmal denken, ich meine "bessere Eingabeaufforderungen". Hier sind also meine Gedanken dazu, was ich mit Kontrolle meine: Wir lösen Grafiken rückwärts.
Die Geschichte der Computergrafik folgt einem klaren Fortschritt: Zuerst kam die Kontrolle, dann die Qualität. Es dauerte Jahrzehnte, um die richtigen Abstraktionen - Kurven, Dreiecke, Polygone, Netze - zu etablieren, die es uns ermöglichen würden, genau das zu zeichnen, was wir auf einem Bildschirm wollten. Diese grundlegenden Bausteine haben sich nicht viel verändert, weil sie sich als die richtigen erwiesen haben. Von Ed Catmulls Hand bis zu modernen Spiel-Engines sind die Kernprinzipien, wie wir Pixel steuern, bemerkenswert stabil geblieben. Die Grundlagen entstanden nicht nur zur Kontrolle, sondern auch als effiziente Möglichkeiten, komplexe Szenen zu beschreiben und darzustellen.
Die Renderqualität war die letzte Grenze. Ein Würfel, der 1987 mit der ersten Version von Renderman modelliert wurde, folgt denselben geometrischen Prinzipien wie einer, der heute in Blender modelliert wird. Was dramatisch anders ist, ist das Rendering - das Licht, die Materialien, die Schatten und die Reflexionen, die es real erscheinen lassen. Die Branche hat Jahrzehnte damit verbracht, das unheimliche Tal zu schließen und zunehmend ausgeklügelte Renderingsysteme zu entwickeln, um dem Fotorealismus näher zu kommen. Natürlich haben viele grafische Innovationen sowohl die Kontrolle als auch die Qualität gleichzeitig verbessert, und die Geschichte des grafischen Fortschritts ist komplexer als nur "Kontrolle dann Qualität."
Aber diese Reihenfolge war nicht willkürlich. Die Grafikpipeline selbst erzwingt sie: Geometrie definiert, was wir zeichnen wollen, Shader bestimmen, wie es aussieht. Selbst Echtzeitantriebe folgen diesem Muster - zuerst werden Detailgradkontrollen festgelegt, dann wird die Renderqualität innerhalb dieser Einschränkungen verbessert.
Die KI hat diese Reihenfolge vollständig umgekehrt.
Die heutigen generativen Modelle erreichen fotorealistische Renderqualität, die traditionellen Pipelines rivalisiert oder übertrifft, indem sie effektiv den gesamten Grafik-Stack - von Geometrie bis globale Beleuchtung - durch massives Training erlernen. Sie haben die traditionelle Trennung zwischen Modellierung und Rendering zusammengeklappt und ein End-to-End-System geschaffen, das atemberaubende Bilder aus hochrangigen Beschreibungen erzeugen kann.
Was fehlt, ist Kontrolle.
Während wir fotorealistische Szenen in Sekunden generieren können, fehlt uns die präzise Kontrolle, die Jahrzehnte der Grafikforschung bereitgestellt haben. Wir können Geometrie nicht einfach anpassen, Materialien nicht feinabstimmen oder das Licht mit der Granularität manipulieren, die Künstler erwarten. Die deterministische Natur traditioneller Grafiken - bei der jeder Parameter eine vorhersehbare Wirkung hat - wurde durch probabilistische Modelle ersetzt.
Das ist das inverse Grafikproblem: Wir haben das Rendering gelöst, bevor wir die Kontrolle gelöst haben. Unsere Modelle können atemberaubende Bilder erstellen, aber es fehlen die grundlegenden Abstraktionen, die Computergrafik so mächtig gemacht haben - die Fähigkeit, präzise, absichtliche Änderungen auf jeder Detailstufe vorzunehmen.
Das ist keine permanente Einschränkung. So wie die Computergrafik schließlich das Rendering-Problem gelöst hat, wird die KI das Kontrollproblem lösen. Die Frage ist nicht, ob, sondern wie. Wir finden die richtigen Abstraktionen zur Steuerung generativer Modelle - das Äquivalent zu den Kurven, Dreiecken und Polygonen, die die Computergrafik revolutioniert haben. Ich denke, die Lösungen könnten anders aussehen. Neue Primitiven zur Kontrolle, die nativ für neuronale Netzwerke sind, könnten die richtige Antwort sein, anstatt zu versuchen, traditionelle Grafik Konzepte in dieses neue Paradigma zu zwingen. Obwohl ich auch denke, dass es hybride Ansätze gibt, die traditionelle Grafiken mit KI kombinieren und es wert sind, erkundet zu werden.
Das Ziel bleibt, das gleiche Maß an Vorhersehbarkeit und Präzision zu bieten, das die Computergrafik zu einem grundlegenden Werkzeug für kreative Ausdrucksformen gemacht hat. Das ist das ultimative Ziel, aber besser: in Echtzeit, kostengünstig und mit präziser Kontrolle, die so intuitiv und allgemein wie möglich ist.
Die Kontrolle kommt diesmal zuletzt. Aber sie kommt.
4,87K
Ein weiteres großartiges Beispiel dafür, wie man präzise Kontrolle mit personalisierten Schnittstellen erreichen kann. Sie können Runway mit Ihrem angepassten Pfad und allen gewünschten Videoanmerkungen anstoßen.
Prompt+erstes Video: Das blaue Oval ist ein UFO, ein fliegender Untertasse-Raumschiff, das über das Haus fliegt, und die Partikel sind sein Traktorstrahl aus Licht, der das Haus anhebt. Entfernen Sie das blaue Oval und die Punktanmerkungen.
7,09K
Ja! Du kannst viele Videos gleichzeitig im Chat-Modus generieren.

Alin Cristian Tiganus (eyes2AI)7. Aug., 04:44
Ich dachte, der Chat-Modus von @runwayml erlaubt nur eine Generation gleichzeitig. Es stellt sich heraus, dass ich mich geirrt habe. Jetzt kann ich neben der Arbeit mit Turbo zwei Generationen gleichzeitig ausführen, und vielleicht ist es nur mein Eindruck, aber es scheint, als würde es die Eingabeaufforderungen im Chat-Modus besser befolgen. Ich weiß nicht, aber es fühlt sich einfach richtig an, als würde ich arbeiten, ohne es wirklich zu merken. Danke!
128
Alles, was du tun musst, ist, es ihm zu sagen.

Jamie8. Aug., 06:21
Selbst dein langweiligstes Filmmaterial kann mit @runwayml Aleph zu einem Spielplatz werden. Füge etwas hinzu. Ändere es. Oder füge eine Möwe hinzu. Und alles, was du tun musst, ist Aleph zu sagen, was du willst.
3,07K
Top
Ranking
Favoriten
Onchain-Trends
Im Trend auf X
Aktuelle Top-Finanzierungen
Am bemerkenswertesten