Yann LeCun sagt, dass wir niemals menschliches Intelligenzniveau erreichen werden, wenn wir nur mit Text trainieren. KI muss aus hochbandbreitigen Sensordaten wie Video lernen, um wahre Weltmodelle zu erstellen. Aktuelle Modelle wirken zwar wie PhD-Intelligenz, aber sie geben hauptsächlich wieder, ohne echtes Verständnis. "Sogar eine Katze versteht die physische Welt besser."