Meta gibt einen ersten Einblick in seinen Text-zu-Video-KI-Generator

click fraud protection

Die neue Make-A-Video-KI von Meta ist der Bilderzeugungssoftware von DALL-E einige Schritte voraus und ermöglicht die Generierung von Videos aus Texteingabeaufforderungen.

Mark Zuckerberg hat den Nutzern einen Einblick gegeben Metaist neu künstliche Intelligenz namens Make-A-Video, mit dem Videos aus Textbeschreibungen generiert werden können. Bilder mit KI erstellen ist bereits äußerst beeindruckend und ermöglicht die Erstellung wunderschöner Porträts, Landschaften und anderer Kunstwerke mit nur beschreibendem Text. Meta erweitert mit KI die Grenzen und bringt etwas noch Beeindruckenderes – Text-zu-Video-KI-Generierung.

Die KI-Bildgenerierung aus Textbeschreibungen gibt es schon seit einiger Zeit Tools wie DALL-E, Midjourney und anderen gibt es mehrere Optionen, um Bilder aus Text zu erstellen. Das Erstellen von Videos aus Textbeschreibungen war der nächste logische Schritt in der KI-Generierung, und Meta hat möglicherweise mit seiner Make-A-Video-KI geliefert.

Was genau ist das also neu

Mach ein Video KI-System von Meta, und wie schneidet es in Bezug auf Qualität und Benutzerfreundlichkeit ab? Nun, nach den bisher geteilten Videos scheint es ziemlich weit fortgeschritten zu sein und scheint dem, was DALL-E and andere KI-Kunstgeneratoren anbieten würden, wenn sie Videos erstellten. Es ist keineswegs perfekt und einige Videos sehen besser aus als andere, aber insgesamt sind die Ergebnisse ziemlich beeindruckend. Make-A-Video kann frühere Standbilder und Bildgruppen verwenden, um Videos zu erstellen, und kann sogar Videos verwenden, um Variationen dieser Videos zu erstellen. Mark Zuckerbergs Facebook-Post über Make-A-Video gibt uns einen Einblick in das, was wir von der neuen KI erwarten können.

Text-zu-Video-KI ist knifflig

Wie Zuckerberg in seinem Beitrag erklärt, „Es ist viel schwieriger, Videos zu generieren als Fotos, da das System nicht nur jedes Pixel korrekt generieren muss, sondern auch vorhersagen muss, wie sie sich im Laufe der Zeit ändern werden.“ Dies ist sinnvoll, da beim Erstellen von Bewegung mehr Faktoren eine Rolle spielen als beim Erstellen eines Standbilds. Meta verwendet eine Ebene des unüberwachten Lernens um dieses Problem zu lösen, was es dem System erleichtert, Bewegungen zu verstehen. Unbeaufsichtigtes Lernen kann jedoch zu Missbrauch der Software führen, wie z. B. Pornos, Gewalt oder Rassismus. Sobald dieses Tool der Öffentlichkeit zugänglich ist, wird Meta wahrscheinlich bestimmte Sätze und Wörter verbieten, um den Missbrauch seiner KI zu verhindern.

Die KI-Bilderzeugung ist bereits extrem leistungsfähig und kann erstaunliche Kunstwerke oder einfach nur lustige Memes erstellen, aber mit der KI-Videoerzeugung eröffnen sich den Benutzern weitere kreative Möglichkeiten. Vielleicht werden wir eines Tages in der Lage sein, einen ganzen Film nur mit Textbeschreibungen zu erstellen und fortgeschrittene künstliche Intelligenz. Bis dann. MetaDie Make-A-Video-Technologie von ist ein wichtiger Schritt in diese Zukunft.

Quelle: Mark Zuckerberg/Facebook, Mach ein Video