Verbesserung der Qualität von KI-Videos: Einfache Anpassungen an den Eingabeaufforderungen machen einen großen Unterschied – probieren Sie es selbst aus

Das Geheimnis klarerer, flüssigerer und professionellerer Videos

Während Chatbots sich ständig weiterentwickeln und immer mehr Funktionen erhalten, entwickeln sich auch KI-Videogeneratoren rasant weiter. Viele befinden sich noch in der Betaphase oder sind nur auf Einladung verfügbar. Die Qualität der Eingabeaufforderungen spielt jedoch eine entscheidende Rolle für das Endergebnis. Einfach ausgedrückt: Je präziser und detaillierter die Eingabeaufforderungen sind, die Sie in das KI-System eingeben, desto besser und relevanter sind die Ergebnisse.

Nachdem ich mehrere Plattformen getestet habe (einschließlich Google Veo 3, dem Premium-Videogenerator, der derzeit für 249 US-Dollar pro Monat über Google Ultra erhältlich ist), habe ich festgestellt, dass die Art und Weise, wie Sie Eingabeaufforderungen schreiben, die Ergebnisse radikal verändert.

So habe ich meine KI-generierten Videos verbessert – und hier erfahren Sie, mit welchen Tricks Sie Ihre Videos schärfer, filmischer und stimmiger gestalten können.

Fairerweise muss man sagen, dass alle Befehle mit Veo 2 getestet wurden – Googles einfacherem Videogenerator ohne Audio. Um es selbst auszuprobieren, müssen Sie sich auf die Warteliste für das VideoFX-Tool von Google Labs setzen lassen, wo Veo 2 derzeit verfügbar ist.

Sie können Veo 3 auch über Google AI Studio oder Canva Pro aufrufen. Diese Befehle können in allen führenden KI-Videogeneratoren verwendet werden, darunter Midjourney, Firefly und Sora.

Beginnen Sie mit der Struktur, nicht mit dem Stil.

Ein häufiger Fehler, den viele Benutzer bei der Verwendung von KI-Tools zur Erstellung von Bildern oder Videos machen, besteht darin, mit allgemeinen, vagen Beschreibungen zu beginnen, wie z. B. „Ein atemberaubendes Kinovideo von einem Strand bei Sonnenuntergang“. Die Beschreibung klingt zwar schön, aber es mangelt ihr an Präzision und Spezifität.

Stattdessen erziele ich immer mehr Erfolg, wenn ich mit der Struktur und den technischen Details beginne: „Einrichten einer Totalen eines Strandes zur goldenen Stunde, die Kamera bewegt sich langsam nach links.“ Je mehr ich es wie die Beschreibung eines Filmemachers schreibe, desto professioneller und ausgefeilter wirken die Ergebnisse. Das Denken in der Logik des Filmemachens führt beim Einsatz von KI zu besseren visuellen Ergebnissen.

Denken Sie wie ein Kameramann

Veo scheint gut auf die Filmsprache zu reagieren.

Durch die Verwendung von Begriffen wie „Kamerafahrt aus der Untersicht eines im hohen Gras laufenden Kindes“ oder „Drohnenaufnahme einer Berghütte bei Sonnenaufgang“ werden visuelle Bilder erzeugt, die viel dynamischer sind als einfache Beschreibungen.

Wenn Sie mit der Terminologie des Filmemachens nicht vertraut sind, denken Sie an Einstellungen: Weitwinkel, Halbtotale, Nahaufnahme und Draufsicht. Obwohl ich kein Kameramann bin, habe ich genügend Drehbücher geschrieben und an genügend Fernseh- und Filmsets mitgewirkt, um diese Begriffe zu kennen.

Hier sind einige grundlegende Begriffe aus der Filmbranche, die ich häufig in meinen Eingabeaufforderungen verwende.

Kamerawinkel und -bewegungen: Ein umfassender Leitfaden

Einspielung Eine Totale dient dazu, die Gesamtszene zu etablieren und den räumlichen Kontext der Geschichte zu vermitteln. Sie wird häufig zu Beginn eines Films oder einer Szene verwendet, um den Zuschauer zu lenken und auf das Kommende vorzubereiten.
Nahaufnahme – Konzentriert sich auf das Gesicht einer Person oder ein kleines, wichtiges Detail. Es wird verwendet, um Emotionen und Reaktionen hervorzuheben oder ein bestimmtes Element in einer Szene hervorzuheben.
Weitwinkelaufnahme / Totale – Zeigt die Person vollständig in ihrer Umgebung. Es wird verwendet, um die Beziehung zwischen der Person und dem Ort oder die Größe der Szene darzustellen.
Über-die-Schulter-Aufnahme – Wird häufig in Dialogszenen verwendet. Dabei erscheint die Kamera hinter der Schulter eines Sprechers und fokussiert auf das Gesicht des anderen Sprechers. Dies trägt dazu bei, ein Gefühl der Interaktion und Intimität zwischen den beiden Charakteren zu erzeugen.
Kamerafahrt / Dolly-Shot Die Kamera bewegt sich sanft, um einer sich bewegenden Person oder einem Objekt zu folgen. Sie wird verwendet, um ein Gefühl von Dynamik und Bewegung zu erzeugen oder um eine Figur auf ihrer Reise zu begleiten.
Kranschuss – Eine weite Kamerabewegung von oben. Sie wird verwendet, um die Weite einer Szene zu zeigen oder ein Gefühl von Ehrfurcht oder Erhabenheit zu erzeugen.
Statischer Schuss – Keine Kamerabewegung. Wird verwendet, um ein Gefühl der Ruhe oder Stille zu erzeugen oder um den Fokus auf die Charaktere oder Ereignisse in einer Szene zu richten.
Vergrößern/Verkleinern Die Kamera zoomt mithilfe des Objektivs hinein oder heraus. Beim Hineinzoomen wird ein bestimmtes Detail fokussiert, beim Herauszoomen die gesamte Szene gezeigt.
Handkamera – Erzeugt einen realistischen, verwackelten Effekt. Wird verwendet, um ein Gefühl von Chaos oder Spannung zu erzeugen oder einem Film den Charakter eines Dokumentarfilms zu verleihen.
POV-Aufnahme – Ereignisse werden aus der Sicht einer Figur dargestellt. Sie dienen dazu, den Zuschauer in die Erfahrungen der Figur einzubeziehen oder ein Gefühl der Spannung oder Überraschung zu erzeugen.
Holländischer Winkel Ein schräger Horizont wird verwendet, um ein Gefühl der Spannung oder Verwirrung zu erzeugen. Er wird verwendet, um zu zeigen, dass die Dinge nicht gut laufen, oder um ein Gefühl der Instabilität zu erzeugen.

Beleuchtung und Atmosphäre

Dezente Beleuchtung Diese Beleuchtung erzeugt dank der tiefen Schatten eine dunkle, dramatische Atmosphäre. Sie wird oft verwendet, um ein Gefühl von Geheimnis oder Spannung zu erzeugen.
High-Key-Beleuchtung – Es zeichnet sich durch Helligkeit und Fröhlichkeit aus und minimiert Schatten. Es ist in der kommerziellen Fotografie und Werbung beliebt, um ein Gefühl von Positivität und Reinheit zu erzeugen.
Natürliches Licht Die Verwendung von direktem oder indirektem Sonnenlicht oder die Simulation von Tageslicht in einem Studio ist ideal für die Erstellung realistischer, natürlich aussehender Bilder.
Hintergrundbeleuchtung – Das Licht strahlt von hinten auf das Motiv und erzeugt so eine markante Silhouette. Wird verwendet, um die Form des Motivs hervorzuheben oder einen künstlerischen Effekt zu erzielen.
Linsenreflexion – Auf der Linse erscheinen unerwünschte Linien oder Lichtpunkte, die beabsichtigt sein können, um einen künstlerischen Effekt zu erzielen, oder durch Reflexionen innerhalb der Linse verursacht werden.
Kinoreifes Leuchten Weiches, verträumtes Licht, das in Filmen oft verwendet wird, um eine romantische oder fantasievolle Atmosphäre zu erzeugen, kann mit Filtern oder durch Nachbearbeitung erreicht werden.
Neonbeleuchtung – Helle Neonlichter erzeugen lebendige Farben und ein futuristisches Gefühl. Sie werden oft verwendet, um nächtliche Stadtszenen darzustellen oder einen modernen Touch zu verleihen.
Filmkörnung Durch Hinzufügen einer feinen Körnung zu einem Bild verleihen Sie ihm ein klassisches oder Retro-Feeling. Diese kann während des Bearbeitungsprozesses digital hinzugefügt werden.

Teilen Sie es in Schübe auf.

Anstatt eine komplette Geschichte in einem Satz zu verlangen, teilen Sie Ihre Aufforderung in aufeinanderfolgende visuelle Momentaufnahmen auf. Dies hilft videogenerierenden KI-Systemen, präziser und kontrollierter zu erzählen. Zum Beispiel:

Aufnahme 1: Weitwinkelaufnahme eines Skifahrers, der bei Sonnenuntergang einen Hang hinuntergleitet.

Aufnahme 2: Nahaufnahme in Zeitlupe von den Rädern, die auf den Asphalt auftreffen.

Einstellung 3: Die Kamera folgt von hinten, während Funken vom Brett fliegen.

Auch wenn Ihr bevorzugter KI-Videogenerator noch keine vollständigen Szenenübergänge unterstützt, hilft dieser Ansatz dem System, die Geschichte gezielter zu erzählen. Diese Technik ist unerlässlich, um professionelle Ergebnisse in der KI-Videoproduktion zu erzielen.

Fügen Sie Bewegung, Stimmung und Details hinzu und testen und wiederholen Sie dann die Schritte, um die Ergebnisse zu verbessern.

Bewegung ist ein wesentliches Element, um einem Video Realismus zu verleihen. Ich begann, Ausdrücke hinzuzufügen, die Bewegung beschreiben, wie zum Beispiel „Kamera schwenkt nach oben“, „Nebel breitet sich aus“ oder „Wind rauscht in den Bäumen“. Diese einfachen Details verleihen der Szene einen enormen filmischen und realistischen Charakter.

Ebenso spielen Stimmungssignale eine wichtige Rolle. Ausdrücke wie „gedämpftes Licht“, „bewölkter Himmel“ oder „Neonleuchten“ tragen dazu bei, eine bestimmte Atmosphäre zu schaffen und die visuelle Wirkung zu verstärken.

Die Videoproduktion mit KI steckt noch in den Kinderschuhen, und die Ergebnisse können manchmal unvorhersehbar sein. Daher ist es notwendig, jede Eingabeaufforderung mehrmals auszuführen, um die verschiedenen Ergebnisse zu vergleichen und kleinere Anpassungen an den Wörtern vorzunehmen, um das Endergebnis zu verbessern. Dieser Prozess ist ein wesentlicher Bestandteil der Qualitätsverbesserung KI-generierter Videos.

Mir ist aufgefallen, dass Veo eine deutlich bessere Konsistenz bietet als andere Tools, die ich ausprobiert habe. Die Ergebnisse sind zwar nicht immer perfekt, aber wenn sie es sind, klingen sie wie bei einem professionellen Videodreh. Die folgenden Eingabeaufforderungen wurden mit Veo 3 verwendet und enthalten daher auch Soundeffekte.

Beispiele für Ansprüche, die Sie ausprobieren können

Um Ihren Horizont zu erweitern und das volle Potenzial generativer KI auszuschöpfen, finden Sie hier einige Beispiel-Prompts, die Sie ausprobieren können. Diese Prompts sollen kreatives Denken anregen und Ihnen helfen zu verstehen, wie Sie effektive Prompts erstellen, um optimale Ergebnisse mit KI-Modellen wie Google Bard oder ähnlichen zu erzielen. Probieren Sie diese Prompts in verschiedenen Bereichen aus, z. B. beim Verfassen von Inhalten, bei der Ideenfindung und Problemlösung, oder auch für speziellere Aufgaben wie die Datenanalyse oder die Entwicklung digitaler Marketingstrategien. Denken Sie daran: Der Schlüssel liegt darin, zu experimentieren und zu iterieren, um die Qualität Ihrer Prompts zu verbessern.

Landschaft

Landschaftsbeschreibung: Eine Totale einer Bergkette zur goldenen Stunde, wobei die Kamera langsam nach links schwenkt. Nebelschwaden zwischen den Gipfeln, sanftes Umgebungslicht und filmische Tiefenschärfe. Diese Beschreibung soll künstliche Intelligenz anleiten, ein realistisches und atemberaubendes Bild einer Berglandschaft zu erzeugen.

الرياضة

Beschreibung einer Sportszene: Zeitlupenaufnahme eines Skateboarders, der bei Sonnenuntergang von einer Klippe springt. Die Kamera verfolgt die Szene aus einem niedrigen Winkel, während Staub aufsteigt. Warmes Licht und dynamische Energie.

Erstellen Sie ansprechende Food-Videos (Food Reel)

Idee zur Erstellung eines Food-Videos (Food Reel Prompt): Eine Draufsicht auf eine dampfende Schüssel Ramen, die auf einem beliebten Tokioter Markt serviert wird. Eine Nahaufnahme von Essstäbchen, die die Nudeln anheben, während Dampf aus der Schüssel aufsteigt. Warmes Licht und lebendige Details unterstreichen die Schönheit der köstlichen Ramen. Dieser Clip soll Feinschmecker ansprechen, das authentische japanische Ramen-Erlebnis präsentieren und die Zuschauer zum Interagieren und Teilen anregen. Dieser Clip kann auf Plattformen wie Instagram, TikTok und Facebook verwendet werden, um die Interaktion zu erhöhen und ein breiteres Publikum zu erreichen, das sich für Food-Videos interessiert.

Action-POV

**Beispiel für die Beschreibung einer Bewegungsperspektive:** Die Ich-Perspektive eines Radfahrers, der einen Waldweg entlangrast. Fallende Blätter flattern, und Sonnenlicht spiegelt sich zwischen den Bäumen. Realistische GoPro-Aufnahmen, immersive Bewegung. Diese Art der Fotografie vermittelt dem Betrachter das Gefühl, Teil der Handlung zu sein, als würde er sie selbst ausführen. Diese Technik kann zum Filmen verschiedener Sportarten oder auch beim Geschichtenerzählen verwendet werden, um Spannung und Aufregung zu steigern.

Das Endergebnis

Wenn Ihre KI-generierten Videos klobig oder „künstlich“ wirken, liegt das Problem wahrscheinlich an den von Ihnen verwendeten Eingabeaufforderungen. Mit ein paar geschickten Anpassungen, Fokus auf Szenenstruktur, Kamerawinkel und einer präzisen Definition der gewünschten Aktionen erzielen Sie professionellere und filmischere Ergebnisse. Schreiben Sie beispielsweise statt „Frau geht in einem Park spazieren“ lieber „Nahaufnahme einer lächelnden Frau, die in einem sonnigen Park spazieren geht, niedriger Kamerawinkel, Fokus auf Schritte“.

Google Veo Es ist eines der leistungsstärksten KI-Tools, die ich für die Videoerstellung getestet habe. Wie jedes KI-System hängt es jedoch stark von der Qualität der empfangenen Befehle ab. Mit anderen Worten: Je detaillierter und präziser die Befehle, desto besser die Ergebnisse.

Möchten Sie es selbst ausprobieren? Beginnen Sie mit einem kleinen Projekt. Wählen Sie eine Szene aus, beschreiben Sie sie detailliert, als würden Sie eine Shotlist für einen Film erstellen, und sehen Sie sich die Ergebnisse an. Teilen Sie uns Ihre Erfahrungen in den Kommentaren mit und lassen Sie uns wissen, wie es gelaufen ist!