GoogleGoogle

Gemini Omni Flash

Ein Modell. Video rein, Video raus, jede Richtung.

Geminis multimodales Verständnis angewendet auf Video — generieren aus Text, ein Bild animieren, Referenzbilder kombinieren oder einfach die gewünschte Änderung beschreiben.

Omni Flash behandelt Video als Dialog, nicht als Einmal-Render. Es bringt Geminis Weltwissen — Geschichte, Biologie, erzählerische Logik — in jedes Bild und lässt Sie einen Clip in normaler Sprache verfeinern, statt von vorn zu prompten. Text, ein einzelnes Foto oder bis zu zehn Referenzbilder: dasselbe Modell verarbeitet alles davon.

Stark bei

Text zu VideoBild zu VideoReferenz zu VideoVideo-BearbeitungDialogbasierte VerfeinerungAudio-Steuerung im Prompt

Vier Wege zur Erstellung

Ein Modell, vier Einstiegspunkte — starten Sie bei null, bei einem Bild, bei mehreren oder bei einem fertigen Clip.

Am beliebtesten
Text zu Video

Aus einem Prompt generieren

Beschreiben Sie die Einstellung, das Tempo, sogar den Soundtrack — Omni Flash steuert Audio direkt über den Prompt, sodass „ruhige Hintergrundmusik“ oder „kein Dialog“ einfach funktioniert.

Ideal für: Konzepte, Storyboards, schnelle Social-Clips

Bild zu Video

Ein einzelnes Bild animieren

Erwecken Sie ein Referenzbild mit einem Text-Prompt zum Leben. Das Modell entscheidet anhand Ihrer Beschreibung, wie sich das Motiv bewegt.

Ideal für: Produktaufnahmen, Porträts, Statisch-zu-Bewegung

Referenz zu Video

Mehrere Referenzen kombinieren

Fügen Sie bis zu zehn Referenzbilder ein und binden Sie sie mit Tags wie '<IMAGE_REF_0>' und '<IMAGE_REF_1>' direkt im Prompt an Rollen — für Szenen mit mehreren Motiven und konsistentem Stil.

Ideal für: Markenkonsistenz, Multi-Produkt-Szenen, Charakter-Ensembles

Video-Bearbeitung

Mit einfachen Anweisungen bearbeiten

Laden Sie einen bestehenden Clip hoch und beschreiben Sie die gewünschte Änderung — „mach dieses Video zu Anime, lass alles andere gleich.“ Keine Timeline, kein manuelles Maskieren.

Ideal für: Stiländerungen, schnelle Korrekturen, Iteration am Rohschnitt

Die Eckdaten

Einfache, planbare Spezifikationen für jede Operation.

Dauer

3–10 Sekunden pro Generierung — längere Laufzeiten sind laut Google in Planung.

Seitenverhältnisse

16:9 Querformat und 9:16 Hochformat, passend für Breitbild wie Social Media.

Referenzbilder

Bis zu 10 Bilder pro Generierung, direkt im Prompt adressierbar.

Preise

Ein einheitlicher Satz — 5 Credits pro Sekunde — für Text, Bild, Referenz und Bearbeitung.

Für schnelle Teams entwickelt

Omni Flash tauscht Render-Komplexität gegen Geschwindigkeit und einen Workflow in natürlicher Sprache.

E-Commerce & Produkt

Verwandeln Sie ein einzelnes Produktfoto in eine bewegte Präsentation oder kombinieren Sie mehrere Produktaufnahmen zu einer konsistenten Szene.

Social & Kurzformat-Content

Vom Prompt zum vertikalen, klanggerechten Clip in einem Durchgang — ohne separaten Audio-Generierungsschritt.

Schnelle Video-Bearbeitung

Keine Timeline nötig. Beschreiben Sie eine Stiländerung oder Korrektur und lassen Sie die dialogbasierte Bearbeitung sie direkt anwenden.

Storytelling & Konzeption

Nutzen Sie Geminis Weltwissen, um erzählerische Logik, Schauplätze und Details über eine Szene hinweg konsistent zu halten.

Bereit, mit Gemini Omni Flash zu erstellen?

Starten Sie noch heute mit kostenlosen Credits in die Video-Generierung und -Bearbeitung.

Jetzt starten

Kostenlose Credits zum Ausprobieren

100 Credits inklusive — keine Karte erforderlich
Text, Bild, Referenz und Bearbeitung — ein einheitlicher Satz
16:9 und 9:16 Ausgabe, 3–10 Sekunden Dauer
Kommerzielle Nutzungsrechte inklusive

Häufig gestellte Fragen

Was ist Gemini Omni Flash?

Gemini Omni Flash ist Googles kosteneffizientes Video-Modell, das Geminis multimodales Verständnis mit Video-Generierung und -Bearbeitung verbindet. Es ist auf faktry verfügbar — für Text-zu-Video, Bild-zu-Video, Referenz-zu-Video und anweisungsbasierte Video-Bearbeitung.

Wie funktioniert die dialogbasierte Video-Bearbeitung?

Laden Sie ein Ausgangsvideo hoch und beschreiben Sie die gewünschte Änderung in normaler Sprache — zum Beispiel „mach dieses Video zu Anime, lass alles andere gleich.“ Das Modell wendet die Änderung direkt an, ohne manuelles Maskieren oder Timeline. Sprachbearbeitung und Szenenverlängerung werden noch nicht unterstützt.

Was ist die maximale Videodauer?

Text-zu-Video, Bild-zu-Video und Referenz-zu-Video unterstützen derzeit Clips von 3–10 Sekunden. Google hat längere Laufzeiten für die Roadmap angekündigt.

Wie viele Referenzbilder kann ich verwenden?

Die Referenz-zu-Video-Operation akzeptiert bis zu 10 Bilder, die Sie im Prompt mit Tags wie '<IMAGE_REF_0>' und '<IMAGE_REF_1>' bestimmten Rollen zuordnen können — für Konsistenz bei mehreren Motiven.

Wird generiertes Video mit einem Wasserzeichen versehen?

Ja. Mit Gemini Omni Flash generiertes Video trägt Googles SynthID-Wasserzeichen, und Sicherheitsfilter werden sowohl auf Eingaben als auch auf Ausgaben angewendet.