Auf der Google I/O 2025 stellte Google Veo 3 vor – ein KI-gestütztes Tool zur Videoerstellung, das realistische Videos mit synchronisiertem Audio aus einfachen Text- oder Bildbeschreibungen generiert. Veo 3 kombiniert fortschrittliche Text-zu-Video-Technologien mit Audio-Generierung, einschließlich Dialogen, Hintergrundgeräuschen und Musik.
Für einen umfassenden Überblick über alle KI-Neuheiten der Google I/O 2025, siehe unseren vorherigen Artikel: Google I/O 2025: Alle KI-Neuheiten im Überblick.
Text-zu-Video-Generierung: Erstelle 8-sekündige Videos aus einfachen Textbeschreibungen.
Integrierte Audio-Generierung: Füge automatisch generierte Dialoge, Soundeffekte und Musik hinzu.
Hohe Realitätsnähe: Verbesserte Bewegungsgenauigkeit, Lippen-Synchronisation und visuelle Qualität.
Zugänglichkeit: Verfügbar über die Gemini-App für Nutzer des Ultra-Abonnements.
Aktuell ist Veo 3 nur für Nutzer in den USA verfügbar. Ein internationaler Rollout ist geplant, jedoch gibt es noch keine offiziellen Termine für andere Länder.
Um die Fähigkeiten von Veo 3 zu demonstrieren, hier einige Beispiele:
Dialog-Demo: Ein Beispiel für ein mit Veo 3 erstelltes Video mit mehreren Charakteren und Stimmen.
Künstlerische Anwendung: Ein von Google Flow erstelltes Video, das die kreative Nutzung von Veo 3
Google arbeitet bereits mit Filmemachern zusammen, um die Möglichkeiten von Veo 3 zu erkunden. Ein Beispiel ist das Projekt “Ancestra”, das in Zusammenarbeit mit Regisseur Darren Aronofsky entstanden ist. Dabei wurden reale Aufnahmen mit KI-generierten Inhalten kombiniert, um eine neue Form des Storytellings zu schaffen. Quelle: blog.google.com
Trotz der beeindruckenden Fähigkeiten von Veo 3 gibt es einige Einschränkungen:
Längenbeschränkung: Derzeit sind Videos auf 8 Sekunden begrenzt.
Zugänglichkeit: Veo 3 ist derzeit nur für Ultra-Abonnenten verfügbar.
Ethik: Die realistische Generierung von Videos und Audio wirft Fragen bezüglich Deepfakes und Urheberrecht auf.