Neue KI-Technologie erweckt Fotos zum Leben
Fotos sprechen lassen: Microsofts neueste KI VASA-1
Microsoft hat eine KI namens VASA-1 vorgestellt, die aus einem einfachen Foto und einer Sprachaufnahme lebensechte Videos erstellen kann.

Microsoft Research Asia hat unter dem Titel " VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time" ein Framework vorgestellt, dass die Erstellung realistischer, sprechender Avatare ermöglichst. Das Forschungsprojekt setzt neue Maßstäbe in der Erzeugung von realistisch ani...
Microsoft Research Asia hat unter dem Titel " VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time" ein Framework vorgestellt, dass die Erstellung realistischer, sprechender Avatare ermöglichst. Das Forschungsprojekt setzt neue Maßstäbe in der Erzeugung von realistisch animierten Avataren.
Im Vergleich zu früheren Modellen wie OpenAIs Sora, die Text in Videos umwandeln, benötigt VASA-1 nur ein Bild und eine Audiospur, um ein überzeugendes Video zu generieren. Dies funktioniert sogar in Echtzeit mit einer Verzögerung von nur 170 Millisekunden, was es von der Konkurrenz abhebt. Die Videos werden mit 512x512 Pixeln und 45 FPS ausgegeben, ein mit Nvidia RTX 4090 ausgestatteter PC kann ein Video in wenigen Minuten erstellen.
Für Entwickler in der Videospielindustrie und anderen Bereichen der digitalen Content-Erstellung bietet VASA-1 die Möglichkeit, Charaktere und Avatare ohne großen Aufwand realistisch zu animieren. Dies könnte die Produktionskosten senken und die Immersion in digitalen Welten erhöhen.
Aktuell gibt es keine Pläne, VASA-1 kommerziell zu nutzen oder der Öffentlichkeit zugänglich zu machen. Das Projekt dient vorerst reinen Forschungszwecken.
FAQ - Häufig gestellte Fragen zum Thema VASA-1
Kann ich VASA-1 für persönliche Projekte nutzen? Nein, Microsoft hat keine Pläne, VASA-1 derzeit für die Öffentlichkeit freizugeben.
Wie realistisch sind die Videos? Die Videos sind hochgradig realistisch, mit lippensynchroner Sprachausgabe und natürlicher Mimik.
Was unterscheidet VASA-1 von anderen KI-Modellen? VASA-1 kann in Echtzeit arbeiten und benötigt lediglich ein Foto und eine Audiodatei, um ein Video zu erstellen.
Gibt es Risiken bei der Nutzung von VASA-1? Ja, es besteht das Risiko des Missbrauchs, indem Personen ohne deren Zustimmung imitiert werden.
Werden in Zukunft kommerzielle Anwendungen von VASA-1 erwartet? Es gibt aktuell keine Informationen über zukünftige kommerzielle Nutzungsmöglichkeiten.