Neue KI-Technologie erweckt Fotos zum Leben

Fotos sprechen lassen: Microsofts neueste KI VASA-1

Microsoft hat eine KI namens VASA-1 vorgestellt, die aus einem einfachen Foto und einer Sprachaufnahme lebensechte Videos erstellen kann.

Microsoft stellt "VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time" vor.

Microsoft Research Asia hat unter dem Titel " VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time" ein Framework vorgestellt, dass die Erstellung realistischer, sprechender Avatare ermöglichst. Das Forschungsprojekt setzt neue Maßstäbe in der Erzeugung von realistisch ani...

Im Vergleich zu früheren Modellen wie OpenAIs Sora, die Text in Videos umwandeln, benötigt VASA-1 nur ein Bild und eine Audiospur, um ein überzeugendes Video zu generieren. Dies funktioniert sogar in Echtzeit mit einer Verzögerung von nur 170 Millisekunden, was es von der Konkurrenz abhebt. Die Videos werden mit 512x512 Pixeln und 45 FPS ausgegeben, ein mit Nvidia RTX 4090 ausgestatteter PC kann ein Video in wenigen Minuten erstellen.

Für Entwickler in der Videospielindustrie und anderen Bereichen der digitalen Content-Erstellung bietet VASA-1 die Möglichkeit, Charaktere und Avatare ohne großen Aufwand realistisch zu animieren. Dies könnte die Produktionskosten senken und die Immersion in digitalen Welten erhöhen.

Aktuell gibt es keine Pläne, VASA-1 kommerziell zu nutzen oder der Öffentlichkeit zugänglich zu machen. Das Projekt dient vorerst reinen Forschungszwecken.

FAQ - Häufig gestellte Fragen zum Thema VASA-1

Kann ich VASA-1 für persönliche Projekte nutzen? Nein, Microsoft hat keine Pläne, VASA-1 derzeit für die Öffentlichkeit freizugeben.

Wie realistisch sind die Videos? Die Videos sind hochgradig realistisch, mit lippensynchroner Sprachausgabe und natürlicher Mimik.

Was unterscheidet VASA-1 von anderen KI-Modellen? VASA-1 kann in Echtzeit arbeiten und benötigt lediglich ein Foto und eine Audiodatei, um ein Video zu erstellen.

Gibt es Risiken bei der Nutzung von VASA-1? Ja, es besteht das Risiko des Missbrauchs, indem Personen ohne deren Zustimmung imitiert werden.

Werden in Zukunft kommerzielle Anwendungen von VASA-1 erwartet? Es gibt aktuell keine Informationen über zukünftige kommerzielle Nutzungsmöglichkeiten.

Autor: Eric Bonner • 19.4.2024

Frag’ die KI

Umfrage zum Valentinstag Liebe lieber ohne KI: Mehrheit lehnt KI als Liebesberater ab

EU-Forschungsprojekt SPINE O2 Telefónica plant KI-fähige Mobilfunknetze

Mehr Kontrolle im Browser Firefox 148 bringt Kill-Switch für KI-Funktionen: Mozilla gibt Nutzern Kontrolle zurück

Die KI Copilot von Microsoft bekommt Updates spendiert.

Kurskorrektur bei Copilot Microsoft überdenkt KI-Strategie in Windows 11

KI-Sprachrekorder im Kreditkartenformat Plaud Note Pro im Test: Diktieren und protokollieren für Profis

Übernahme bestätigt Milliarden-Deal: Apple übernimmt israelisches KI-Startup Q.ai

KI-gestützte Suche mit neuen Funktionen Google-Suche erhält KI-Upgrade mit Gemini 3

jbl-bandbox-trio-portable-guitar-amp-bluetooth-speaker

Tragbarer Musikverstärker mit KI-Technologie JBL BandBox trennt Vocals und Gitarren – in Echtzeit

bose-soundtouch-app-with-soundtouch-20-system

SoundTouch verliert Cloud-Funktionen und App Bose stellt SoundTouch ein: So nutzt du deine Lautsprecher trotzdem weiter

AnzeigeMediaMarkt-Aktion Zwei Dyson-Produkte kaufen und sparen

Masimo veräußert Audiogeschäft an Harman Masimo verkauft Sound United an Harman für 350 Mio. US-Dollar

Jetzt anmelden und live dabei sein Neu bei connect: connect OnAir – interaktiver LiveStream

Weiter zur Startseite