Zum Inhalt springen
Technik. Tests. Trends.
VG Wort Pixel
Videochat mit der Google-KI

Gemini Live ausprobiert: Die KI sieht, was wir sehen

Mehr zum Thema: Google

Google hat seinen KI-Assistenten Gemini Live um eine visuelle Komponente erweitert. Nutzer können der KI nun zeigen, was sie auf dem Display sehen oder mit der Kamera erfassen. Wir haben ausprobiert, wie gut das funktioniert.

Autor: Yvonne Junginger • 23.4.2025 • ca. 4:25 Min

Gemini Live Kamerafreigabe
Wie funktioniert die Kamera- und Bildschirmfreigabe in Gemini Live?
© Google

Mit der neuesten Aktualisierung von Google Gemini Live hat die KI-Plattform nun die Fähigkeit, visuelle Informationen zu verarbeiten. Ursprünglich war die Funktion nur das Pixel 9 und Galaxy S25 kostenlos, jetzt will Google die Funktion für alle Android-Nutzer kostenlos verfügbar machen. Aber wi...

Mit der neuesten Aktualisierung von Google Gemini Live hat die KI-Plattform nun die Fähigkeit, visuelle Informationen zu verarbeiten. Ursprünglich war die Funktion nur das Pixel 9 und Galaxy S25 kostenlos, jetzt will Google die Funktion für alle Android-Nutzer kostenlos verfügbar machen. Aber wie gut funktioniert das Ganze eigentlich? Um das herauszufinden, haben wir einen detaillierten Blick auf Gemini Live geworfen.

First things first: Was ist Gemini Live?

Gemini Live ist ein KI-Assistent von Google, der ursprünglich nur auf sprachliche Eingaben reagierte. Mit der neuesten Erweiterung ist der Assistent nun auch in der Lage, visuelle Informationen zu verarbeiten. So können Nutzer mit Gemini Live nicht nur über gesprochene Befehle, sondern auch über das, was sie mit ihrer Kamera sehen oder auf ihrem Bildschirm angezeigt bekommen, in Echtzeit interagieren.

Standardmäßig kommt Gemini Live mit dem Modell Gemini 2.0 Flash zum Einsatz. Wer möchte, kann aber auch auf die experimentellen Varianten 2.5 Flash oder 2.5 Pro umschalten – auch diese unterstützen die neue visuelle Funktion.

Auf welchen Geräten kann man Gemini Live nutzen?

Gemini Live ist Teil der Gemini-App für Android und lässt sich ohne kostenpflichtiges Abo nutzen. Die Bildschirm- und Kamerafreigabe in Gemini Live ist ebenfalls kostenlos nutzbar. Sollte das Feature auf Ihrem Gerät nicht zur Verfügung stehen, prüfen Sie, ob ein Update für die App verfügbar ist. Neue Funktionen werden für gewöhnlich schrittweise ausgerollt, es ist also etwas Geduld gefragt.

Gemini Live: Kamera- und Bildschirmfreigabe einrichten - So geht's

Die Aktivierung der neuen Funktionen in Gemini Live ist relativ einfach. Auf unserem Galaxy S25 ist die Funktion bereits freigeschaltet. Sollte das bei Ihnen noch nicht der Fall sein, gehen Sie wie folgt vor:

  1. App aktualisieren: Stellen Sie sicher, dass Sie die neueste Version der Gemini-App installiert haben.
  2. Kamera- und Bildschirmfreigabe aktivieren: In den Einstellungen der App finden Sie die Option, die Kamera- und Bildschirmfreigabe zu aktivieren. Es wird auch darum gebeten, der App den Zugriff auf die Kamera und den Bildschirm zu gewähren.
  3. Nutzung starten: Nach der Aktivierung können Sie Gemini Live entweder über den Bildschirm oder direkt über die Kamera ansprechen, um Hilfe zu erhalten.
Gemini Live Bildschirmfreigabe
Den Bildschirm freigeben oder das Gespräch pausieren? Das ist mit Gemini Live kein Problem.
© Screenshot: connect

Gemini Live: Einsatzmöglichkeiten im Alltag

Die neuen Funktionen von Gemini Live eröffnen eine Vielzahl an Nutzungsmöglichkeiten, die weit über einfache Sprachbefehle hinausgehen. In einem Blogbeitrag nennt Google einige Einsatzszenarien, etwa zur Fehlerbehebung und technischen Unterstützung oder Tipps zu Outfits und Styling. Auch beim Kochen, in der Raumgestaltung oder bei kreativen Projekten kann Gemini Live unterstützen.

Technisch funktioniert das, indem Gemini Live mithilfe von Bilderkennungs- und Texterkennungsalgorithmen die über Kamera oder Bildschirm geteilten Inhalte analysiert. Dabei werden Bildinhalte kontextuell erfasst und mit Online-Datenbanken oder internen Modellen abgeglichen, um passende Informationen, Empfehlungen oder Lösungsvorschläge in Echtzeit zu liefern.

Wie steht es um den Datenschutz?

In puncto Datenschutz zeigt sich Gemini Live erfreulich zurückhaltend. Die Bildschirmfreigabe muss bei jeder Sitzung erneut bestätigt werden. Auch die Kamerafreigabe lässt sich so einstellen, dass die App jedes Mal nachfragt – entweder bei jedem Start oder nur für die aktuelle Nutzung. Damit behält man die Kontrolle darüber, welche Inhalte tatsächlich geteilt werden.

Gemini Live Datenschutz
Gemini Live greift nur dann auf den Bildschirm oder die Kamera zu, wenn man es ausdrücklich erlaubt.
© Screenshot: connect

Wie gut funktioniert der Live-Chat?

Wir haben einige Gespräche mit Gemini Live geführt und dabei sowohl die reine Sprachfunktion als auch die Bildschirm- und Kamerafreigabe ausprobiert. Dabei hat Gemini das Gesagte größtenteils verstanden und zum Kontext passend und hilfreich geantwortet.

Wir haben etwa eine Frage zu einer Spielkonsole gestellt, die nicht funktioniert und uns Shopping-Tipps geben lassen. Dabei haben wir Kamera und Bildschirm freigegeben, woraufhin Gemini schnell mit passenden Vorschlägen. Wir haben verschiedene Styling-Tipps bekommen, wie man das gezeigte Kleidungsstück kombinieren kann, um einen runden Look zu erzielen.

Schnelle und hilfreiche Antworten

Praktisch ist, dass man den Chat auch pausieren und zu einem späteren Zeitpunkt fortsetzen kann. Auch die Performance war im Test überzeugend: Antworten kamen nahezu verzögerungsfrei, die Interaktion lief flüssig ab – wie bei einem Telefongespräch, nur eben mit einem KI-Assistenten statt einem echten Menschen.

Außerdem haben wir der KI mithilfe der Kamerafreigabe gezeigt, welche Lebensmittel der Kühlschrank so hergibt und dann nach einem Rezeptvorschlag gefragt. Das hat super funktioniert, Gemini Live hat direkt mehrere Vorschläge gemacht und das Rezept anschließend Schritt für Schritt erklärt. Auch Rückfragen zur Kochzeit oder einzelnen Schritten wurden schnell und einfach beantwortet. Hier kann der KI-Assistent also eine echte Hilfe sein, wenn man mal keine Lust hat, sich stundenlang durch Kochblogs zu quälen, um eine Idee für das Abendessen auf den Tisch zu bekommen.

Gemini Live Kamerafreigabe Rezept
Zeigt man Gemini Live, welche Lebensmittel zur Verfügung stehen, schlägt die KI prompt ein Rezept vor.
© connect

Wie war das mit der Sprachvielfalt? – Transkript sorgt für Verwirrung

Schaut man sich hinterher das automatisch erstellte Transkript des Live-Chats an, fällt folgendes auf: Das Gesagte wurde trotz deutlicher Aussprache zum Teil ins Russische übersetzt. Im tatsächlichen Gespräch haben wir das nicht bemerkt, da Gemini auf Deutsch geantwortet hat. Das Transkript spricht jedoch eine andere Sprache und könnte, wenn man seine Gespräche mit der KI zu einem späteren Zeitpunkt noch einmal durchliest, zu Verwirrung führen.

Auf unsere Nachfrage hin gab Gemini lediglich die Antwort, dass so etwas eigentlich nicht passieren sollte. Da ist also noch Luft nach oben. Dass die KI da ein wenig durcheinander gekommen ist, ist aber kein Wunder – immerhin spricht Gemini Live über 45 Sprachen.

Gemini Live Transkript
Im Gespräch mit Gemini Live selbst gab es keine Sprachbarrieren, im Transkript sieht das jedoch anders aus.
© Screenshot: connect

Gemini Live getestet: Alltagshelfer mit Potenzial – und kleinen Schwächen

Die Integration von Kamera- und Bildschirmfreigabe macht Gemini Live zu einem praktischen Tool im Alltag. Ob bei der Fehlerbehebung, der kreativen Arbeit oder der persönlichen Einkaufsberatung – die visuelle KI bietet zahlreiche Möglichkeiten, die über das klassische Sprachinteraktionsmodell hinausgehen. Besonders im Zusammenspiel mit der Kamera entfaltet Gemini Live sein Potenzial als smarter Alltagshelfer – sei es beim Kochen, bei Styling-Fragen oder technischen Problemen.

Dennoch zeigt der Praxis-Test auch, dass noch nicht alles reibungslos läuft. Die fehlerhafte und etwas verwirrende Transkription ins Russische ist ein gutes Beispiel dafür, dass da noch Luft nach oben ist. Insgesamt bleibt Gemini Live aber ein spannender Schritt in Richtung natürlicherer Interaktion mit KI – und könnte sich, bei weiterem Feinschliff, zu einem echten Standardwerkzeug im digitalen Alltag entwickeln.

Mehr zum Thema: Google