Künstliche Intelligenz
MGIE: Apple stellt KI zur Bildbearbeitung vor
Apple und Open-Source? Ja, das geht. Das Unternehmen aus Cupertino hat jetzt seine eigene KI namens MGIE veröffentlicht. Was die kann? Wir geben einen Überblick.

Jetzt mischt auch Apple im KI-Geschäft mit. Der Konzern hat MGIE veröffentlich, eine Open-Source-KI, die zur Bildbearbeitung genutzt werden kann. Im Gegensatz zu DALL-E und anderen Bilder-KIs, kann MGIE keine Bilder aufgrund von Befehlen generieren, sondern sie hilft dabei, Bilder mithilfe natürl...
Jetzt mischt auch Apple im KI-Geschäft mit. Der Konzern hat MGIE veröffentlich, eine Open-Source-KI, die zur Bildbearbeitung genutzt werden kann. Im Gegensatz zu DALL-E und anderen Bilder-KIs, kann MGIE keine Bilder aufgrund von Befehlen generieren, sondern sie hilft dabei, Bilder mithilfe natürlicher Sprache zu bearbeiten. MGIE steht dabei für MLLM-Guided Image Editing. Die KI nutzt also multimodale Sprachmodelle (MLLM), um die geschriebenen Befehle des jeweiligen Nutzers zu verstehen und umzusetzen.
Die KI kann, ganz im Stil von Adobes Photoshop, das Gesamtbild optimieren oder gezielte, lokale Bearbeitungen am Bild vornehmen. Forscher der Universität aus Santa Barbara, haben an der Open-Source-KI mitgearbeitet und sehen darin einen großen Schritt in Sachen KI-Fähigkeiten. Denn MGIE muss nicht nur Text, sondern auch Bilder verarbeiten können. DALL-E im Vergleich muss keine Bilder verarbeiten, sondern generiert sie auf Basis von textlichen Prompts.
Ein Beispiel für MGIE. Man nimmt das Foto eines Mannes mit braunen Haaren und gibt der KI den Befehl: „Verpasse dem Mann rote Haare.“ Die KI interpretiert daraus den entsprechenden Befehl und wendet ihn auf das Bild an. Am Ende sollte der Mann auf dem Bild rote statt braune Haare haben.
MGIE ist grundsätzlich keine reine Forschungsleistung, sondern vor allem ein praktisches Tool für verschiedene Szenarien. MGIE kann dabei helfen, Bilder für persönliche oder berufliche Zwecke zu erstellen, zu ändern und zu optimieren. Zum Beispiel für Social Media, E-Commerce, Bildung, Unterhaltung oder Kunst.
Apple hat alle notwendigen Informationen und Dateien auf GitHub zur allgemeinen Verfügung gestellt. Es dürfte nicht mehr lange dauern, bis erste Umsetzungen für die Allgemeinheit vorgestellt werden. Möglicherweise wird die Apple-KI ja schon bald mit einer Überarbeitung von Siri auf den nächsten iPhones landen?