Jetzt können Sie auf Gemini Fotos hochladen und bearbeiten.

Zusammenfassung:

Sie können jetzt kostenlos Fotos auf Gemini hochladen und bearbeiten. Diese Funktion wird ab heute schrittweise für alle Benutzer eingeführt.
Benutzer können auf Gemini auch KI-Bilder über Konversationstextaufforderungen erstellen und bearbeiten.
Google bestätigt, dass alle KI-generierten Bilder auf Gemini ein sichtbares Wasserzeichen und ein unsichtbares digitales SynthID-Wasserzeichen haben werden.

Schließlich führt Google die Möglichkeit ein, Fotos auf Gemini über Textaufforderungen zu bearbeiten. Sie können jetzt vorhandene Fotos über Textchats auf Gemini hochladen und bearbeiten. Darüber hinaus können Sie mit Gemini KI-Bilder erstellen und diese duplizieren, um das Bild zu ändern. Die Fotobearbeitungsfunktion von Gemini wird ab heute schrittweise für alle Benutzer eingeführt. Diese neue Funktion verbessert das Benutzererlebnis und bietet leistungsstarke kreative Tools.

Google war der erste Anbieter, der native Bildbearbeitung mit dem Gemini 2.0 Flash-Modell auf AI Studio anbot. Ich habe das Modell im Februar getestet und war erstaunt, wie einfach es war, Bilder im Dialog zu bearbeiten. Als Reaktion auf Googles natives Bildgenerierungsmodell führte OpenAI auch die native Bildbearbeitung und -generierung in ChatGPT ein.

Dies führte zu Ghibli-Trend Dies verbreitete sich sehr schnell und führte zu einer verstärkten Nutzung von ChatGPT. Jetzt hat Google die native Fotobearbeitung in seine Verbraucher-App Gemini integriert. Beachten Sie, dass Sie Fotos sowohl in der mobilen Gemini-App als auch im Internet bearbeiten können. Diese Funktion macht Gemini zu einem starken Konkurrenten im Bereich der generativen KI.

Da ich verglichen habe Native Bildbearbeitung zwischen ChatGPT und GeminiIch kann sagen, dass Gemini viel besser darin ist, die Charakter-/Szenenkonsistenz über Generationen hinweg aufrechtzuerhalten. ChatGPT ändert das Gesamtbild nach jeder Generation, während Gemini sehr konsistent ist. Bei der Bildgenerierung ist ChatGPT jedoch besser als Gemini. Dies spiegelt Unterschiede in der Struktur der verwendeten Modelle wider.

Jetzt müssen wir wissen, ob Google zur Bildgenerierung immer noch das diffusionsbasierte Modell Imagen 3 verwendet oder ob es die nativen Bildgenerierungsfunktionen der Gemini-Modelle nutzt. Übrigens verwendet OpenAI das KI-Modell GPT-4o zum Erstellen und Ändern von Bildern. Diese Entwicklung verdeutlicht den anhaltenden Wettbewerb im Bereich der künstlichen Intelligenz.

Darüber hinaus sagt Google, dass in alle mit Gemini erstellten oder bearbeiteten Bilder ein unsichtbares digitales SynthID-Wasserzeichen eingebettet ist. Darüber hinaus fügt Google allen mit Gemini erstellten Bildern ein sichtbares Wasserzeichen hinzu. Ziel dieser Maßnahme ist es, die Transparenz und Rechenschaftspflicht beim Einsatz künstlicher Intelligenz zu erhöhen.

Gemini