Realistische Bilder und lesbarer Text mit den neuesten KI-Modellen von OpenAI. Probieren Sie es kostenlos aus.

OpenAI hat sein 4-Modell in ChatGPT integriert, um die Bildgenerierung nativ innerhalb der Chatbot-Umgebung zu ermöglichen. Durch dieses Update entfällt die Notwendigkeit, das Dall-E-Bildgenerierungsmodell von OpenAI als separate Einheit zu verwenden, obwohl Dall-E für diejenigen, die es bevorzugen, weiterhin verfügbar ist. Das KI-Unternehmen hat seinen Sora AI-Videogenerator auch innerhalb von ChatGPT aktiviert. 

Von OpenAI generiertes Bild – Ein spontanes Foto im Paparazzi-Stil von Karl Marx, wie er eilig durch den Parkplatz der Mall of America geht.

Die neuen Funktionen sind derzeit für kostenlose ChatGPT-Benutzer sowie für ChatGPT Plus-, Team- und Pro-Benutzer verfügbar. Diese Funktionen werden nächste Woche für Geschäfts- und Bildungsnutzer verfügbar sein.

Dall-E 3 war zuvor das Bildgenerierungs-Plugin für kostenpflichtige ChatGPT-Abonnenten. Wer den Generator inzwischen kostenlos testen möchte, kann dies über die Basisversion von Microsoft Copilot tun. 

Die Vorlage wurde als einer der besten verfügbaren Bildgeneratoren gelobt, insbesondere in der kostenpflichtigen Version. Während es für alle ChatGPT-Benutzer von Vorteil ist, die in das 4-Modell integrierte Bildgenerierung nutzen zu können, müssen sich Benutzer der kostenlosen Version von ChatGPT auf einige Einschränkungen einstellen, wie beispielsweise, wie bereits erwähnt, Beschränkungen beim Datei-Upload und bei der Datenanalyse. CNET

ChatGPT wird jedoch von realistischeren Bildern mit klarerem Text profitieren, nachdem OpenAI nach dem Start ein Jahr lang GPT-4o durch eine Trainingsmaßnahme namens „Reinforcement Learning from Human Feedback“ (RLHF) trainiert hat, laut Wall Street Journal

Nach der Ankündigung von GPT-4o im Mai 2024 ließ OpenAI ein Team von mehr als 100 „menschlichen Trainern“ das Modell auf Tippfehler sowie häufige Fehler bei Händen und Gesichtern scannen, sagte der leitende Forscher des Projekts, Gabriel Goh, der Zeitung.

Das GPT-4o-Modell fügt ChatGPT außerdem die Möglichkeit hinzu, transparente Hintergründe zu erstellen. Dies dürfte für Geschäftskunden und Kreative sehr nützlich sein, da sie damit Logos oder andere Symbole erstellen können, wie Jackie Shannon, Leiterin für Multimediaprodukte bei ChatGPT, gegenüber dem WSJ anmerkte. 

Trotz der von OpenAI vorgenommenen Verbesserungen weist das aktualisierte GPT-4o-Modell insgesamt noch einige Mängel auf. Er neigt immer noch zu Halluzinationen, ein häufiges Merkmal bei KI, das noch nicht geklärt ist. Die Aufrechterhaltung der redaktionellen Konsistenz bleibt innerhalb der ChatGPT-Umgebung eine Herausforderung. Jedoch, Ich habe es versprochen OpenAI mit schnellen Updates, bereits nächste Woche. 

Ein weiteres anhaltendes Problem, mit dem OpenAI konfrontiert ist, ist die Frage der Ethik und Legitimität. Das Unternehmen besteht darauf, dass sein Modell mit „öffentlich verfügbaren Daten“ sowie mit proprietären Daten trainiert wurde, die es durch Partnerschaften mit Marken wie Shutterstock besitzt, wie das WSJ anmerkte. 

Von ChatGPT auf Basis des 4-Modells generierte Bilder enthalten keine KI-Wasserzeichen. Das Unternehmen wies jedoch darauf hin, dass die Bilder C2PA-Metadaten enthalten werden, die darauf hinweisen, dass sie durch KI generiert wurden. Dies bleibt der Industriestandard.

Kommentarfunktion ist geschlossen.