OpenAI hat ein neues Bildgenerierungsmodell veröffentlicht, das ab sofort in ChatGPT, Codes und in der API verfügbar ist. Images 2.0 heißt das Modell, das, so OpenAI, „deutlich besser“ mit komplexen Anweisungen umgehen können soll als der Vorgänger. Auch Texte soll das neue Modell genauer darstellen können. Was Images 2.0 alles kann, erfahrt ihr im Beitrag.
Laut OpenAI ist Images 2.0 in der Lage Bilder nun sehr präzise erstellen zu können. Darunter fällt zum Beispiel das Einbinden von kleinen Textelementen und User-Interface-Komponenten. Auch Diagramme soll das Tool generieren können. Damit soll Images 2.0 auch für kreative Aufgaben im beruflichen Kontext verwendet werden können.
Zudem könnt ihr mit Images 2.0 ab sofort Bilder im Format 3:1 und 1:3 erzeugen lassen. Das ist relevant für alle, die Inhalte für Poster, Präsentationen, Banner oder Mobilgeräte erstellen möchten. Darüber hinaus soll das Modell in der Lage sein, „thinking-gestützt“ zu arbeiten. Das heißt, ChatGPT kann die Aufgabe, die ihr ihm gestellt habt, durchdenken und zum Lösen der Aufgabe auch das Web als Rechercheplattform nutzen.
ChatGPT: Bild-Sets aus einem Guss sind ebenfalls ab sofort möglich
Auch mehrere Bilder kann das Tool aus einer einzigen Anfrage heraus nun erzeugen. Die generierten Bilder sollen dabei zusammenhängend sein, also „aus einem Guss“ erscheinen, damit sie sich für die Verwendung in Bild-Sets eignen. Wer ChatGPT über die API nutzt, kann über gpt-image-2 das neue Bildgenierungstool in seine Anwendungen integrieren.
Images 2.0 ist ab sofort für alle Nutzer von ChatGPT, Codex und der API-Version verfügbar. Über die Webversion könnt ihr Images 2.0 direkt ausprobieren. Die erweiterten Funktionen, die der Thinking-Ansatz liefert, stehen allerdings nur den Plus-, Pro-, Business- und Enterprise-Kunden zur Verfügung.

Finde es immer erstaunlich, welche Schwierigkeiten die Bildgeneratoren oftmals haben, richtig zu zählen.
X-fach daran verzweifelt, dass nach dem Prompt „setze vier Personen an den Tisch“ entweder drei oder fünf Personen in das Bild montiert wurden.
Manchmal hilt es eine weitere Modifikation folgen zu lassen um eine überschüssige Person zu entfernen, oft verschwinden dann aber auch zwei Personen.
Keine Ahnung, warum Bildgeneratoren das Zählen so schwer fällt..,
Vielleicht ist ChatGPT Images 2.0 ja mal bei Graf Zahl in die Schule gegangen und bekommt das nun hin?