Konsistente KI-Charaktere: Warum Prompts nicht reichen

23.06.2026

Autor: Peter Reitmann

Wer mit KI Bilder erstellt, kämpft nicht mit dem Erstellen. Sondern mit dem Beurteilen. Gelernt habe ich das an einem Feierabend-Experiment, das ausser Kontrolle geriet: Ein Panda im jls-Hoodie, schwarz statt weiss, mit Augen-Patches in unseren Brandingfarben.

Aus dem Test wurde ein Wallpaper auf meinem Macbook und ehe ich mich versah, wollten Arbeitskolleg:innen auch eins, individuell auf sie abgestimmt natürlich. Plötzlich stand die Frage im Raum: Braucht jls eigentlich ein Maskottchen?

Entstanden ist die Idee ganz nebenbei, ohne Workshop, ohne Strategie-Deck und ohne ein einziges Meeting. KI macht Ideen sichtbar, bevor man entschieden hat, ob man sie überhaupt haben will. Das verschiebt den Designprozess aktuell massiv. Aber je müheloser die Produktion wird, desto entscheidender wird das Urteil darüber, ob es auch stimmig ist und zwar im Detail. Denn das kann KI nach wie vor noch nicht.

KI-Character-Design: Was ein Panda über Prompting und Konsistenz lehrt.

Das Problem mit dem invertierten Panda

Der jls-Panda ist kein normaler Panda. Das klingt trivial, ist es aber nicht, wenn man mit KI arbeitet. Ein gewöhnlicher Panda ist weiss mit schwarzen Augen-Patches. Der jls-Panda ist das Gegenteil: Schwarz, mit farbigen Augen-Patches in unseren Brandingfarben. Genau das hat die Bildmodelle massiv verwirrt.

Egal wie präzise die Prompts waren, immer wieder tauchten weisse Pandas auf. Aus dem Nichts. Das trainierte Weltbild vom Bildmodell: Panda = weiss mit schwarzen Flecken. Die Abweichung war für uns Absicht, für das Modell war es eine Anomalie, die es zu beheben versuchte. Schuld daran ist nicht der Prompt, sondern ein Grundprinzip: KI kann gut, was sie kennt und sobald etwas ausserhalb der statistischen Norm liegt, arbeitet man gegen das Modell, statt mit ihm.

Die Konsequenz: Selbst bei der simplen Replikation eines bereits existierenden Characters braucht es immer wieder frisches Referenz-Material und sehr präzise Beschreibungen. Ein Prompt, der einmal funktioniert hat, reicht dafür nicht. Jede neue Generation ist ein neuer Kontext und ohne Anker zieht das Modell zurück zum Durchschnitt.

Lässt sich ein KI-Character-System auf neue Figuren übertragen?

Nachdem der Panda intern funktionierte, haben wir die Crew erweitert: Ein Otter und ein Kolibri sind dazugekommen. Die logische Annahme wäre, das bestehende System zu nehmen und zu übertragen.

Mit Copy-Paste oder einem cleveren Prompt ist es jedoch nicht getan, jeder Character ist eigene Arbeit. Ein Kolibri ist kein Panda. Proportionen, Körperbau, Besonderheiten - alles anders. Was beim Panda als Referenz dient, baut auf einem spezifischen Visuell auf, das für den Kolibri nicht existiert. Man muss die gleiche Grundarbeit nochmals leisten: Reference Material definieren, den Character präzise beschreiben, Eigenheiten kennen und explizit benennen. Und dabei trotzdem das System im Kopf behalten, damit alle drei Characters am Ende kohärent wirken.

Wer glaubt, ein gut funktionierendes Character-System lasse sich mit minimalem Effort auf einen neuen Character übertragen, wird von den Ergebnissen enttäuscht sein. Der Ansatz bleibt: nicht neu starten, sondern aufbauen. Aber aufbauen heisst immer noch: Arbeit investieren.

Content wirkt schnell gut. Das ist das eigentliche Problem

Hier liegt das grösste Missverständnis im Umgang mit KI-generierten Assets. KI-Bilder sehen schnell professionell aus. Komposition, Licht, der Character wirkt stimmig. Wer nicht genau hinschaut, sieht ein fertiges Bild. Was man nicht sieht: die Augenfarbe hat sich verändert. Ein kleines Detail, fast unsichtbar auf den ersten Blick, aber falsch.

Auch uns passierte das. Die Augenfarbe der Characters waren ein klar definierendes Merkmal und doch haben sich im Verlauf von Generierungen manchmal unbemerkt verändert. Wir selbst haben es nicht immer beim ersten Durchgang entdeckt. Das Problem liegt nicht beim Modell, sondern bei uns: Das Bild wirkt so fertig, dass der kritische Blick gar nicht erst einsetzt. Was passiert, wenn man mit einem fehlerhaften Asset in die Vervielfältigung geht? Der Fehler multipliziert sich. Zehn Wallpaper mit der falschen Augenfarbe. Fünfzig Varianten mit einem Detail, das nicht stimmt. Und je grösser das System, desto schwieriger die Korrektur.

Aber das ist kein Argument gegen Skalierung sondern dafür, vorher genauer hinzuschauen. Mehr als je zuvor.

Mit KI generierter Panda, Otter und Kolibri gebrandet mit jls-Pullis und jls-Halstuch in den jls-Farben.

Von der Bild- zur Videogenerierung mit KI.

Warum bleibt ein KI-Video schwerer konsistent?

Was für Bilder gilt, gilt für Video, multipliziert mit dem Faktor Zeit. KI-generierte Videos können in Sekunden überzeugend wirken. Bewegung, Kamera, Atmosphäre: das kommt schnell. Was nicht schnell kommt: Konsistenz. Ein Character, der in Frame 1 die richtigen Augenfarben hat, kann in Frame 60 plötzlich anders aussehen. Eine Bewegung, die gut beginnt, endet manchmal in einer Anatomie, die nicht stimmt. Ein Hintergrunddetail verändert sich zwischen zwei Szenen, ohne dass jemand es angewiesen hat.

Noch immer die Regel - nicht die Ausnahme, auch mit besseren Modellen. Wer Videos mit KI generiert und im Anschluss nur einmal schaut, verpasst Fehler. Wer Videos generiert und skaliert, ohne vorher zu prüfen, ob der Character konsistent ist, exportiert Inkonsistenz. Das gilt für Wallpaper genauso wie für bewegte Kampagnen, Teaser und Social Content. Überall da, wo ein Character wiedererkennbar sein soll.

Wie zuverlässig ist GPT Image 2 beim Prompten?

Der Würfel wird kleiner, aber es bleibt ein Würfel. Wer mit Bildmodellen arbeitet, kennt die Grundspannung: Man beschreibt etwas präzise und bekommt etwas zurück, das davon leicht abweicht, manchmal stark. So funktionieren nun mal generative Modelle.

Mit GPT Image 2 ist das deutlich besser geworden. Das Modell folgt Prompts mit einer Präzision, die vorher nicht möglich war. Trotzdem gibt es Aussetzer. Ein konkretes Beispiel: In einem Hintergrundelement stand plötzlich ein Dollarbetrag statt einem CHF-Betrag. Niemand hatte die Währung falsch definiert, man hatte sie schlicht gar nicht definiert. Das Modell hat eine Entscheidung getroffen.

Was man nicht explizit sagt, entscheidet das Modell selbst. Das fordert eine andere Art von Disziplin: nicht nur sagen, was man will, sondern auch sagen, was man nicht will. Und danach prüfen, ob das Modell irgendwo eine stille Entscheidung getroffen hat. Gute Prompt-Strukturen und Reference Material helfen. Aber „one-shoten“ - beim ersten Versuch ein finales, verwendbares Bild zu bekommen - bleibt die Ausnahme.

Der Mix: Das Beste aus beiden Welten.

Macht KI Kreative überflüssig?

Content-Erstellung ist demokratisiert, das stimmt. Wer heute Stunden braucht, um ein solides Ausgangsbild zu erzeugen, hat ein anderes Problem als die Ressource Zeit. Aber Urteilsvermögen ist nicht demokratisiert. Das ist der entscheidende Unterschied.

Die Fähigkeit zu erkennen, welche Details falsch sind. Dass die Währung nicht stimmt. Dass der Character dieses Mal „zu normal“ aussieht, weil das Modell wieder zum trainierten Durchschnitt gezogen hat. Dass eine Bewegung im Video anatomisch nicht stimmt. Diese Beobachtungen setzen voraus, dass man den Character kennt, das Handwerk versteht und weiss, wo man hinschauen muss. Je mehr Content generiert wird, desto wertvoller werden die Menschen, die Qualität beurteilen können.

Kein Widerspruch zur Demokratisierung - eher ihre logische Folge: Wenn jeder Content erstellen kann, entscheidet nicht mehr die Produktion, sondern die Beurteilung. Die Rolle verändert sich: weg von reiner Produktion, hin zu Kuration, Qualitätssicherung und Systemverantwortung. Das falsche Detail erkennt man nur, wenn man weiss, wie das richtige aussieht.

Das System: Wiederverwendbarkeit als Grundprinzip

Einmal gut aufsetzen, dann skalieren. Nicht jedes Mal von vorne anfangen. Für die Workflows haben wir mit weavy.ai gearbeitet, auch bekannt als Figma Weave. Das Tool erlaubt es, node-basierte AI-Bildworkflows visuell aufzubauen, zu speichern und untereinander zu teilen. Wer einen funktionierenden Flow für die Panda-Generierung aufgebaut hat, kann diesen direkt weitergeben. Kein Copy-Paste von Prompts, kein „schreib mir mal dein Setup auf“: das System selbst ist das Dokument. Entscheidend wird das, sobald mehrere Personen an einem Character-System arbeiten. Konsistenz entsteht nicht durch gute Erinnerung, sondern durch reproduzierbare Prozesse.

Vom Test zur physischen Figur

Was für mich die ganze Geschichte abrundet ist die Eigendynamik und Entwicklung. Vom Test bis hin zu einer 3D gedruckten Version die nun auf meinem Schreibtisch steht. Ein Mitarbeiter hat mir den Panda in 3D Gedrukt. Aus einem spontanen Feierabend-Test ist eine physische Figur geworden. Einfach weil wir etwas ausprobiert haben. Für mich markiert das den Abschluss einer Entwicklung, die ich so nie geplant hatte.

Welche Tests oder Ideen habt ihr schon verworfen, weil sie zu aufwändig schienen? Es gab noch nie eine bessere Zeit, einfach mal etwas auszuprobieren. Die Hürde war noch nie kleiner.

Ein jls-Panda aus dem 3D-Drucker steht auf dem Pult

Was wir mitnehmen.

Der Panda hat sich von einem persönlichen Test zu einem echten internen Projekt entwickelt und das nicht geplant, sondern organisch. Dahinter steckt etwas Grundsätzliches: KI senkt die Schwelle, eine Idee sichtbar zu machen. Aber folgende Punkte müssen berücksichtigt werden:

KI ist kein einfaches Tool, das man mal eben einrichtet und dann läuft, sondern ein System, das Aufmerksamkeit braucht.

KI ist kein Qualitätsersatz, sondern ein Produktionsbeschleuniger. Die Qualitätskontrolle liegt nach wie vor beim Menschen.

Es gibt keinen universellen Workflow: Systematische Content Creation muss sorgfältig und individuell aufgebaut werden.

Vor lauter Geschwindigkeit nicht die Details vergessen. Wir müssen genau hinschauen - genauer als je zuvor.

FAQs.

Welche KI-Tools habt ihr für den Panda eingesetzt?

Für die Bildgenerierung primär GPT Image 2 und Nano Banana 2/Pro, für animierte Inhalte verschiedene Video-Modelle (meistens Seedance 2.0). Für die Workflow-Automatisierung haben wir weavy.ai (Figma Weave) eingesetzt , welches erlaubt, node-basierte Bildworkflosw visuell aufzubauen und direkt im Team zu teilen.

Warum reicht ein guter Prompt beim nächsten Mal oft nicht mehr aus?

Jede Generierung ist ein neuer Kontext. KI-Modelle haben kein Gedächtnis zwischen Generierungen - ohne frisches Referenzmaterial zieht das Modell zurück zum trainierten Durchschnitt. Für das Modell ist ein Panda weiss mit schwarzen Flecken. Abweichungen davon müssen jedes Mal explizit verankert werden.

Wie aufwändig ist es, ein eigenes Character-System aufzubauen?

Mehr als man zunächst denkt, aber deutlich weniger als früher. Der grösste Aufwand liegt nicht im Generieren, sondern im Aufsetzen: Referenzmaterial definieren, den Character präzise beschreiben, Eigenheiten dokumentieren. Wer das einmal sauber macht, skaliert danach schneller.

Muss ich gestalterische Vorkenntnisse haben, um solche Ergebnisse zu erzielen?

Entscheidend ist ein geschultes Auge sowie das Verständnis, genau hinzuschauen. Es gilt Fehler zu erkennen, die das Modell still eingebaut hat und zu wissen, wie das richtige Ergebnis aussehen muss.

Mehr zu AI Systematic Content

Hände am Laptop in einem Content-Management-System für jls

Angebot «Content Automation.»

Content Automation verwendet Technologien und Tools, um Inhalte automatisch zu erstellen, zu verwalten und zu verteilen. Wir optimieren Content-Prozesse und machen Marketing- und Content-Teams produktiver.

Zum Angebot

Collage mit unterschiedlichen als-screens

Blogbeitrag «Content Automation: Content-Produktion effizient skalieren.»

Content wird nicht mehr Stück für Stück gebaut, sondern systematisch generiert. Dabei spielen moderne Technologien eine zentrale Rolle.

Zum Blogbeitrag

Denner-Filiale mit jls-Signage-Lösung zu den Wochen-Aktionen

Referenz «Denner Filial-Konzept.»

Mit den neuen, digitalen Schaufensterscreens wird Denner aufgrund der automatisierten Contentausspielung flexibler und effizienter in der Kommunikation von Angeboten.

Zur Referenz

Content-Erstellung ist demokratisiert. Urteilsvermögen nicht.

KI-Character-Design: Was ein Panda über Prompting und Konsistenz lehrt.