Direkt zum Seiteninhalt

Der Workflow - Bruder Aural


Der Workflow
Character Consistency & Identity Mixing
(Gesichtsmerkmale referenzieren)

_

Information :
Projektname:
EVO 2077_ Die Eidolon-Paare
Eidolon stammt aus dem Altgriechischen und bedeutet Abbild, Erscheinung oder Geistbild.
In unserer Geschichte symbolisiert der Begriff die Verbindung von Guardian und Echo, Kraft und Seele, Maschine und Mensch, vereint zu einer untrennbaren Einheit.

Gerade dieses Bild ist ein gutes Beispiel dafür, warum hochwertige KI-Projekte nicht mit einem einfachen Prompt vergleichbar sind.

Auf den ersten Blick sieht man lediglich ein Mädchen und einen futuristischen Roboter in einem weißen Studio.
Tatsächlich steckt hinter einer solchen Darstellung jedoch deutlich mehr Arbeit, als viele Betrachter vermuten.


Warum dieses Bild besonders anspruchsvoll ist


1. Zwei komplexe Hauptfiguren statt einer einzelnen Person
Bereits die Kombination aus einer menschlichen Figur und einem mehrere Meter großen Roboter erhöht die Komplexität erheblich.
Beide müssen in jeder Ansicht glaubwürdig wirken, die richtigen Proportionen besitzen und optisch miteinander harmonieren.

2. Konsistente Charakterdarstellung
Die junge Frau muss in allen Ansichten dieselbe Person bleiben. Gesichtszüge, Frisur, Körperbau, Kleidung und Ausstrahlung dürfen sich nicht verändern.
Genau diese Charakterkonsistenz zählt zu den größten Herausforderungen bei KI-generierten Bildern.

3. Konsistenter Roboter
Noch schwieriger wird es beim Roboter. Jede Panzerplatte, jedes Gelenk, jede Leitung und jede Proportion muss zwischen den Ansichten übereinstimmen.
Bereits kleine Abweichungen würden sofort auffallen und die Glaubwürdigkeit der Szene zerstören.

4. Mehrere Perspektiven derselben Szene
Das Bild zeigt nicht einfach drei unterschiedliche Bilder. Es zeigt dieselben Figuren aus verschiedenen Blickwinkeln.
Die KI muss also dieselben Objekte räumlich korrekt darstellen. Genau hier scheitern viele einfache Generierungen.

5. Größenverhältnisse
Der Roboter wirkt massiv und beschützend, ohne das Mädchen optisch zu „verschlucken“.
Die Größenverhältnisse müssen in jeder Ansicht exakt stimmen. Schon kleine Fehler würden die gesamte Wirkung beeinträchtigen.

6. Emotionale Bildwirkung
Das Ziel war nicht nur ein technisches Sci-Fi-Bild. Die Szene soll eine Beziehung zwischen Mensch und Maschine vermitteln.
Der Roboter wirkt nicht bedrohlich, sondern wie ein Beschützer. Diese Wirkung entsteht durch Pose, Abstand, Kamerawinkel und Bildkomposition.

7. Minimalistisches Studio-Setting
Ein weißer Hintergrund wirkt simpel, ist aber oft schwieriger als eine detailreiche Umgebung.
Ohne Ablenkungen fallen Fehler sofort auf. Jede Unstimmigkeit bei Proportionen, Perspektive oder Konsistenz wird unmittelbar sichtbar.



Der Unterschied zu vielen KI-Bildern im Internet

Viele Bilder im Netz entstehen durch einen einzigen Prompt und einen Klick auf „Generieren“.
Solche Bilder können beeindruckend aussehen, zeigen aber meist nur einen einzelnen Moment ohne Anforderungen an Konsistenz oder Wiederholbarkeit.

Bei diesem Projekt bestand die Herausforderung nicht darin, ein schönes Bild zu erzeugen.
Die Herausforderung bestand darin, dieselben Figuren zuverlässig über mehrere Ansichten hinweg darzustellen, ihre Identität zu bewahren und eine glaubwürdige visuelle Geschichte zu erzählen.

Das fertige Bild ist daher nicht das Ergebnis eines einzelnen Prompts, sondern das Resultat zahlreicher Entscheidungen, Anpassungen, Tests und Iterationen.
Genau dieser unsichtbare Aufwand unterscheidet hochwertige KI-Projekte von den vielen schnell erzeugten Bildern, die täglich im Internet veröffentlicht werden.




Einblick in den Workflow hinter solchen Projekten



7. Character Consistency

·        Sicherstellung einer stabilen Identität über Hunderte Bilder hinweg

·        Erhalt von Gesichtsmerkmalen, Körperbau und Ausstrahlung

·        Konsistenz trotz wechselnder Kleidung, Perspektiven und Szenen


8. Posen- und Perspektivabgleich

·        Kontrolle von Körperhaltung und Blickrichtung

·        Anpassung an Referenzposen

·        Konsistente Größenverhältnisse und Kamerawinkel


9. Kleidungskonsistenz

·        Wiedererkennbare Outfits über verschiedene Szenen hinweg

·        Erhalt von Materialeigenschaften, Farben und Details

·        Anpassung an unterschiedliche Licht- und Umgebungssituationen


10. Bildkomposition

·        Gestaltung von Bildaufbau und Tiefenwirkung

·        Harmonisierung von Vordergrund, Hintergrund und Motiv

·        Inszenierung von Emotionen und Bildaussage


11. Iterationen

·        Oft entstehen Dutzende oder Hunderte Versionen eines Motivs

·        Permanente Analyse und Optimierung

·        Verwerfen und Neuaufbauen einzelner Bildbereiche

·        Auswahl der besten Ergebnisse aus vielen Generationen


12. Nachbearbeitung

·        Retusche von Fehlern und Artefakten

·        Detailverbesserungen

·        Farbkorrekturen

·        Schärfe- und Qualitätsoptimierung

·        Compositing und finales Finetuning


13. Storyentwicklung

·        Aufbau einer zusammenhängenden Bildwelt

·        Entwicklung von Beziehungen zwischen Figuren

·        Wiederkehrende Motive und visuelle Erzählstrukturen

·        Langfristige Projektplanung



1. Charakterentwicklung
 
·         Definition der Figur und ihrer Persönlichkeit

·         Entwicklung eines wiedererkennbaren visuellen Stils

·         Festlegung von Kleidung, Frisur, Farben und Proportionen

·         Aufbau einer konsistenten Identität über viele Bilder hinweg

 
2. Referenzsammlung
 
·         Auswahl geeigneter Gesichtsreferenzen
 
·         Sammlung von Posen, Kleidung, Lichtstimmungen und Perspektiven
 
·         Aufbau einer strukturierten Referenzbibliothek für spätere Generationen

 
3. Identity Mixing
 
·         Kombination verschiedener Referenzen zu einer neuen, eigenständigen Figur
 
·         Übernahme charakteristischer Gesichtsmerkmale
 
·         Feinabstimmung von Gesichtsstruktur, Augen, Haaren und Ausdruck

 
4. LoRA-Training
 
·         Erstellung individueller Trainingsdatensätze
 
·         Bildauswahl und Qualitätskontrolle
 
·         Training eigener LoRAs zur Wiedererkennbarkeit der Figur
 
·         Optimierung für unterschiedliche Posen, Outfits und Szenarien

 
5. Prompt Engineering
 
·         Entwicklung komplexer Prompt-Strukturen
 
·         Gewichtung einzelner Merkmale
 
·         Einsatz von positiven und negativen Prompts
 
·         Feinsteuerung von Stil, Bildaufbau und Atmosphäre

 
6. ComfyUI-Workflow-Design
 
·         Entwicklung individueller Node-Workflows
 
·         Integration von LoRAs, ControlNet, IPAdapter und Referenzmodulen
 
·         Automatisierung wiederkehrender Arbeitsschritte
 
·         Kontinuierliche Optimierung des gesamten Pipelinesystems
 



Fazit

Das fertige Bild ist lediglich die sichtbare Spitze des Eisbergs.

Was man sieht, ist oft das Ergebnis aus Charakterdesign, Referenzarbeit, LoRA-Training, Workflow-Entwicklung,
Hunderten Testläufen, kreativen Entscheidungen und viel Erfahrung im Umgang mit modernen KI-Systemen.
Du siehst hier nur einen kleinen Teil dessen, was im Hintergrund tatsächlich passiert.

Der letzte Satz ist besonders wichtig, weil er genau das vermittelt, was viele Betrachter nicht sehen:
Das Bild ist das Endergebnis eines langen kreativen und technischen Prozesses,
nicht das Resultat eines einzelnen Prompts.





Gemeinsam ausgearbeitet von: Katja, Jessica & Heiko
Zurück zum Seiteninhalt