Die Kunst des Prompts –
Bildwelten aus Worten erschaffen
Kapitel 1: Der Schlüssel zum Bild – Was ist ein guter Prompt?
1.1 Die Magie hinter dem Prompt – Wie Worte Bilder formen
🔤 Ein starker Prompt ist mehr als ein paar gute Begriffe. Er ist die Brücke zwischen deiner Vorstellungskraft und dem, was die KI tatsächlich versteht.
Du schreibst ein paar Worte – und Sekunden später entsteht ein Bild, das es zuvor nicht gab. Dieser Prozess wirkt auf viele fast magisch. Doch hinter der vermeintlichen Zauberei steckt ein hochgradig berechenbares System. Und das System versteht nur eines: deine Worte.
Was du als Prompt eingibst, wird von der KI nicht interpretiert wie von einem Menschen. Die Maschine denkt nicht mit, sie empfindet nichts und „weiß“ nichts über deinen künstlerischen Anspruch. Sie rechnet. Und sie rechnet ausschließlich mit dem, was du ihr gibst – nicht mit dem, was du meinst.
🧠 Wie ein KI-Modell deinen Prompt „versteht“
KI-Bildgeneratoren wie Midjourney, DALL·E oder Stable Diffusion basieren auf sogenannten Diffusionsmodellen. Diese Modelle wurden mit gewaltigen Mengen an Bild-Text-Paaren trainiert. Das bedeutet: Die KI hat gelernt, was bestimmte Begriffe in der Bildwelt bedeuten – statistisch gesehen.
Wenn du beispielsweise „ein rustikales Holzhaus am See“ schreibst, gleicht das System diesen Text mit Millionen ähnlicher Beispiele ab. Es fragt sich dabei nicht, wie du das meinst, sondern: Wie sieht so etwas typischerweise aus?
Dein Prompt wird also in einen mathematischen Bedeutungsraum übersetzt. Die KI bewegt sich dann durch diesen Raum, kombiniert Muster – und formt daraus ein neues Bild.
🎯 Präzise Sprache ist das Fundament
Weil die KI nur das versteht, was du wirklich schreibst, ist Unschärfe dein größter Feind. Begriffe wie „cool“, „magisch“, „atemberaubend“ sind zwar emotional aufgeladen, haben aber keinen konkreten visuellen Inhalt – zumindest nicht für eine KI.
Ein Prompt wie „eine Katze“ ist technisch gesehen vollständig. Aber er ist auch vollkommen offen. Was für eine Katze? In welchem Stil? In welcher Umgebung? Ist das Bild realistisch oder stilisiert?
Formulierst du stattdessen:
„Eine britisch-kurzhaarige Katze mit blauen Augen liegt auf einem viktorianischen Sofa. Warmes Innenlicht, realistischer Malstil, ruhige Stimmung.“
… dann entsteht ein klarer Bildrahmen. Die KI hat visuelle Anker – und das Ergebnis ist viel näher an dem, was du dir vorgestellt hast.
🖼️ Was gute Prompts gemeinsam haben
Gute Prompts denken in Bildern. Sie beschreiben nicht einfach ein Objekt, sondern eine Szene. Sie geben der KI nicht nur den „Was“-Faktor, sondern auch das „Wie“.
Die wichtigsten Fragen, die dir beim Formulieren helfen:
- Was ist das Hauptmotiv?
- Wo befindet es sich – wie sieht die Umgebung aus?
- Welche Lichtstimmung passt dazu?
- In welchem Stil soll das Bild gestaltet sein?
- Welche emotionale Wirkung soll es haben?
Diese Fragen müssen nicht alle beantwortet werden – aber je klarer du wirst, desto stärker wird das Bild.
🎬 Inspiration aus anderen Medien
Viele gute Prompts bedienen sich einer Bildsprache, die du aus anderen Kontexten kennst. Ob Film, Fotografie, Kunstgeschichte oder Gaming – visuelle Begriffe aus diesen Bereichen sind für die KI hilfreich und klar interpretierbar.
Beispiele für nützliche Begriffe:
🎥 cinematic lighting
🎨 impressionistischer Stil
🖼️ Studio Ghibli
📷 35mm Filmlook
🕹️ Cyberpunk-Ästhetik
Diese Begriffe sind keine leeren Etiketten. Sie sind wie Regieanweisungen für die KI – und helfen ihr, das Bild deinem Stilwunsch anzupassen.
🧩 Der Prompt als kreatives Werkzeug
Wenn du das Prinzip verinnerlichst, verändert sich dein Zugang zur KI-Bildgenerierung. Du verstehst, dass der Prompt nicht der Nebensatz am Anfang des Prozesses ist, sondern das eigentliche kreative Instrument.
Ein guter Prompt ist nicht zwangsläufig lang, aber immer bewusst formuliert. Er setzt Schwerpunkte. Er lässt Raum – aber nur dort, wo du ihn willst. Er baut auf Klarheit, nicht auf Hoffnung.
Du brauchst keine perfekten Sätze, aber ein klares Bild im Kopf. Und je öfter du diesen Gedanken in Worte übersetzt, desto leichter fällt dir der kreative Prozess.
🛠️ Fazit
Prompting ist kein Trick – es ist Handwerk. Und wie jedes Handwerk wird es mit Übung besser.
Wenn du gelernt hast, wie die KI deine Worte „liest“, wirst du beginnen, sie gezielter einzusetzen. Du wirst nicht mehr hoffen, dass das Bild gut wird. Du wirst wissen, warum es gut wird.
Denn die Magie liegt nicht in der Technik – sie liegt in deiner Sprache.
1.2 Der Unterschied zwischen mittelmäßig und meisterhaft – Was einen guten Prompt ausmacht
Nicht jeder Prompt führt zu einem starken Ergebnis. Selbst mit der besten KI-Technologie entsteht nur dann ein überzeugendes Bild, wenn der Prompt klar formuliert, visuell durchdacht und sprachlich präzise ist. Andernfalls bleibt das Resultat beliebig – oder verfehlt völlig die eigene Vorstellung.
Viele Prompts scheitern daran, dass sie entweder zu allgemein oder zu kompliziert sind. Sie enthalten zu wenig Information – oder zu viel, ohne Struktur. Die KI kann daraus keine eindeutige visuelle Vision ableiten. Das führt dazu, dass die generierten Bilder zwar technisch korrekt wirken, aber keine gestalterische Tiefe oder emotionale Wirkung besitzen.
Ein mittelmäßiger Prompt wirkt oft wie eine lose Stichwortsammlung. Es fehlt der rote Faden, das Hauptmotiv verschwimmt im Detail, und der Text erzeugt kein inneres Bild. Für die KI bedeutet das: Sie muss interpretieren – und wird dabei schnell ungenau.
🧩 Typische Schwächen mittelmäßiger Prompts
🔍 Unklare Begriffe
Begriffe wie „cool“, „magisch“ oder „interessant“ sagen der KI wenig, solange sie nicht konkretisiert werden.
🎯 Kein Hauptmotiv
Wenn zu viele gleichrangige Elemente genannt werden, weiß die KI nicht, worauf sie den Fokus legen soll.
🎨 Fehlende Stilangaben
Ohne Hinweis auf den gewünschten Bildstil bleibt die visuelle Richtung unklar: realistisch, malerisch, futuristisch?
🌫️ Keine Licht- oder Stimmungsbeschreibung
Licht und Atmosphäre sind essenziell für Bildwirkung – fehlen sie, bleibt das Bild flach.
🔀 Unstrukturierte Wortabfolge
Begriffe ohne Zusammenhang oder Priorität lassen die KI ins Leere arbeiten.
Ein Beispiel: Der Prompt „Eine Frau im Wald“ kann alles bedeuten – von einem Spaziergang im Stadtpark bis zur Fantasy-Heldin im Märchenwald. Die KI muss raten. Und das tut sie auch – allerdings selten so, wie du es dir vorstellst.
Formulierst du dagegen:
„Eine junge Frau mit langen roten Haaren, in einem weißen Kleid, steht im nebligen Wald bei Sonnenaufgang. Weiches Licht, melancholische Stimmung, realistischer Malstil.“
… dann entsteht sofort eine klare visuelle Szene – für dich und für die KI.
🧱 Die Bausteine für meisterhafte Prompts
Erfahrene Prompt-Nutzer nutzen oft eine Grundstruktur, die sich in der Praxis bewährt hat. Du kannst sie flexibel anpassen, aber sie hilft enorm beim Einstieg:
1️⃣ Hauptmotiv – z. B. „Porträt einer alten Samurai-Kriegerin“
2️⃣ Stil oder Technik – etwa „im Stil eines Ölgemäldes“, „digital painting“
3️⃣ Umgebung – „in einem Bambuswald, Morgendunst, Sonnenstrahlen“
4️⃣ Licht & Stimmung – „düster, weiches Gegenlicht, melancholisch“
5️⃣ Technische Hinweise (optional) – „4K-Render, feine Details, fotorealistisch“
Diese Struktur bringt Ordnung in deine Beschreibung – ohne dich kreativ einzuschränken. Im Gegenteil: Sie gibt dir Werkzeuge, um deine Bildidee sprachlich präzise zu transportieren.
🖋️ Die Wirkung der Sprache
Während mittelmäßige Prompts rein beschreibend bleiben, lösen gute Prompts beim Lesen bereits ein inneres Bild aus. Das liegt an der Sprache: an der Wahl der Begriffe, dem Rhythmus der Beschreibung, dem bewussten Aufbau.
Ein kurzer Vergleich:
❌ „Ein Auto bei Nacht“
✅ „Ein schwarzer Sportwagen mit spiegelnden Neonlichtern, geparkt auf nassem Asphalt in einer futuristischen Stadt. Starke Kontraste, Cyberpunk-Stil, digital painting.“
Hier wird nicht nur ein Objekt genannt – sondern eine Szene inszeniert.
✂️ Weniger schreiben, gezielter formulieren
Ein häufiger Irrtum: Man müsse so viele Details wie möglich nennen, um der KI zu helfen. Doch gute Prompts sind nicht zwangsläufig lang – sie sind präzise.
💡 Tipp: Streiche alles, was nicht visuell relevant ist – und achte darauf, dass die verbleibenden Begriffe ein stimmiges Bild ergeben.
Klarheit schlägt Komplexität. Präzision schlägt Länge.
Am Ende ist Prompting keine technische Disziplin, sondern eine kreative. Es geht nicht darum, möglichst viele Adjektive aneinanderzureihen – sondern darum, eine visuelle Vorstellung sprachlich so zu gestalten, dass eine KI sie versteht und umsetzt.
Du wirst mit jedem Versuch besser. Nicht, weil die KI dazulernt – sondern weil du es tust.
1.3 Prompting vs. klassisches Schreiben – Zwei Welten, eine Sprache
🖋️ Wer gut schreibt, kann nicht automatisch gut prompten. Und wer promptet, lernt auf ganz neue Weise, mit Sprache umzugehen. Zwei Disziplinen – ein gemeinsames Werkzeug: das Wort.
Die Art und Weise, wie wir mit Sprache umgehen, verändert sich dramatisch – gerade durch die neuen Werkzeuge der künstlichen Intelligenz. Besonders deutlich wird das beim Vergleich zwischen klassischem Schreiben und dem Erstellen von Prompts. Beides beginnt mit Wörtern, doch die Anforderungen und Ziele könnten unterschiedlicher kaum sein.
Beim klassischen Schreiben formulierst du für ein menschliches Gegenüber. Du erschaffst Atmosphäre, erzeugst Emotionen, arbeitest mit Spannungsbögen, Andeutungen und Bildern. Vieles bleibt bewusst zwischen den Zeilen. Die Sprache soll klingen, fließen und wirken – manchmal sogar gerade durch ihre Mehrdeutigkeit.
Prompting funktioniert genau andersherum. Du schreibst für eine Maschine. Sie versteht keine Ironie, keine Metaphern, kein implizites Wissen. Was du nicht explizit sagst, existiert für die KI nicht. Prompting verlangt deshalb eine Sprache, die klar, direkt und präzise ist – aber dennoch kreativ.
🔍 Der Leser vs. der Rechner
Der wichtigste Unterschied zwischen klassischem Schreiben und Prompting liegt im Adressaten.
🧑🤝🧑 Beim klassischen Schreiben ist dein Leser ein Mensch. Er bringt ein Vorwissen mit, ergänzt Lücken, liest zwischen den Zeilen und lässt sich auch von Stimmungen tragen, die nur angedeutet werden.
🧠 Beim Prompting ist dein „Leser“ eine Maschine. Sie denkt nicht, sondern verarbeitet. Sie berechnet Wahrscheinlichkeiten und formt daraus ein Bild – basierend auf Trainingsdaten und Algorithmen. Ihre „Verständnisleistung“ endet dort, wo deine Beschreibung aufhört.
Deshalb gilt beim Prompting: Was du nicht schreibst, passiert auch nicht.
✍️ Stilmittel im klassischen Text – im Prompt oft kontraproduktiv
Wer vom Schreiben kommt, muss oft umlernen. Denn was literarisch schön ist, kann in einem Prompt zu Missverständnissen führen.
Beispiele:
- Metaphern wie „ein Licht, das Geschichten erzählt“ sind für Menschen poetisch – für KI unbrauchbar.
- Vage Begriffe wie „interessant“, „beeindruckend“ oder „besonders“ haben keine feste Bildbedeutung.
- Ironie oder Wortspiele funktionieren gar nicht – sie erzeugen in der Regel unbrauchbare Ergebnisse.
Das bedeutet nicht, dass Prompting keine kreative Sprache braucht – im Gegenteil. Aber diese Kreativität muss sich visuell übersetzen lassen.
🧠 Was du aus dem Schreiben mitnehmen kannst
Trotz aller Unterschiede gibt es Gemeinsamkeiten – und sie sind wertvoll.
Wer gut schreibt, kann oft schneller lernen, gute Prompts zu formulieren. Warum? Weil man bereits geübt ist, mit Sprache Bilder im Kopf zu erzeugen. Und genau darum geht es beim Prompting: innere Bilder in Worte zu fassen, die klar genug sind, um von einer KI interpretiert zu werden.
Hilfreiche Fähigkeiten aus dem klassischen Schreiben:
📌 Bildhafte Sprache
Du weißt, wie man visuelle Szenen formuliert – auch ohne Kamera.
📌 Sprachrhythmus und Gewichtung
Du kannst die Reihenfolge deiner Begriffe bewusst setzen und damit Prioritäten steuern.
📌 Reduktion auf das Wesentliche
Was in einem Satz gesagt werden kann, muss nicht in drei stehen.
📌 Bewusstsein für Wirkung
Du weißt, dass jedes Wort einen Ton, eine Richtung, eine Wirkung hat.
Diese Fähigkeiten sind im Prompting Gold wert – vorausgesetzt, sie werden mit dem nötigen technischen Verständnis kombiniert.
🔁 Neue Sprache, neue Denkweise
Prompting ist eine neue Form des Schreibens. Es folgt eigenen Regeln – und doch bleibt es Sprache.
Der Reiz liegt genau in dieser Spannung: zwischen Kreativität und Kontrolle, zwischen Bildsprache und klarer Anweisung. Zwischen offenem Spiel und präziser Steuerung.
Wer sich darauf einlässt, entdeckt schnell, dass Prompting nicht „weniger“ Schreiben ist – sondern ein Schreiben mit anderem Ziel. Es geht nicht darum, Texte zu erzeugen, die verstanden werden – sondern Bilder, die entstehen.
Und dabei zählt jedes Wort.
1.4 Praxisbeispiele – Schlechte vs. gute Prompts in der Analyse
🧪 Die Theorie ist das eine. Doch erst in der Praxis zeigt sich, wie groß der Unterschied zwischen einem mittelmäßigen und einem guten Prompt wirklich ist.
In diesem Kapitel werfen wir einen genauen Blick auf konkrete Beispiele. Du siehst jeweils einen einfachen, wenig effektiven Prompt – und eine optimierte Version, die mit denselben Grundideen arbeitet, aber deutlich bessere Ergebnisse liefert.
Die Unterschiede liegen oft nicht in der Länge, sondern in der Klarheit, Struktur und Bildsprache. Und genau das schauen wir uns jetzt an.
🐱 Beispiel 1 – Motiv: Tierporträt
❌ Prompt (mittelmäßig):
„eine süße Katze auf einem Sofa“
Dieser Prompt ist zwar verständlich, aber unspezifisch.
Was für eine Katze? Welches Sofa? In welchem Stil? Realistisch oder gemalt? Bei Tageslicht oder Kerzenschein?
✅ Optimierter Prompt:
„britisch-kurzhaarige Katze mit blauen Augen, liegt auf einem antiken Samtsofa, warmes Innenlicht, fotorealistischer Stil“
Hier wird das Bild deutlich fokussierter. Die KI hat visuelle Eckpunkte: Rasse, Farbdetails, Möblierung, Lichtstimmung und Stilrichtung.
🌄 Beispiel 2 – Motiv: Landschaft
❌ Prompt (mittelmäßig):
„schöne Landschaft mit Bergen“
Ein Klassiker – aber viel zu vage. Was heißt „schön“? Welche Art von Bergen? Sommer, Winter, Abendlicht? Natur oder Fantasie?
✅ Optimierter Prompt:
„weite Alpenlandschaft bei Sonnenaufgang, Nebel in den Tälern, goldene Lichtstimmung, realistisch, digitale Malerei“
Jetzt entsteht ein konkretes Bild mit Tiefe, Lichtwirkung und Stil. Genau das braucht die KI, um ein beeindruckendes Ergebnis zu liefern.
👤 Beispiel 3 – Motiv: Charakter
❌ Prompt (mittelmäßig):
„ein Samurai in Japan“
Eine nette Idee, aber ohne gestalterische Richtung. Alter, Kleidung, Licht, Ausdruck, Hintergrund – alles offen.
✅ Optimierter Prompt:
„älterer Samurai mit wettergegerbtem Gesicht, traditionelle Rüstung, steht im Regen vor einem Bambuswald, dramatisches Licht, Filmstil wie Kurosawa“
Die Beschreibung hat nun filmische Qualität – durch Details, Atmosphäre und visuelle Tiefe.
🚗 Beispiel 4 – Motiv: Szene mit Technik
❌ Prompt (mittelmäßig):
„ein cooles Auto bei Nacht“
Was heißt „cool“? Sportwagen? Retro? Glänzend, rostig, animiert? Für die KI bleibt alles offen.
✅ Optimierter Prompt:
„futuristischer Cyberpunk-Sportwagen, reflektierende Neonlichter, geparkt auf nassem Asphalt, nächtliche Großstadt, digital painting mit hohem Kontrast“
Jetzt sprechen wir die Sprache der KI. Der Prompt gibt Stil, Stimmung, Textur und Technik klar vor – mit einem starken visuellen Ergebnis.
🧠 Was lernen wir aus diesen Beispielen?
Gute Prompts entstehen nicht durch Zufall, sondern durch bewusste Entscheidungen:
- Details statt Schlagworte
Konkrete, beschreibende Begriffe wirken besser als allgemeine Floskeln. - Fokus statt Vollständigkeit
Lieber ein stark beschriebenes Motiv als fünf vage. - Stimmung & Licht nicht vergessen
Diese machen oft den entscheidenden Unterschied. - Stil oder Technik benennen
Ob Malerei, Foto oder 3D – der Bildstil sollte klar sein.
Diese Prinzipien sind kein starres Regelwerk. Aber sie helfen dir, deine Vorstellungskraft präziser zu formulieren – und so aus Worten echte Bilder zu erschaffen.

Kapitel 2: Der perfekte Aufbau – So konstruierst du effektive Bild-Prompts
2.1 Die Prompt-Formel: Objekt + Stil + Umgebung + Stimmung + Technik
🔧 Ein guter Prompt ist kein Zufallsprodukt. Er hat Struktur, Rhythmus und eine klare Absicht. Mit der richtigen Formel wird deine Vorstellung zur visuellen Realität.
Viele Einsteiger gehen beim Prompten rein intuitiv vor. Sie beschreiben, was sie im Kopf haben – und hoffen, dass die KI den Rest übernimmt. Manchmal funktioniert das. Oft aber entstehen Ergebnisse, die nicht den Erwartungen entsprechen.
Der Grund ist einfach: Ohne Struktur fehlt dem Prompt ein roter Faden. Die KI bekommt zwar Begriffe, aber keine eindeutige Priorisierung, keine Stilrichtung, keine klare Szene.
Mit der richtigen Formel lässt sich das ändern.
🧩 Die 5-Schritte-Struktur für starke Prompts
In der Praxis hat sich ein Aufbau bewährt, der sowohl flexibel als auch leicht verständlich ist. Diese Formel hilft dir, aus einer Idee einen vollständigen, bildfähigen Prompt zu machen.
1. 🎯 Objekt (Motiv)
Was steht im Mittelpunkt des Bildes?
Beispiel:
„eine alte mechanische Schreibmaschine“,
„eine Tänzerin in einer Ballettpose“,
„ein Wolf mit glühenden Augen“
2. 🎨 Stil
In welcher ästhetischen oder technischen Anmutung soll das Bild entstehen?
Beispiel:
„Ölgemälde im Stil des Barock“,
„digitale Illustration, semi-realistischer Stil“,
„low-poly 3D-Render“
3. 🏞️ Umgebung
In welchem Kontext befindet sich das Motiv?
Beispiel:
„auf einer Holzveranda bei Sonnenaufgang“,
„inmitten eines futuristischen Großstadtdschungels“,
„im Inneren eines antiken Tempels“
4. 💡 Stimmung & Licht
Welche Atmosphäre und Beleuchtung sollen das Bild prägen?
Beispiel:
„melancholisch, weiches Licht, feine Schatten“,
„dramatisches Gegenlicht, Regen, neblig“,
„freundlich und hell, sanfte Farbverläufe“
5. ⚙️ Technik (optional)
Welche technischen Hinweise verbessern das visuelle Ergebnis?
Beispiel:
„8K, fotorealistisch, Ultra-Detail“,
„analoger Filmlook, 35mm“,
„isometrische Perspektive, farblich entsättigt“
📐 Anwendung der Formel – ein Beispiel
Lass uns einen einfachen Gedanken nehmen und mit der Formel ausbauen.
Grundidee:
„Ein Astronaut“
Mit Formel:
„Ein einsamer Astronaut in einer beschädigten Raumstation, realistisch gezeichnet, Licht von der Seite, kühle Farbtöne, digitale Malerei mit hohem Detailgrad“
Du merkst sofort: Aus einem simplen Begriff entsteht eine ganze Szene. Die KI hat jetzt Material, um etwas Bildhaftes und Stimmiges daraus zu machen.
🧠 Warum diese Formel so gut funktioniert
Diese Struktur zwingt dich, visuell zu denken, ohne dich kreativ einzuengen. Du wirst dir automatisch klarer über dein Bild, weil du dir Fragen stellst wie:
- Was steht im Zentrum?
- Wie soll es aussehen?
- Wo befindet es sich?
- Welche Wirkung soll es haben?
Gleichzeitig hilft sie dir dabei, nicht zu übertreiben. Viele Anfänger „überladen“ ihre Prompts mit Details – das wirkt oft verwirrend statt präzise. Mit der Formel findest du ein gutes Gleichgewicht.
💡 Tipps zum Umgang mit der Formel
🧭 Du musst nicht jedes Element nutzen.
Manchmal reicht ein starkes Motiv mit Stil und Lichtstimmung – vor allem bei experimentellen oder minimalistischen Ideen.
✂️ Weniger ist oft mehr.
Wichtiger als die Anzahl der Begriffe ist ihre Qualität und Komposition.
🎯 Fang mit dem Objekt an.
Das zentrale Motiv ist der Anker für alles Weitere – egal, ob es ein Porträt, eine Landschaft oder ein Stillleben ist.
🔁 Formuliere in Varianten.
Schreib drei unterschiedliche Prompts zu einer Idee – und vergleiche die Ergebnisse. Das schärft dein Gefühl für Wirkung.
2.2 Klarheit statt Chaos – Wie du präzise und zielführend formulierst
🧭 Gute Ideen scheitern oft an schwacher Sprache. Wer lernt, seine Vorstellung klar und zielgerichtet zu formulieren, bekommt auch genau das Bild, das er sich ausmalt.
Ein gutes Motiv allein reicht nicht. Selbst wenn du die besten Begriffe auswählst, kann das Ergebnis enttäuschend sein – wenn deine Sprache zu ungenau, zu unstrukturiert oder zu vollgepackt ist. Klarheit ist beim Prompting nicht nur hilfreich, sie ist entscheidend.
Die Kunst liegt darin, reduziert zu denken, aber konkret zu sprechen. Ein klar formulierter Prompt schafft für die KI eine visuelle Richtung, der sie folgen kann – ohne zu raten oder zu improvisieren.
❌ Die häufigsten Formulierungsfehler
Viele Anfänger neigen dazu, ihre Prompts mit möglichst vielen Beschreibungen vollzupacken – in der Hoffnung, dadurch ein besonders gutes Bild zu bekommen. Das Gegenteil ist oft der Fall.
Hier sind typische sprachliche Stolperfallen:
🌀 Zu viele gleichwertige Details
Wenn du fünf Hauptmotive nennst, wird die KI versuchen, alles gleichzeitig umzusetzen – und am Ende wirkt nichts davon überzeugend.
💬 Unklare Adjektive
Wörter wie „schön“, „interessant“ oder „beeindruckend“ sind subjektiv. Die KI kennt ihre Bedeutung nicht – sie braucht konkrete visuelle Begriffe.
🔀 Sprunghafte Struktur
Wenn Stil, Ort, Licht und Motiv wild durcheinander stehen, fehlt der logische Aufbau. Das führt zu Bildfragmenten statt Komposition.
🎭 Metaphern oder Doppeldeutigkeiten
„Ein Bild, das Geschichten erzählt“ klingt poetisch, aber hilft der KI nicht. Sie kann keine Bildsprache interpretieren – nur Beschreibung.
✅ Was präzise Formulierungen auszeichnet
Ein guter Prompt liest sich wie eine visuelle Skizze in Worten. Er ist knapp, aber aussagekräftig. Und er folgt einem klaren Gedankengang – von der Hauptidee zur gestalterischen Umsetzung.
Merkmale starker Sprache im Prompt:
🔹 Klare, visuelle Substantive
z. B. „Holztisch“, „Neonlicht“, „Wüstenlandschaft“, „Porträt einer Tänzerin“
🔹 Zielgerichtete Adjektive
z. B. „verwittert“, „lichtdurchflutet“, „monochrom“, „futuristisch“
🔹 Präzise Stilangaben
z. B. „digital painting“, „impressionistischer Pinselduktus“, „Filmstill, 35mm“
🔹 Ruhige Satzstruktur mit inhaltlicher Reihenfolge
Erst das Objekt, dann Stil, Szene, Stimmung, Technik – nicht alles auf einmal.
🛠️ Praxis: Ein Prompt in drei Stufen
Grundidee: Ein Ritter in einer mittelalterlichen Stadt
🔸 Stufe 1 (zu allgemein):
„Ein Ritter in einer alten Stadt“
🔸 Stufe 2 (besser, aber noch unscharf):
„Ein Ritter in Rüstung, steht in einer historischen Stadt bei Nacht“
🔸 Stufe 3 (präzise, klar, visuell stark):
„Ein Ritter in glänzender Plattenrüstung, steht auf einem Kopfsteinpflasterplatz vor einer gotischen Kathedrale, nächtliche Szene, beleuchtet durch Fackeln, digital painting, dramatische Schatten“
Du erkennst sofort, wie aus einer einfachen Idee ein vollständiges Bildkonzept wird – durch gezielte Formulierung.
✏️ Der richtige Umgang mit Detailtiefe
Nicht jedes Bild braucht den gleichen Detaillierungsgrad. Manchmal reicht ein starker Stilbegriff. Ein anderes Mal willst du bewusst ein komplexes Szenario bauen.
Wichtiger als die Länge ist dabei:
- der Fokus auf das Wesentliche
- die visuelle Umsetzbarkeit
- die stilistische Konsistenz
Ein gut formulierter Prompt braucht keine zwölf Adjektive. Drei präzise, miteinander harmonierende Begriffe wirken stärker als eine unstrukturierte Wortkette.
🔄 Formulieren, testen, verbessern
Das Schreiben eines guten Prompts ist kein Ein-Schuss-Prozess. Es ist ein kreativer Zyklus:
🧠 Idee → ✍️ Formulierung → 🖼️ Ergebnis → 🔍 Bewertung → 🔁 Optimierung
Je öfter du das durchläufst, desto klarer wird deine Sprache – und desto besser deine Bilder. Du entwickelst ein Gefühl dafür, was funktioniert. Und du lernst, wann weniger mehr ist – und wann du gezielt nachschärfen musst.
Klarheit ist kein Zufall. Sie ist das Ergebnis bewusster sprachlicher Entscheidungen.
Ein gut formulierter Prompt denkt wie ein Bild. Und ein starkes Bild beginnt mit einem klaren Satz.
2.3 Die Prompt-Architektur – Satzbau, Struktur und Hierarchien verstehen
🏗️ Ein guter Prompt ist wie ein gut gebautes Haus. Er braucht ein stabiles Fundament, eine klare Gliederung – und genau die richtigen Details am richtigen Ort.
Viele Prompts scheitern nicht an der Idee, sondern am Aufbau. Du hast ein starkes Motiv, du hast einen passenden Stil im Kopf – aber dein Prompt liest sich wie ein Gedankenprotokoll statt wie eine Bildbeschreibung.
Das Problem dabei: Die KI kann die Bedeutung deiner Begriffe nicht gewichten, wenn du es nicht tust.
Ein guter Prompt hat Struktur. Er folgt einem logischen Ablauf. Und er macht deutlich, was im Bild wichtig ist – und was ergänzend gemeint ist.
🧱 Baue deinen Prompt wie eine Szene
Stell dir vor, du bist Regisseur. Du planst eine Szene – mit Hauptmotiv, Hintergrund, Licht, Stimmung und Kameraeinstellung.
Dein Prompt sollte sich genauso lesen:
Vom Zentrum der Szene nach außen, vom Wichtigsten zum Ergänzenden.
🔹 Zuerst das Hauptmotiv
Was ist der Fokus? Ein Mensch, ein Objekt, ein Tier, eine Landschaft?
🔹 Dann Stil oder Darstellungsform
Gemälde, Fotografie, Comic, 3D? Realistisch oder stilisiert?
🔹 Anschließend Szene und Hintergrund
Wo befindet sich das Motiv? Gibt es relevante Details im Raum?
🔹 Dann Licht und Atmosphäre
Wie wirkt die Umgebung? Gibt es spezielle Wetter- oder Tageszeitangaben?
🔹 Zum Schluss technische Angaben
Bildqualität, Rendertechnik, Auflösung – falls nötig.
🧠 Die KI liest von links nach rechts – und gewichtet mit
Auch wenn es keine offizielle Grammatik für Prompts gibt, spielt die Wortreihenfolge eine entscheidende Rolle. Begriffe, die vorne stehen, erhalten oft mehr Gewicht.
Das bedeutet:
- Wenn du ein „Porträt einer Elfenprinzessin“ willst, dann beginne auch genau damit.
- Wenn dir der Stil besonders wichtig ist, nenne ihn früh: „digitale Illustration im Jugendstil: …“
- Wenn du möchtest, dass die Lichtstimmung dominiert, positioniere sie entsprechend: „in dramatischer Gegenlichtsituation …“
🧩 Was du zuerst nennst, bestimmt, worauf sich die KI als Erstes konzentriert.
🌀 Typische Aufbauprobleme
❌ Begriffe ohne erkennbare Hierarchie
Wenn alles gleich wichtig klingt, wirkt das Ergebnis oft überladen.
❌ Stil, Ort und Technik in einem Atemzug
Das wirkt konfus – für Leser wie für Maschine.
❌ Rückbezüge oder „Meta-Kommentare“
Formulierungen wie „soll aussehen wie …“ sind nicht effektiv. Direkt formulieren ist besser: „im Stil von …“
✅ Besser: Eine durchdachte, lesbare Struktur
Hier ein Beispiel für einen gut gebauten Prompt – mit klarer Architektur:
🧑🎨
„Porträt eines alten Zauberers mit langem weißen Bart, im Stil eines klassischen Ölgemäldes, Hintergrund: alchemistisches Arbeitszimmer, gedämpftes Kerzenlicht, melancholische Stimmung, weiche Schatten, detailreiche Ausführung, digital painting, 4K“
Du siehst:
- Das Hauptmotiv steht ganz vorn
- Stil folgt direkt danach
- Die Szene ist klar beschrieben
- Licht und Atmosphäre runden das Bild ab
- Technik kommt zum Schluss
So wird aus einer Idee ein präziser Bauplan für ein Bild.
🔄 Modular denken – flexibel bleiben
Du musst nicht jedes Element immer benutzen. Je nach Zielbild kann dein Prompt kürzer oder länger sein. Wichtig ist, dass die Teile zueinander passen und in nachvollziehbarer Reihenfolge stehen.
🛠️ Stell dir deinen Prompt wie ein modulares Bauset vor. Du entscheidest, welche Teile du brauchst – und wie du sie zusammensetzt.
Diese Denkweise hilft dir auch dabei, Prompts schnell zu variieren oder weiterzuentwickeln – ohne sie jedes Mal neu erfinden zu müssen.
Ein klar aufgebauter Prompt ist wie ein guter Satz: verständlich, rhythmisch und mit einer erkennbaren Absicht.
Du schreibst nicht einfach eine Reihe Begriffe – du konstruierst ein Bild in Sprache.
Im nächsten Kapitel wirst du sehen, wie du diese Struktur gezielt erweitern kannst – mit Gewichtungen, Modifikatoren und komplexeren Anweisungen.
2.4 Advanced Prompting – Gewichtung, Parameter und Modifikatoren
⚙️ Wenn du den Aufbau beherrschst, kannst du anfangen, das System bewusst zu beeinflussen. Mit Modifikatoren, Gewichtungen und technischen Parametern bringst du deine Prompts auf das nächste Level.
Die Basis kennst du inzwischen: Hauptmotiv, Stil, Szene, Stimmung, Technik. Aber manchmal reicht das nicht aus – zum Beispiel, wenn mehrere Elemente miteinander konkurrieren oder wenn du gezielt bestimmte Aspekte betonen oder abschwächen möchtest.
Hier kommen die sogenannten Prompt-Controller ins Spiel: sprachliche und technische Mittel, mit denen du Einfluss auf Prioritäten, Stilstärke, Struktur und Bildverhalten nehmen kannst.
🎛️ Was sind Gewichtungen und Modifikatoren?
Ein Modifikator ist ein Zusatz, der etwas genauer beschreibt, einschränkt oder betont. Im klassischen Sinne sind das Begriffe wie:
- „highly detailed“
- „soft lighting“
- „dramatic composition“
- „hyperrealistic“
- „cinematic“
- „trending on ArtStation“
Diese Begriffe geben der KI stilistische Feinsteuerung – und machen oft den Unterschied zwischen einem soliden und einem spektakulären Ergebnis.
Eine Gewichtung dagegen legt fest, wie stark ein bestimmter Begriff gewichtet werden soll. Das ist besonders in Tools wie Midjourney oder Stable Diffusion relevant, wo man mithilfe von Symbolen wie ::
oder Zahlenverhältnissen (1.5
, 0.8
etc.) Einfluss nehmen kann.
⚖️ Beispiele für Gewichtung (Tool-spezifisch)
⚠️ Hinweis: Diese Gewichtungssyntax funktioniert nicht in allen Programmen gleich. Sie ist vor allem für Midjourney, einige Stable-Diffusion-Interfaces und fortgeschrittene Tools relevant.
Beispiel:
plaintextKopierenBearbeitena dragon::2, in the clouds::1, watercolor style::0.5
Hier wird dem Drachen doppelt so viel Gewicht eingeräumt wie der Umgebung, während der Stil nur leicht ins Bild einfließt.
Du kannst damit Prioritäten setzen:
- Was muss im Bild dominant sein?
- Was ist nur Hintergrund?
- Was soll subtil wirken?
🔧 Technische Parameter
Einige Generatoren (z. B. Midjourney, ComfyUI, Automatic1111) bieten technische Parameter, die du direkt im Prompt oder im Interface steuern kannst:
📐 Aspect Ratio – Verhältnis von Breite zu Höhe (--ar 16:9
)
🔁 Seed – Reproduzierbarkeit des Bildes (--seed 12345
)
🌀 Chaos – Zufälligkeit erhöhen (--chaos 50
)
🔍 Stylize – Wie stark der Stil das Bild beeinflussen darf (--s 250
)
⏱️ Quality / Time – Rechenaufwand und Bildqualität (--q 2
)
Diese Angaben helfen dir, gezielter zu arbeiten – vor allem bei Wiederholungen oder Varianten.
🧠 Sprachliche Modifikatoren für Feinabstimmung
Auch ohne technische Gewichtung kannst du sprachlich steuern, was wichtig ist:
- Mit stärkenden Begriffen: „emphasized“, „dominant“, „central focus“, „highly detailed“, „visually striking“
- Mit abschwächenden Begriffen: „faint“, „in the distance“, „slightly blurred“, „subtle“, „washed out“
Solche Feinjustierungen machen den Unterschied, wenn du mehrere Varianten vergleichst – oder wenn dein Bild einfach „noch nicht ganz stimmt“.
✍️ Beispiel: Basic vs. Advanced
🔸 Basic Prompt:
„Ein futuristischer Soldat in einer zerstörten Stadt, digital painting“
🔹 Advanced Prompt:
„Ein futuristischer Soldat (center focus), leuchtende Augen, hochdetaillierte Rüstung, zerstörte Stadt im Hintergrund, dramatisches Licht von der Seite, cinematic framing, digital painting, ultra detail, 8K, moody atmosphere“
Hier siehst du: Der Grundgedanke bleibt – aber durch präzise Modifikatoren und Gewichtungen wird das Bild definierter, ausdrucksstärker und visuell anspruchsvoller.
🛠️ Wann „advanced“ wirklich sinnvoll ist
Nicht jeder Prompt muss komplex sein. Oft reicht ein klar formulierter Basis-Prompt mit drei bis fünf gezielten Begriffen.
Advanced-Techniken sind besonders hilfreich, wenn du:
- sehr spezifische Bildideen umsetzen willst
- mehrere visuelle Elemente ausbalancieren musst
- wiederholbare Ergebnisse erzielen willst (z. B. für Serien)
- gezielte Variantensteuerung brauchst
Sie sind kein Muss – aber ein mächtiges Werkzeug, wenn du dein Prompting auf das nächste Level bringen willst.
Ein gut formulierter Prompt ist mehr als eine Beschreibung. Er ist ein Steuerinstrument. Und mit Modifikatoren und Gewichtungen wird er zu einem präzisen Werkzeug für gezielte Bildkomposition.

Kapitel 3: Worte, die wirken – Stile, Perspektiven, Emotionen beschreiben
3.1 Visuelle Sprache – Wie du mit Wörtern Stile erzeugst
🎨 Ein Bildstil ist keine technische Angabe – sondern eine Sprache. Und wenn du lernst, sie richtig zu sprechen, beginnt die KI, deinen Ton zu treffen.
Jeder Mensch hat eine Vorstellung davon, wie ein Ölgemälde aussieht, ein Comic gezeichnet ist oder eine Szene in einem Studio-Ghibli-Film wirkt. Diese Vorstellungen kannst du nutzen – und in Sprache übersetzen.
Genau hier beginnt die visuelle Sprache im Prompting: Du benennst nicht nur, was die KI zeigen soll, sondern wie es aussehen soll. Der Stil wird zur visuellen Signatur deines Bildes – und deine Worte liefern die Vorlage.
🔍 Was macht einen Stil im Prompting aus?
Ein Stil beschreibt die visuelle Anmutung des Bildes: Malweise, Textur, Detaillierungsgrad, Farben, Komposition – und oft auch die Stimmung.
Typische Stilformen im Prompting sind:
🖌️ Traditionelle Malstile
z. B. „impressionistisch“, „barock“, „japanische Tuschemalerei“
📷 Fotografische Techniken
z. B. „Makroaufnahme“, „35mm-Filmlook“, „Langzeitbelichtung“
🖼️ Digitale Kunststile
z. B. „digital painting“, „low-poly 3D“, „vector art“, „pixel-art“
🎥 Film- und Serienästhetik
z. B. „cinematic lighting“, „Studio Ghibli“, „Blade Runner-Stil“
🧑🎨 Künstlerverweise
z. B. „im Stil von Van Gogh“, „inspired by H.R. Giger“, „Banksy-art“
Diese Begriffe wirken wie Abkürzungen für ganze visuelle Welten. Die KI kennt sie – und verbindet sie mit typischen Farbpaletten, Pinseltechniken oder Bildkompositionen.
🧠 Wie die KI mit Stilbegriffen umgeht
Stilbegriffe sind besonders effektiv, weil sie auf Trainingsdaten basieren. Wenn du „Barockstil“ schreibst, greift die KI auf Millionen Bilder zurück, die diesem Muster entsprechen – von Architektur über Malerei bis Lichtdramaturgie.
Das bedeutet: Je klarer du bist, desto gezielter kann die KI ihren Stilfilter aktivieren.
📌 Wichtig: Kombiniere Stilbegriffe immer mit einem klaren Motiv.
„Barockstil“ ohne Kontext ergibt kein brauchbares Bild. Aber:
„Porträt eines Ritters, im barocken Malstil, dramatisches Licht, dunkler Hintergrund“
→ liefert ein stimmiges Gesamtbild.
🎯 Wie du den richtigen Stil findest
Nicht jeder Stil passt zu jedem Motiv. Deshalb lohnt sich ein wenig Überlegung:
- Was soll das Bild ausdrücken – Ernsthaftigkeit, Leichtigkeit, Nostalgie?
- Welche Technik passt zur Stimmung – Ölfarbe, Tusche, Vektorgrafik?
- Welche Vorlage wirkt als Referenz – Film, Kunst, Medium?
Beispiele für bewusste Stilwahl:
🌫️ „dunkler Fantasy-Stil, inspiriert von Dark Souls“
💎 „klarer, geometrischer Vektorstil, pastellfarben, modern“
📚 „handgezeichnet, Buchillustration im Stil des 19. Jahrhunderts“
Je mehr du mit solchen Begriffen arbeitest, desto gezielter kannst du die Bildwirkung steuern.
✨ Stil & Technik gezielt kombinieren
Stil wirkt besonders stark, wenn du ihn mit anderen Faktoren kombinierst:
🎭 Stimmung:
„digital painting im expressionistischen Stil, aufgewühlt, emotional, grelle Farben“
💡 Licht:
„Filmstill mit weichem Gegenlicht, inspiriert von Blade Runner, Neonfarben“
🧱 Textur & Material:
„Ölgemälde auf Leinwand, sichtbar grobe Pinselstriche, dunkle Farbpalette“
So entstehen nicht nur Bilder – sondern visuelle Erzählungen.
🛠️ Stilentwicklung als Prompting-Kompetenz
Viele Anfänger fokussieren sich auf das Motiv. Doch wer visuell denkt, versteht schnell: Der Stil ist der eigentliche Charakter des Bildes.
Er bestimmt, wie ernst, verspielt, realistisch oder abstrakt ein Motiv wirkt. Und er entscheidet, ob dein Bild als Kunstwerk, Illustration oder Simulation gelesen wird.
Deshalb lohnt es sich, Stile zu testen, zu kombinieren und gezielt weiterzuentwickeln. Mit jedem Bild schärfst du dein Gefühl für:
- Komposition
- Farbstimmung
- Tiefe und Struktur
- Ausdruck und Interpretation
Prompting wird dadurch nicht komplizierter – sondern bewusster.
Stil ist mehr als ein Schlagwort. Er ist die Stimme deines Bildes – und du gibst ihr mit deinen Worten die Richtung.
Im nächsten Kapitel geht es darum, wie du zusätzlich zur visuellen Sprache auch Kameraeffekte und Perspektiven gezielt einsetzen kannst, um Tiefe, Nähe und Dynamik zu erzeugen.
3.2 Perspektiven und Komposition – Kameraeffekte im Prompting
📸 Die Kamera entscheidet, wie nah du dran bist. Sie bestimmt, was du siehst – und wie du es fühlst. Auch in KI-Bildern macht der Blickwinkel den Unterschied.
Viele denken beim Prompten vor allem an das Motiv: Was soll gezeigt werden? Doch mindestens genauso wichtig ist die Frage: Wie wird es gezeigt?
Denn Perspektive, Bildausschnitt und Komposition haben einen enormen Einfluss auf die Bildwirkung. Ein Objekt aus der Vogelperspektive wirkt distanziert. Nahaufnahmen erzeugen Intimität. Ein Weitwinkel verändert die Raumwahrnehmung – und damit auch die emotionale Lesart des Bildes.
Im Prompting kannst du diese Effekte gezielt über Sprache steuern – ganz ohne echte Kamera.
🎥 Die wichtigsten Kameraeffekte für Prompts
Viele Begriffe stammen aus der Fotografie oder dem Film. Die KI kennt sie – und kann sie interpretieren, wenn du sie im Prompt verwendest.
Hier die wichtigsten Effekte:
🔍 Close-Up / Nahaufnahme
Betont Details, schafft Nähe, wirkt oft intim oder intensiv.
Beispiel: „Nahaufnahme eines Auges, reflektiert den Nachthimmel“
🦅 Vogelperspektive (top-down view)
Zeigt das Motiv von oben, erzeugt Weite oder Kontrolle.
🐜 Froschperspektive (low angle view)
Blick von unten nach oben – lässt Figuren mächtig oder ehrfurchtgebietend erscheinen.
🔭 Weitwinkel / Wide Shot
Zeigt das ganze Setting, eignet sich für Szenen mit viel Umgebung oder Kontext.
Beispiel: „Weitwinkelaufnahme eines Wüstenplaneten bei Sonnenuntergang“
🎞️ Filmstill / Cinematic Composition
Simuliert eine Filmszene: starkes Seitenlicht, Tiefenunschärfe, symmetrische Komposition.
🖼️ Bildkomposition bewusst einsetzen
Neben der Perspektive spielt die Anordnung der Elemente im Bild eine große Rolle. Auch das lässt sich im Prompt beschreiben – mit Begriffen wie:
- Center Focus – Hauptmotiv in der Mitte
- Rule of Thirds – Drittelregel (Bildteilung für harmonische Komposition)
- Symmetrical Composition – Ausgewogenheit, Spiegelung
- Depth of Field / Bokeh – Hintergrund verschwommen, Fokus auf dem Vordergrund
Beispiel für eine bewusste Komposition:
🧑🚀
„Ein Astronaut steht zentriert im Bild, im Hintergrund eine zerstörte Raumstation, tiefe Schärfe im Vordergrund, weicher Hintergrund, cinematic lighting, Froschperspektive“
Hier steuerst du nicht nur, was zu sehen ist – sondern wie es gesehen wird.
🎯 Warum Perspektive so wichtig ist
Ein und dasselbe Motiv kann ganz unterschiedlich wirken – allein durch den Blickwinkel:
- Distanz erzeugt Objektivität, Nähe erzeugt Emotion
- Symmetrie wirkt geordnet, Asymmetrie dynamisch
- Froschperspektive verleiht Macht, Vogelperspektive Überblick
Die Perspektive ist wie ein stiller Erzähler: Sie kommentiert nicht, aber sie lenkt die Wahrnehmung.
Im Prompting bedeutet das: Mit nur wenigen Worten veränderst du die gesamte Bildwirkung.
🧠 Sprachlich präzise formulieren
Die Herausforderung: Kameraeffekte klar, aber verständlich zu formulieren – ohne technische Überladung.
Hilfreiche Begriffe sind:
- „view from above / top down“
- „low angle shot“
- „dramatic perspective“
- „over-the-shoulder view“
- „centered composition“
- „portrait framing“
- „depth of field, blurred background“
- „bokeh effect“
Die meisten Generatoren erkennen diese Begriffe – vorausgesetzt, sie sind sinnvoll ins Motiv eingebettet.
🛠️ Ausprobieren lohnt sich
Auch wenn du nicht aus der Fotografie kommst: Keine Sorge. Die Wirkung dieser Begriffe wirst du schnell spüren – allein durch das Experimentieren.
Ein Tipp:
Erstelle mehrere Prompts zum gleichen Motiv – mit verschiedenen Perspektiven. So erkennst du, welche Kameraeinstellung für deine Bildidee am besten funktioniert.
Beispiel:
- „Porträt einer Tänzerin bei Sonnenuntergang, Close-up“
- „Tänzerin auf Bühne, Weitwinkel, Licht von hinten, Silhouette“
- „Über-die-Schulter-Blick auf eine Tänzerin vor Spiegeln, filmisch, Tiefe“
Dasselbe Thema – drei völlig unterschiedliche Wirkungen.
Die Kamera ist nicht sichtbar. Aber ihre Wirkung ist in jedem Bild spürbar.
Im Prompting steuerst du diesen Blick mit Worten – und gibst deinem Bild nicht nur Inhalt, sondern auch Haltung.
Im nächsten Kapitel geht es darum, wie du gezielt Stimmungen, Gefühle und Storytelling in deine Prompts einbauen kannst. Denn Bilder sprechen – und mit den richtigen Worten kannst du beeinflussen, was sie sagen.
3.3 Gefühle, Atmosphäre und Storytelling in Prompts integrieren
🌫️ Ein gutes Bild zeigt etwas. Ein starkes Bild fühlt sich nach etwas an. Die Kunst besteht darin, mit Worten nicht nur Formen zu erzeugen – sondern auch Gefühle.
In der KI-Bildgenerierung denken viele zuerst an das Visuelle: Motiv, Stil, Farbe, Perspektive. Aber genau wie in der Fotografie oder Malerei ist es oft die Atmosphäre, die ein Bild unvergesslich macht.
Ein leichtes Leuchten im Nebel. Ein einsamer Blick. Eine angespannte Szene, in der man die Geschichte zwischen den Zeilen spürt.
Das Gute: Auch diese Wirkung lässt sich prompten – gezielt, präzise und kreativ.
🎭 Warum Stimmung so wichtig ist
Emotionale Wirkung entsteht nicht durch Details, sondern durch Verbindung.
Ein leeres Schloss kann gruselig, romantisch oder nostalgisch wirken – je nachdem, wie du es beschreibst.
Die KI entscheidet nicht, was das Bild fühlen soll. Du gibst ihr die emotionale Richtung vor, durch:
- Licht und Farbe
- Wetter und Raumgefühl
- Körpersprache und Komposition
- Stilwahl und erzählerischen Kontext
All diese Elemente beeinflusst du mit Sprache. Und je bewusster du formulierst, desto stärker die Wirkung.
💡 Schlüsselbegriffe für Stimmungen
Bestimmte Begriffe werden von KI-Systemen sehr zuverlässig erkannt – weil sie mit klaren Bildmustern verknüpft sind.
Hier einige wirkungsvolle Atmosphären-Tags:
🌧️ melancholisch, düster, regnerisch, einsam
☀️ warm, friedlich, harmonisch, goldenes Licht
❄️ kalt, verlassen, geheimnisvoll, nebelverhangen
🔥 intensiv, leidenschaftlich, dramatisch, emotional
🧊 surreal, verstörend, verstärkt realistisch, traumartig
Diese Worte sind nicht nur stilistische Füllung – sie formen die Wahrscheinlichkeiten im Bildmodell. Sie sagen der KI: Mach daraus kein „Was“, sondern ein „Wie“.
📖 Mini-Storytelling im Prompt
Bilder erzählen Geschichten – manchmal mit einem einzigen Satz.
Durch kleine, aber gezielte Ergänzungen kannst du eine ganze Welt andeuten.
Beispiel:
❌ „Ein Ritter auf einem Pferd“
✅ „Ein erschöpfter Ritter reitet im Morgengrauen durch ein verbranntes Tal, der Himmel ist grau, Rauch zieht über das Land“
Plötzlich entsteht nicht nur ein Bild – sondern eine Szene mit Vorgeschichte. Du beginnst zu spüren, was gerade passiert oder passiert ist.
📌 Hinweis: Du brauchst keine langen Texte. Oft reicht ein einziger Satz, um emotionale Tiefe anzudeuten.
🎯 Was wirkt besonders stark?
Hier ein paar Strategien, mit denen du gezielt Atmosphäre erzeugst:
🕯️ Tageszeiten verwenden
Morgendämmerung, blaue Stunde, Mittagshitze – jede Tageszeit hat eine eigene Stimmung.
💨 Wetter oder Lichtbedingungen einbauen
Nebel, Regen, Gegenlicht, Sonnenstrahlen – sie setzen emotionale Marker.
💬 Zustände statt Eigenschaften beschreiben
Statt „traurige Frau“ → „eine Frau mit gesenktem Blick, in Gedanken versunken, weiches Licht von der Seite“
🧩 Offene Szenen beschreiben
Was vor oder nach dem Moment passiert ist – das erzeugt Tiefe.
🛠️ Beispiel: Atmosphäre entwickeln
Grundidee: Ein kleines Haus am Waldrand
🔸 Neutral:
„Ein Haus am Waldrand, tagsüber, grüne Wiese“
🔹 Mit Stimmung:
„Ein altes Holzhaus am Waldrand, in goldenes Abendlicht getaucht, die Fenster leuchten warm, dichter Wald im Hintergrund, ruhige Stimmung“
🔹 Mit Storytelling:
„Ein verlassenes Holzhaus am Waldrand, die Fenster dunkel, der Himmel bedeckt, Nebel zieht aus dem Wald – alles wirkt still, als würde etwas warten“
Drei Varianten – drei völlig unterschiedliche Wirkungen. Nur durch Sprache.
Ein stimmungsvoller Prompt ist nicht länger – sondern bewusster formuliert. Er nutzt die Sprache nicht nur zur Beschreibung, sondern zur Deutung.
Bilder sprechen. Aber sie sagen das, was du vorgibst.
Im nächsten Kapitel gehen wir noch einen Schritt weiter: Du lernst, wie du aus Kunst, Film und Fotografie gezielt Inspirationen ziehst – und wie du ihre Sprache in deinen Prompts nutzen kannst.
3.4 Inspiration aus Kunstgeschichte, Fotografie und Film
🖼️ Wer Bilder erzeugen will, die wirken, muss Bilder kennen, die bereits gewirkt haben. Kunst, Film und Fotografie sind keine Vorbilder – sie sind Werkzeugkästen.
Egal ob klassisches Gemälde, ikonische Filmszene oder berühmtes Foto – viele visuelle Ideen, die wir als besonders eindrucksvoll empfinden, haben ihre Wurzeln in bekannten ästhetischen Traditionen.
Diese Referenzen kannst du im Prompting gezielt nutzen: nicht, um etwas zu kopieren, sondern um deiner KI-Anweisung eine stilistische Richtung und visuelle Tiefe zu geben.
🎨 Klassische Kunststile als visuelle Referenz
Die Kunstgeschichte bietet dir einen reichen Schatz an Stilen, Lichtkonzepten und Kompositionsprinzipien.
Hier einige Beispiele, die im Prompting häufig verwendet werden – und zuverlässig erkannt werden:
🖌️ Barock
Dramatisches Licht (Chiaroscuro), opulente Stoffe, tiefe Schatten, emotionale Komposition
🖌️ Impressionismus
Weiche Farben, sichtbare Pinselstriche, flüchtiger Moment, Lichtstimmung über Form
🖌️ Jugendstil / Art Nouveau
Dekorative Linien, florale Motive, elegante Figuren, fließende Formen
🖌️ Surrealismus
Unwirkliche Räume, symbolhafte Elemente, oft inspiriert von Dali, Magritte oder Ernst
🖌️ Expressionismus
Starke Farbkontraste, emotionale Übertreibung, deformierte Figuren, intensive Bildsprache
Diese Begriffe kannst du direkt in deine Prompts einbauen – oder sogar kombinieren:
🧠 Beispiel:
„Porträt einer Tänzerin im Stil des französischen Impressionismus, weiches Morgenlicht, pastellfarbene Palette, leichter Farbauftrag“
📷 Fotografie als stilistisches Werkzeug
Fotografische Begriffe erzeugen beim Prompting besonders klare Ergebnisse – denn viele Bildgeneratoren wurden mit massenhaft fotografischem Material trainiert.
Stilmittel aus der Fotografie, die du nutzen kannst:
📸 35mm Filmlook
Körnige Struktur, weiches Licht, analoge Anmutung
📸 Makroaufnahme
Extrem nah dran, geringe Tiefenschärfe, Detailfokus
📸 Langzeitbelichtung
Bewegungsunschärfe, Lichtspuren, traumartige Wirkung
📸 Overexposure / Underexposure
Über- oder unterbelichtet – für künstlerische Effekte
📸 Polaroid / Sofortbild-Look
Retro-Charme, weiche Farben, leicht ausgeblichene Töne
Beispiel für die Anwendung:
🧠 „Nahaufnahme einer vertrockneten Rose, 35mm Filmstil, analog, sanfte Körnung, natürliche Lichtreflexe“
🎬 Filmsprache als Inspirationsquelle
Filme arbeiten mit bewusster Bildkomposition. Und genau diese Sprache kannst du übernehmen:
🎞️ Cinematic Lighting
Dramatische Schatten, harte Kanten, Lichtführung wie im Kino
🎞️ Color Grading
Gezielte Farbgebung – z. B. Orange & Teal, düstere Blautöne, entsättigte Farben
🎞️ Filmstile & Regisseure
z. B. „im Stil von Wes Anderson“ (symmetrisch, pastellig, skurril)
oder „inspired by Blade Runner“ (dunkel, neon, dystopisch)
Beispiel:
🧠 „Ein Detektiv in einem verregneten Neonviertel, filmische Beleuchtung, inspiriert von Blade Runner, Rauch, nasser Asphalt, farbstark, digital painting“
Diese Art von Prompt erzeugt sofort eine Stimmung – ohne dass du sie explizit beschreibst. Die Referenz macht die Arbeit für dich.
🛠️ Kombinieren, nicht kopieren
Wichtig: Du musst keine stilistische Reinheit bewahren.
Gerade durch kreative Kombination entstehen spannende Ergebnisse.
🔄 Beispiel:
„Ein Samurai im Jugendstil – florale Elemente in der Rüstung, symmetrische Komposition, pastellfarbene Landschaft, digitaler Linienstil“
🔄 Oder:
„Eine Schachpartie als Ölgemälde im Stil von Rembrandt, dunkler Hintergrund, Licht von links, gespannte Atmosphäre“
Mit solchen Prompts entwickelst du keine Kopien, sondern neue, eigenständige Bildideen – inspiriert von bekannten Welten.
Stil ist nicht nur Handwerk, sondern auch Kultur.
Wer seine Quellen kennt, kann mit Sprache gezielt andocken – und mit jedem Prompt neue visuelle Wege gehen.

Kapitel 4: Fehlerquellen vermeiden – Von schwammig bis überladen
4.1 Häufige Anfängerfehler – Was deine Prompts ineffektiv macht
🚫 Ein guter Prompt ist nicht nur das, was du sagst – sondern auch das, was du bewusst weglässt. Viele schlechte Bilder entstehen nicht durch falsche Ideen, sondern durch kleine, vermeidbare Fehler.
Es braucht oft nur einen schwammigen Begriff, eine falsche Reihenfolge oder eine unklare Formulierung – und die KI produziert ein Bild, das ganz anders aussieht, als du es dir vorgestellt hast.
Diese typischen Fehler passieren fast allen, die mit KI-Bildgenerierung anfangen. Aber das Gute ist: Man kann sie leicht erkennen – und vermeiden.
🧱 1. Kein klares Hauptmotiv
Das häufigste Problem: Der Prompt enthält mehrere gleichwertige Motive – ohne erkennbaren Fokus.
❌ Beispiel:
„Ein Hund, ein Wald, eine Frau, Sonnenuntergang, Vintage-Stil“
Die KI weiß nicht, was im Zentrum stehen soll – alles konkurriert miteinander.
✅ Besser:
„Eine Frau mit einem Hund an der Leine, spaziert durch einen nebeligen Wald bei Sonnenuntergang, Vintage-Fotostil“
➡️ Tipp: Nenne zuerst das zentrale Motiv. Alles andere ergänzt die Szene.
🔍 2. Vage oder nichtssagende Begriffe
Begriffe wie „cool“, „besonders“, „kreativ“ oder „interessant“ sagen einer KI wenig – weil sie keine visuelle Bedeutung haben.
❌ Beispiel:
„Ein cooles Haus im futuristischen Stil“
Was ist „cool“? Für Menschen intuitiv, für Maschinen unbrauchbar.
✅ Besser:
„Ein kantiges, weißes Haus mit Glasfassade und LED-Elementen, minimalistisch, inspiriert von moderner Sci-Fi-Architektur“
➡️ Tipp: Verwende konkrete visuelle Begriffe, keine Wertungen.
🌀 3. Reizüberflutung durch zu viele Details
Viele denken: Je mehr ich beschreibe, desto besser wird das Bild. Das Gegenteil ist oft der Fall.
❌ Beispiel:
„Eine Person mit roten Haaren, grüner Jacke, auf einem Fahrrad, bei Sonnenuntergang, auf einer Brücke, im Regen, mit Nebel, in Paris, im Retro-Stil, aus der Froschperspektive, mit Schwarzweiß-Elementen“
Ergebnis: Die KI verwischt oder vermischt die Angaben – weil sie keine klare Gewichtung erkennt.
✅ Besser:
„Eine junge Frau mit roten Haaren fährt bei Sonnenuntergang durch den Regen, Retro-Stil, Froschperspektive, weiches Licht“
➡️ Tipp: Weniger ist oft mehr. Konzentriere dich auf 1–2 starke visuelle Schwerpunkte.
🔀 4. Unstrukturierte Reihenfolge
Wenn du Begriffe einfach aneinanderreihst, ohne inhaltliche Ordnung, wirkt der Prompt für die KI chaotisch.
❌ Beispiel:
„digital painting, dunkler Stil, Wolf, Wald, Fantasy, 8K, Vollmond, realistisch“
✅ Besser:
„Ein realistisches digitales Gemälde: Ein Wolf unter Vollmond im düsteren Fantasy-Wald, 8K, dunkle Farben“
➡️ Tipp: Verwende immer eine logische Abfolge: Motiv → Stil → Szene → Licht → Technik
❌ 5. Stilbrüche oder widersprüchliche Angaben
Wenn du Begriffe mischst, die nicht zueinander passen, erzeugt das visuelle Konflikte – oder verwässerte Ergebnisse.
❌ Beispiel:
„Ein fotorealistisches Anime-Gemälde in Pixelart mit Ölfarben“
Was soll das sein? Drei visuell völlig unterschiedliche Welten in einem Bild.
✅ Besser:
Entscheide dich für eine klare Richtung – z. B.
„Ein fotorealistisches Porträt im Anime-Stil mit leichten Pixelstrukturen im Hintergrund“
➡️ Tipp: Mischungen können funktionieren – aber nur, wenn sie stilistisch sinnvoll kombiniert sind.
📌 Zusammenfassung: Häufige Fehler im Überblick
🚫 Kein Fokus – zu viele Hauptmotive
🚫 Vage Begriffe – ohne visuelle Bedeutung
🚫 Überfrachtung – zu viele gleichgewichtige Details
🚫 Chaos im Satzbau – keine erkennbare Struktur
🚫 Stilkonflikte – widersprüchliche Bildwelten
Ein effektiver Prompt ist nicht nur kreativ, sondern klar, konsistent und gezielt reduziert.
Im nächsten Kapitel erfährst du, wie genau diese Fehler auch bei fortgeschrittenen Prompt-Erstellern auftreten – und warum Reduktion und Klarheit oft der Schlüssel zu wirklich starken Ergebnissen sind.
4.2 Weniger ist oft mehr – Reduktion auf das Wesentliche
✂️ Ein großartiges Bild braucht nicht viele Worte – nur die richtigen. Wer präzise formuliert, gibt der KI Raum zur Entfaltung, statt sie mit Informationen zu überladen.
Wenn du beginnst, mit KI Bilder zu generieren, liegt es nahe, möglichst viel in den Prompt zu schreiben. Du willst nichts vergessen, alles beschreiben, jedes Detail absichern.
Doch genau das führt oft dazu, dass die Bilder zu voll, zu unklar oder sogar fehlerhaft wirken.
Die Wahrheit ist: Die besten Prompts sind selten die längsten. Sie sind die klarsten.
📉 Warum weniger oft bessere Ergebnisse bringt
Eine KI funktioniert anders als ein Mensch. Sie braucht keine Ausschweifungen, keine komplette Szene mit „Einleitung, Hauptteil, Schluss“. Sie braucht klare, priorisierte Informationen – sonst beginnt sie, Begriffe gegeneinander abzuwägen oder zu mischen.
Das Problem bei langen, überladenen Prompts:
- zu viele Details → keine klare Gewichtung
- konkurrierende Motive → visuelle Unschärfe
- widersprüchliche Angaben → inkonsistente Bilder
- technischer Overkill → unnatürliches Ergebnis
Das Ziel sollte also nicht sein, so viel wie möglich zu sagen, sondern so wenig wie nötig – aber so treffend wie möglich.
🧠 Der Trick: Weglassen, was nicht gebraucht wird
Ein effektiver Prompt beantwortet nur drei Fragen:
- Was ist das zentrale Motiv?
- Wie soll es aussehen (Stil, Stimmung)?
- Was macht das Bild einzigartig oder besonders?
Alles andere kannst du weglassen – oder gezielt in einer späteren Iteration ergänzen.
✍️ Beispiel: Reduktion in Aktion
🔸 Lang und überfrachtet:
„Ein altes Piratenschiff mit zerrissenen Segeln, auf stürmischer See bei Nacht, mit Blitzen am Horizont, im realistischen Stil, 8K, fotorealistisch, dramatisches Licht, hoher Wellengang, mit Möwen, in einem Nebelmeer, gegen Wind, mit leichtem Regen, aus der Vogelperspektive, auf Öl gemalt“
🔹 Reduziert, aber kraftvoll:
„Ein realistisches Piratenschiff mit zerrissenen Segeln, bei Sturm in dunkler Nacht, Vogelperspektive, dramatisches Licht, digital painting“
Das zweite Beispiel enthält weniger Informationen – aber mehr Wirkung. Warum? Weil es der KI einen klaren Fokus gibt, ohne sie mit Details zu überfordern.
🧩 Das Prinzip der visuellen Reduktion
Weniger Elemente → mehr Klarheit
Weniger Stilmixe → stärkere Bildwirkung
Weniger Technikbegriffe → natürlichere Ergebnisse
Weniger Motive → bessere Komposition
💡 Reduktion bedeutet nicht, dass du weniger kreativ bist – sondern dass du gezielter formulierst.
🔄 Reduzieren durch Iteration
Du musst nicht beim ersten Versuch alles richtig machen.
Ein effektiver Workflow sieht so aus:
- ✍️ Erster Prompt – nur Grundidee formulieren
- 🖼️ Ergebnis prüfen – Was passt? Was stört?
- ✂️ Prompt kürzen, vereinfachen, neu gewichten
- 🔁 Varianten ausprobieren – ohne neue Reizüberflutung
Oft reicht es, ein einzelnes Adjektiv zu entfernen – und plötzlich passt das Bild perfekt.
🧘🏻♀️ Minimalismus als Prompt-Philosophie
Statt fünf Begriffe zu verwenden, die alle in dieselbe Richtung zielen, reicht manchmal einer, der präzise sitzt.
Vergleich:
❌ „Eine junge Frau, zart, melancholisch, verträumt, introvertiert, traurig, alleine, ruhig“
✅ „Eine junge Frau, verträumter Blick, weiches Licht, melancholische Stimmung“
Weniger Worte – aber mehr Aussage.
In der KI-Bildgenerierung geht es nicht darum, alles zu kontrollieren, sondern darum, gezielt zu steuern.
Und das erreichst du nicht durch mehr – sondern durch Klarheit.
Im nächsten Kapitel erfährst du, wie du noch gezielter formulierst, indem du unklare Begriffe und Mehrdeutigkeiten konsequent vermeidest.
4.3 Unklare Begriffe und Mehrdeutigkeit vermeiden
🧩 Ein gutes Bild braucht klare Sprache. Begriffe, die für Menschen intuitiv verständlich sind, führen die KI oft in die Irre – oder lassen sie ganz im Dunkeln tappen.
Viele Wörter, die du im Alltag problemlos nutzt, haben in der Welt der KI-Bildgenerierung keine eindeutige visuelle Bedeutung. Das liegt daran, dass KI nicht „versteht“ – sie rechnet. Und sie kann nur mit dem arbeiten, was eindeutig genug in ihren Trainingsdaten verankert ist.
Deshalb ist es wichtig, dass du Begriffe verwendest, die visuell lesbar sind – das heißt: Begriffe, bei denen klar ist, wie sie aussehen sollen.
❌ Warum schwammige Begriffe problematisch sind
Begriffe wie „besonders“, „kreativ“, „magisch“ oder „intensiv“ transportieren in menschlicher Sprache viel – aber in der Bildgenerierung: nichts Konkretes.
Die KI kann solche Wörter nicht „interpretieren“, sie kann sie nur statistisch einordnen. Das Ergebnis: Die Bildwirkung wird schwach, vage oder inkonsistent.
Beispiel:
❌ „Ein magisches Schloss in der Nacht“
→ Was ist „magisch“? Ist es bunt? Glänzend? Leuchtend? Mystisch? Futuristisch?
✅ „Ein hell erleuchtetes Schloss mit schwebenden Kristallen, inmitten von Nebel, unter einem violetten Nachthimmel“
➡️ Tipp: Ersetze abstrakte Begriffe durch visuelle Beschreibungen.
🔁 Beispiele für schwammige Begriffe – und ihre Alternativen
❌ Unklar | ✅ Besser |
---|---|
schön | goldfarben, symmetrisch, eleganter Stil |
interessant | ungewöhnlich, asymmetrisch, organische Formen |
cool | futuristisch, kantiges Design, Neonlicht |
emotional | tränenreich, gesenkter Blick, weiches Licht |
geheimnisvoll | schattig, Nebel, undeutlich, Silhouetten |
kreativ | fantasievoll, surreal, farbenreich |
🔍 Grundregel: Frag dich immer: Wie sieht das konkret aus?
Wenn du darauf keine klare Antwort hast, ist der Begriff für die KI zu schwammig.
🧠 Doppeldeutig? Dann lieber konkret!
Ein weiteres Problem: Mehrdeutigkeit. Manche Begriffe haben mehrere Bedeutungen – und führen zu völlig anderen Ergebnissen.
Beispiel:
❌ „Bank“ – Sitzgelegenheit oder Geldinstitut?
❌ „Jaguar“ – Raubkatze oder Automarke?
❌ „Light“ – Beleuchtung oder Diätprodukt?
➡️ Tipp: Kombiniere den Begriff immer mit einem beschreibenden Kontext.
✅ „Raubkatze: Jaguar im Regenwald, realistisch, Nahaufnahme“
✅ „Vintage-Auto: Jaguar E-Type, in Bewegung, 1970er-Stil“
🧠 So formulierst du eindeutig
Einige Formulierungsstrategien helfen dir, von Anfang an mehr Klarheit zu schaffen:
📌 Vermeide allgemeine Adjektive
→ Statt: „beeindruckendes Bild“
→ Besser: „großformatiges, symmetrisches Bild mit starken Kontrasten“
📌 Vermeide doppeldeutige Hauptwörter
→ Statt: „Fuchs in der Bank“
→ Besser: „Ein stilisierter Fuchs auf einer Holzbank in einem Stadtpark“
📌 Vermeide vage Verben
→ Statt: „tanzt schön“
→ Besser: „eine Tänzerin in einer eleganten Pose, Arm erhoben, fließende Bewegung“
✍️ Beispiel-Prompt vor und nach Klarstellung
🔸 Vage Prompt:
„Ein interessantes Portrait einer Person in kreativem Stil“
🔹 Klarer Prompt:
„Portrait einer jungen Frau mit violetten Dreadlocks, auf dunklem Hintergrund, im surrealistischen Stil, leicht verzerrte Proportionen, leuchtende Farben, digitales Gemälde“
Der zweite Prompt ist länger – aber nicht überladen. Er ist klar, visuell und stimmig.
📌 Zusammenfassung – So vermeidest du Mehrdeutigkeiten:
✅ Verwende visuelle Begriffe statt emotionaler Adjektive
✅ Stelle sicher, dass jedes Wort „sichtbar“ ist
✅ Vermeide doppeldeutige Begriffe ohne Kontext
✅ Nutze Stil, Szene, Licht und Farbe zur Klarstellung
✅ Frage dich immer: Könnte die KI das falsch verstehen?
In der Bildsprache der KI ist Unklarheit das größte Hindernis für Qualität. Je genauer du formulierst, desto näher kommst du deinem Zielbild.
Im letzten Kapitel dieses Abschnitts schauen wir uns an, wie du deine Prompts gezielt überarbeiten und verbessern kannst – mithilfe von Iteration und gezielter Analyse.
4.4 Prompt-Optimierung durch Iteration und Analyse
🔁 Ein starker Prompt entsteht selten im ersten Anlauf. Wer gezielt iteriert, lernt nicht nur schneller – sondern promptet kreativer, effizienter und visuell überzeugender.
Viele KI-Nutzer machen den Fehler, einen Prompt einzugeben, das Ergebnis zu betrachten – und ihn dann komplett neu zu schreiben, wenn das Bild nicht passt.
Doch viel sinnvoller ist es, in kleinen, gezielten Schritten zu optimieren. Das spart Zeit, zeigt dir, was funktioniert – und macht aus jedem Bild eine Lektion.
🔍 Warum Iteration so wichtig ist
Prompting ist kein Schalter, den du umlegst – es ist ein Dialog mit einem System, das nicht intuitiv versteht, sondern berechnet.
Selbst kleine Änderungen – ein neues Adjektiv, eine andere Wortreihenfolge oder ein gestrichener Begriff – können große visuelle Unterschiede machen.
Mit Iteration lernst du, wie bestimmte Worte auf das Ergebnis wirken. Und du entwickelst ein Gefühl für:
- welche Begriffe das Bild dominieren
- was überflüssig ist
- wie Stil und Technik zusammenwirken
- wo sich Bildwirkung konkret beeinflussen lässt
🧭 5-Schritte-Methode zur Prompt-Optimierung
Hier eine einfache, effektive Methode, mit der du strukturiert arbeiten kannst:
- Start-Prompt formulieren
Beginne mit einem klaren Basis-Prompt (Motiv, Stil, Licht, ggf. Technik) - Bild generieren & beobachten
Was gefällt dir? Was fehlt? Was wirkt falsch? - Störfaktoren benennen
Ist das Bild zu voll? Zu flach? Ist der Stil nicht wie gewünscht? Zu wenig Fokus? - Gezielte Änderungen vornehmen
- Detail ergänzen oder streichen
- Stilbegriff anpassen
- Reihenfolge ändern
- Begriffe gewichten
- Neues Bild generieren – und vergleichen
Lerne daraus. Wiederhole den Vorgang, bis das Bild deiner Vorstellung nahekommt.
🛠️ Beispiel: Iteration im Einsatz
Grundidee: Ein Samurai bei Sonnenaufgang
🧪 1. Version:
„Ein Samurai bei Sonnenaufgang“
🔹 Problem: zu allgemein → Bild wirkt beliebig, stilistisch unklar
🔁 2. Version:
„Ein Samurai mit Rüstung auf einem Hügel, Sonnenaufgang, realistisch, digital painting“
🔹 Besser: Szene entsteht, aber noch keine Stimmung
🔧 3. Version:
„Ein älterer Samurai mit Narben im Gesicht, steht auf einem Hügel im Morgennebel, goldener Sonnenaufgang im Hintergrund, melancholische Stimmung, digital painting, weiche Farben“
🔹 Ergebnis: klare Figur, stimmige Komposition, emotionale Wirkung
➡️ Fazit: Jede Iteration bringt das Bild näher an die Idee – ohne alles neu zu erfinden.
🧠 Was du gezielt analysieren solltest
Bei jedem generierten Bild kannst du dich fragen:
- Welche Begriffe haben funktioniert? (z. B. Stil, Licht, Szene)
- Was ist überflüssig? (z. B. doppelte Angaben, schwache Adjektive)
- Welche Wirkung fehlt noch? (z. B. Tiefe, Dynamik, Stimmung)
- Wo ist das Bild nicht stimmig? (z. B. Perspektive passt nicht zum Motiv)
📌 Profi-Tipp: Halte dir die Bildvarianten und Prompts in einer Tabelle oder Notizübersicht fest – das erleichtert Vergleich und Weiterentwicklung.
✏️ Kleine Änderungen, große Wirkung
In der KI-Bildgenerierung gilt oft:
Ein neues Adjektiv wirkt mehr als fünf zusätzliche Begriffe.
Beispiele:
- „realistisch“ → „filmisch“
- „dunkel“ → „düster“
- „freundlich“ → „warm“, „sonnig“, „weiches Licht“
- „Samurai“ → „gealterter Samurai mit narbigem Gesicht“
Mit jedem einzelnen Begriff lenkst du das Bild – gezielt oder unbewusst. Iteration hilft dir, das bewusst zu machen.
📌 Zusammenfassung: Prompting als Lernprozess
✅ Nicht neu anfangen – sondern gezielt weiterentwickeln
✅ Kleine Änderungen testen – Wirkung beobachten
✅ Sprache schärfen – auf Wirkung statt Länge achten
✅ Varianten speichern und vergleichen
✅ Eigene Stilvorlagen aufbauen
Prompting wird dadurch nicht nur effektiver, sondern auch befriedigender. Du wirst sehen, wie du deine Bildsprache mit jedem Durchlauf verfeinerst – und deine Kontrolle wächst.