Je typt “een vrouw met een arbeidsconflict” in Midjourney. Wat je terugkrijgt is een stockfoto-achtig portret van een glimlachende dame in een pak. Met een map onder haar arm. Het raakt kant nog wal. Het vertelt geen verhaal. Het is visueel behang. En dat is precies het probleem met hoe de meeste mensen AI-beelden maken. Ze beschrijven een onderwerp in plaats van een beeld. Ze typen een zoekterm in plaats van een scène. Conceptueel prompten draait de aanpak om. Je begint niet bij wat je nodig hebt. Je begint bij wat je wilt laten zien en voelen.
TL;DR: AI-beeldgeneratoren maken precies wat je vraagt, niet wat je bedoelt. Conceptueel prompten betekent dat je een scène in detail opbouwt zoals een fotograaf of regisseur dat doet: met setting, emotie, compositie en veelzeggende details. Fotografen hebben hierin een groot voordeel omdat ze al gewend zijn om in beelden te denken. Dit artikel laat zien hoe je van een vage omschrijving naar een krachtig visueel concept komt.
De meeste AI-beelden mislukken al voordat je begint
Ik zie het veel voorbijkomen. Mensen die teleurgesteld zijn in hun AI-resultaten. “Het doet niet wat ik wil.” Onjuist! Het doet exact wat je wilt. De schuld ligt niet bij de AI. De schuld ligt bij de opdracht. Of beter gezegd: bij het ontbreken van een visueel concept achter die opdracht. De meeste prompts lezen als een Google-zoekopdracht. “Advocaat die helpt bij arbeidsconflict” of “Professionele zakelijke foto.” Dat is geen prompt. Dat is een verlanglijstje zonder recept. AI-tools als Midjourney of DALL-E zijn verbazingwekkend krachtig maar ze zijn geen gedachtenlezers. Ze vullen alle gaten in je prompt op met gemiddelden, de meest voorkomende visuele interpretatie van jouw woorden. Dat levert generieke beelden op. Conceptueel prompten lost dat op door de AI precies te vertellen welk beeld je voor je ziet. Tot in de details die ertoe doen.
Denken als een regisseur, niet als een opdrachtgever
Stel je voor dat je een film maakt. Je spreekt je setdresser en zegt: “Maak een scène over eenzaamheid.” Die persoon staart je aan. Waar? Wanneer? Welk personage? Welk licht? Welke kleur heeft de muur? Zit er iemand of staat er iemand? Een regisseur levert geen thema aan. Een regisseur levert een shot aan. Elke keuze vertelt iets. De lege stoel naast het personage. De tl-verlichting die net te hard is. Het koffiekopje dat al koud is. Zo werkt conceptueel prompten ook. Je beschrijft niet het gevoel. Je beschrijft de elementen die dat gevoel oproepen. En dat is een vaardigheid die fotografen al in hun vingers hebben. Elke keer dat je door een zoeker kijkt en beslist om twee stappen naar links te doen, doe je precies dit. Je bouwt een beeld op vanuit keuzes.
Het verschil tussen een briefing en een visueel concept
Een briefing zegt: “We hebben een beeld nodig dat laat zien hoe eenzaam een arbeidsconflict kan voelen. Voor de website van een arbeidsrechtadvocaat.” Prima. Dat is nuttige informatie. Maar het is geen prompt. Een visueel concept vertaalt die briefing naar iets dat je kunt fotograferen. Of in dit geval: kunt prompten. Het verschil zit in de vertaalslag van thema naar scène. Van “eenzaamheid” naar een specifieke vrouw op een specifieke plek met een specifiek detail dat het verhaal vertelt. Die vertaalslag is waar de meeste mensen vastlopen. Niet omdat ze geen creativiteit hebben, maar omdat ze niet gewend zijn om in visuele scènes te denken.
Het advocaat-voorbeeld stap voor stap
Laten we het concreet maken met één voorbeeld dat ik door het hele proces heen trek. De opdracht: maak een beeld voor de website van een arbeidsrechtadvocaat. Het moet de emotionele impact van een arbeidsconflict tonen. De eerste impuls van de meeste mensen is iets als: “a woman dealing with a workplace conflict, professional photography.” Wat je krijgt: een vrouw die fronst achter een bureau. Misschien met haar handen in haar haar. Stockfoto-niveau. Je ziet het wellicht zo voor je, maar dit is niet de foto die je wilt.

Nu de aanpak met conceptueel prompten. Ik sluit mijn ogen. Hoe ziet een arbeidsconflict eruit als je het zou moeten fotograferen? Niet het conflict zelf, maar het gevoel of de stilte, de details zie zorgen voor de eenzaamheid en de pijn.
Ik zie een lege bedrijfskantine. Licht is al uit, hier en daar een zacht spotje en een groen brandend bordje ‘UIT’. Einde van een bedrijfsfeest, iedereen is weg. Er is rommel, statafels, omgestoten drank, flessen bier en wijnflessen. Een witte boa op de grond en vertrapte kerstversiering en hoedjes van goudglitter. De vloer is nat en plakkerig van het bier. In de verte staan statafels met bakjes eten, omgevallen glazen. Een jonge vrouw met blond haar zit op de grond, haar knieën opgetrokken en haar hoofd tussen haar knieën en ze heeft blote voeten. Ze huilt. Tegen het plafond zweeft één eenzame ballon. Het is Kerstmis. Aan het plafond hangt een gescheurde banner “Fijne Kerst en een fantastisch nieuwjaar.” De sfeer is beklemmend. Een spotje schijnt recht omlaag op de vrouw.
Er is die avond iets gebeurd. Je voelt het. Maar het staat er niet.

De setting, de ballon, de houding, de blote voeten. Daar zit het verhaal. Een arbeidsconflict in volle gang. Dat is wat AI nooit zelf bedenkt. Een AI kan duizend variaties genereren van “eenzame vrouw op kantoor.” Maar die ballon tegen het plafond van een lege kantine? Dat is menselijk denken. Dat is een fotograaf die een scène regisseert.
De bovenstaande omschrijving hebt ik toegevoegd aan mijn CameraGuru Promptgenerator, die ik heb getraind om extra vragen te stellen en een beschrijving te vertalen naar een prompt.
De prompt wordt dan iets als: Wide-angle cinematic photograph of a desolated post-Christmas office hall. The overall color palette is heavily desaturated and moody (gritty grey and charcoal tones), making the woman in the foreground stand out in vibrant, sharp relief. A young blonde woman with a tearful expression, barefoot and wearing a brilliant, shimmering golden sequined gala dress, is huddled in the right foreground against a dark textured wall. Her face is buried in her arms, radiating pure despair, untouched by the desaturation, with one strap of her dress slipped off her shoulder. The rest of the vast hall is rendered in grim, lifeless, deeply shadowed tones. The wooden plank floor, with dark and distinct pieces of trash like a few shattered gold party hats, some torn green tinsel, shattered glasses, and baubles on the floor, are muted to near-grayscale. Tall, haphazard bistro tables are scattered haphazardly and tilted kriskras through the empty space. A single solitary golden balloon (desaturated to a cool greyish-gold hue) floats prominently just above the woman’s head. On the wall behind her, a large, expensive-looking banner is torn and hanging crookedly, reading: “Fijne Kerst en een fantastisch nieuwjaar.” (muted to appear as an old scroll). In the far distance, a small, dimly lit Christmas tree (heavily muted) and a glowing green ‘UIT’ exit sign provide the only other light. Shot on 35mm film, high contrast chiaroscuro lighting, deep shadows, realistic textures, no CGI, widescreen 21:9.
Fotografen hebben een oneerlijk voordeel
Als fotograaf denk je al jarenlang in beelden. Je loopt een ruimte binnen en ziet lichtval. Je ziet lijnen. Je ziet hoe een schaduw op een gezicht valt. Die manier van kijken is precies wat conceptueel prompten vereist. Ze begrijpen compositie. Ze begrijpen hoe licht emotie stuurt. Ze weten dat een 85mm-lens een ander verhaal vertelt dan een 24mm. Die kennis vertaalt zich direct naar betere prompts. Waar een niet-fotograaf schrijft “mooi licht,” schrijf jij “zacht zijlicht van links, gouden toon, lichte lens flare.” Waar iemand “close-up” typt, specificeer jij de brandpuntsafstand en de scherptediepte. Dat is geen elitair gedoe. Dat is gewoon preciezer communiceren met een machine die letterlijk doet wat je zegt.
Chase Jarvis zei het mooi: “The best camera is the one that’s with you.” Ik denk dat de AI-variant daarvan is: het beste AI-beeld is het concept dat je al in je hoofd hebt voordat je begint te typen.
Vijf bouwstenen van een sterk visueel concept
Elk sterk AI-beeld begint met dezelfde vijf bouwstenen. Niet als een checklist die je afvinkt. Meer als vijf vragen die je jezelf stelt voordat je ook maar één woord typt.
- Onderwerp en houding: Wie of wat zie je? En wat doet die persoon? “Een vrouw” is niets. “Een vrouw zittend op de grond met haar hoofd tussen haar knieën” is een beeld.
- Omgeving: Waar speelt de scène zich af? De ruimte vertelt minstens de helft van het verhaal. Een lege kantine zegt iets heel anders dan een druk kantoor.
- Licht en sfeer: Tl-verlichting voelt kil en institutioneel. Warm zijlicht voelt intiem. Licht is emotie. Benoem het.
- Het veelzeggende detail: De ballon. Het koude koffiekopje. De ingelijste foto die omgevallen is. Eén detail dat het verhaal draagt.
- Perspectief en lens: Kijk je van bovenaf naar beneden op het onderwerp? Of vanuit ooghoogte? Gebruik je een wijdhoek die de leegte van de ruimte benadrukt? Of een telelens die isoleert?
Merk op dat geen van deze bouwstenen gaat over het thema of de boodschap. Die zitten verborgen in de visuele keuzes. Dat is de kern van conceptueel prompten. Je zegt nooit “eenzaam” tegen de AI. Je laat eenzaamheid zien door de keuzes die je maakt. Net zoals je dat als fotograaf zou doen. De boodschap ontstaat niet in de woorden. De boodschap ontstaat in het beeld. En hoe specifieker jouw visuele keuzes zijn, hoe krachtiger het resultaat.
Waar het misgaat en hoe je dat voorkomt
De grootste valkuil bij conceptueel prompten is overcompensatie. Je hebt net geleerd dat details belangrijk zijn. Dus je propt er twintig in. Drie personages. Twee lichtbronnen die elkaar tegenspreken. Een achtergrond vol meubels. En dan vraag je je af waarom het resultaat een rommeltje is. Minder is meer. Kies één emotie. Eén setting. Eén veelzeggend detail. Net als bij echte fotografie. De beste beelden zijn niet de drukste. Een andere veelgemaakte fout: je beschrijft stijl in plaats van inhoud. “Cinematic, award-winning, 8K, hyperrealistic.” Dat zijn geen visuele keuzes. Dat zijn Instagram-hashtags. Ze vertellen de AI hoe het beeld eruit moet zien. Maar niet wat erop staat. Begin altijd bij de scène. De stijl komt daarna.
En dan is er nog de fout die ik zelf ook maak. Te snel typen. Te weinig nadenken. Je hebt een deadline. De klant wacht. Je ramt een prompt in het tekstveld en hoopt op het beste. Maar conceptueel prompten vraagt dat je even stopt. Dat je je ogen sluit. Dat je het beeld voor je ziet voordat je het beschrijft. Vijf minuten nadenken scheelt je een half uur frustratie. Dat klinkt als een cliché. Maar ik heb het inmiddels zo vaak meegemaakt dat het gewoon een feit is. De prompt is niet het startpunt. Het concept is het startpunt. De prompt is alleen de vertaling.
Er woedt een debat over of AI-beelden “echte” fotografie zijn. Ik vind dat een oninteressante discussie. Wat is wel echt? Fotonen vertalen naar een emulsie op plastic? Of fotonen vertalen naar pixels? Ik ben benieuwd: heb jij al geëxperimenteerd met conceptueel prompten? Wat werkt voor jou? Deel je ervaringen in de reacties hieronder.
Veelgestelde vragen
- Moet ik technische fototermen gebruiken in mijn AI-prompts? Dat helpt zeker. Termen als “35mm lens,” “shallow depth of field” of “zacht zijlicht” geven de AI concrete visuele aanwijzingen. Je hoeft geen fotografie-expert te zijn. Maar hoe preciezer je het licht en het perspectief beschrijft, hoe beter het resultaat. Begin met basiskennis over brandpuntsafstand en lichtrichting.
- Werkt conceptueel prompten in elke AI-beeldgenerator? Ja. Of je nu Midjourney, DALL-E of Stable Diffusion gebruikt: een gedetailleerd visueel concept levert altijd betere resultaten op dan een vage beschrijving. De syntax verschilt per platform. Maar het principe is universeel. Beschrijf een scène in plaats van een onderwerp.
- Hoe lang moet een goede prompt zijn? Niet zo lang mogelijk. Zo precies mogelijk. Een prompt van drie zinnen die één heldere scène beschrijft, werkt beter dan een prompt van tien zinnen vol tegenstrijdige details. Richt je op de vijf bouwstenen: onderwerp, omgeving, licht, detail en perspectief. Dat is genoeg voor een krachtig beeld.

Ik ben Jeroen. Ik maak foto’s, maar vooral omdat ik graag kijk. Echt kijk. Dat begon ruim twintig jaar geleden met een Nikon D50, gekocht rond de geboorte van mijn zoon. Sindsdien is fotografie voor mij verweven geraakt met aandacht, nieuwsgierigheid en het vastleggen van momenten die anders ongemerkt voorbijgaan.
Ik ben iemand die wil begrijpen wat hij doet. Daarom zit ik net zo graag in de techniek als in het beeld zelf. Tegenwoordig werk ik met een Fujifilm X-T50: compact, eigenwijs, en precies uitdagend genoeg om me scherp te houden. Ik word blij van uitzoeken waarom iets werkt — of waarom juist niet.
Naast fotograferen schrijf ik over fotografie. Niet om te laten zien wat ik weet, maar om anderen mee te nemen in dat ontdekproces. Ik hou ervan om ingewikkelde dingen simpel te maken, zonder ze plat te slaan. Of je nu net begint of al jaren fotografeert: er valt altijd iets nieuws te zien, te leren, te verbeteren. Dat enthousiasme delen, dát is wat me drijft.
