DALL-E 3: tekst to image

DALL·E 3 is het tekst to image model van OpenAI. Dit model is alleen toegankelijk via ChatGPT en met een betaald abonnement. Het is een beduidend beter model dan concurrenten zoals SDXL van Stability.ai of de gratis toegankelijke versie van DALL·E via Microsoft Copilot. Ik heb hier het programma wisselende mate van vrijheid gegund. De basis van alle plaatjes is door het programma zelf bedacht. De enige prompt was een deel van de tekst van het verhaal en het verzoek om hier goed passende plaatjes bij te maken. Hiermee zijn ongeveer 30 goede plaatjes mee gegenereerd.

In zowel de generatieve als de assemblagefase ben ik bezig geweest met DALL·E 3. Dit was omdat pas bij het in elkaar zetten de noodzaak van bepaalde plaatjes naar voren kwam. Hierbij ben ik specifieker geweest met prompts en heb ik de scene zelf redelijk uitvoerig beschreven. Opmerkelijk is dat ChatGPT zelf altijd een uitgebreidere prompt maakt van de invoer van de gebruiker, wat waarschijnlijk zorgt voor betere kwaliteit foto’s. Met enige regelmaat is ook de inpainting feature gebruikt. Generatieve AI blijft redelijk willekeurig, wat zorgt voor een noodzaak om kleine specifieke aanpassingen te maken. Bij sommige plaatjes heb ik een tekst+image to image prompt gebruikt. Hierin leverde ik zowel een eerder gegenereerd plaatje aan als een nieuwe prompt in de hoop dat de stijl redelijk consequent zou blijven. Dit gaf wisselend succes. Helaas heeft ChatGPT niet een werkende mogelijkheid om chatlogs te delen waar ook plaatjes in gebruikt zijn

Plaatjes gemaakt door ChatGPT