Ik vroeg een AI om een portret van een perfect mens

Ik vroeg een AI om een portret van een perfect mens

Kunstmatige Intelligentie (AI) is niet meer weg te denken uit ons dagelijks leven. Mede daarom besteedde ik eerder aandacht aan AI. Zo maakte en onderzocht ik een computerprogramma dat slimmer belegt dan een mens (bekroond met de KNAW Onderwijsprijs) en reviewde ik een tooltje dat met minimale input een soort-van-oké verhaal wist te schrijven. Vandaag gaan we een stap verder: kunst-AI’s.

Een computerprogramma dat kunst maakt, is bijzonder. Creativiteit werd lang gezien als iets wat alleen mensen kenden. Computers kunnen moeiteloos ingewikkelde berekeningen uitvoeren, maar voor het maken van een schilderij heb je toch echt een mens nodig. Tenminste, dat was de consensus tot enkele jaren geleden. Sinds de opkomst van GPT-3, een geavanceerde AI die teksten kan schrijven die niet van echt te onderscheiden zijn, weten we dat het mogelijk is om een ‘creatieve’ AI te maken. Zo schreef GPT-3 met succes een wetenschappelijke paper over zichzelf.

AI’s die beeldende kunstwerken maken, bestaan in principe al langer. Echter, deze zijn vaak niet publiekelijk toegankelijk. Het bedrijf Midjourney wil hier verandering in brengen. Hun programma stelt inmiddels meer dan een miljoen mensen in staat om gemakkelijk kwalitatief hoge ‘kunst’ te maken. Maar hoe goed is het algoritme? Is dit het einde van de huidige kunstindustrie? En kunnen we deze AI gebruiken om belangrijke levensvragen te beantwoorden?

Midjourney

Midjourney heeft als doel om zoveel mogelijk mensen kennis te laten maken met de wereld van kunstmakende AI’s. Ze bieden een proefversie van hun AI aan, die te bedienen is via het chatprogramma Discord. Ik werd lid van hun Discordserver. Alhoewel je de AI-bot op hun server kunt gebruiken, heb ik hier niet voor gekozen. Hun server was druk en raakte snel overvol met bot requests. Ik voegde daarom de Discordbot toe aan door mij gemaakte testserver. In dit artikel ga ik niet verder op dit proces in.

De proefversie van Midjourney belooft voldoende GPU-rekentijd om 25 kunstwerken te genereren. Deze belofte komt het programma ruimschoots na. Ik maakte in totaal 29 afbeeldingen, waarvan drie ‘upscales’ (later meer hierover) en 26 ‘grids’ van 2×2 afbeeldingen.

De eerste digitale kunstwerken

Het programma werkt eenvoudig: je geeft (Engelse) parameters of kernwoorden op, en de AI poept vier kleine schilderijtjes samengevoegd in één afbeelding uit. Ik begon met een paar simpele inputs:

(van links naar rechts, of van boven naar beneden op mobiel)

A melty triangular ice cream
A fire dragon attacking a castle on top of a hill
Virus attack
Windows Defender

Ik was onder de indruk. Dit zijn duidelijk rechthoekige ijsjes. De draak en het kasteel vormden ook geen probleem voor de AI. En de ‘virus attack’ leverde vier prachtig apocalyptische beelden op. Met ‘Windows Defender’ doelde ik natuurlijk op de gelijknamige virusscanner. Dit is niet helemaal in het resultaat zichtbaar, maar ‘windows’ zijn in elk geval terug te vinden in drie van de vier schilderijtjes. En met een beetje fantasie zien de ramen er net zo uit als het logo van Windows 10.

Al snel gaf ik het programma ingewikkeldere dingen om mee te werken.

(van links naar rechts, of van boven naar beneden op mobiel)

The death of the universe
A realistic computer virus infecting a computer system
Planet Earth battling with its worst enemy
What is the meaning of Stonehenge?

De enige prompt die echt anticlimactisch resultaat gaf, was ‘What is the meaning of Stonehenge?’ Daar geeft Midjourney geen antwoord op. In plaats daarvan kreeg ik vier plaatjes die zo uit de Lonely Planet geknipt konden zijn. Mooi ‘geschilderd’, daar niet van, maar ik had op een filosofisch antwoord gehoopt. Een andere gemiste kans zien we bij de input ‘Planet Earth battling with its worst enemy’. Als de AI maatschappelijk geëngageerd zou zijn – iets wat we tegenwoordig verwachten van de gemiddelde kunstenaar – dan had hij hier natuurlijk een vervuilende mens moeten afbeelden.

Gevoelens en emoties

Tot nu toe hebben we gezien dat Midjourney weinig problemen heeft met concrete prompts. Bij de ingewikkelde inputs krijgen we weliswaar technisch mooie kunstwerkjes als output, maar ontbreekt de inhoud. Laten we de AI nog een kans geven om zichzelf ook op dit vlak te bewijzen. Gevoelens en emoties maken ons mens: kunst moet inspireren en ontroeren, kunst moet prikkelen. Kan de AI dit ook?

(van links naar rechts, of van boven naar beneden op mobiel)

What is love?
The love of my life
The dark side of human beings
The joy of life

Opnieuw geldt: mooie kunstwerken (ik doe het niet na) met weinig inhoud. Toegegeven, je kunt bij ieder schilderijtje een oppervlakkig verhaal bedenken, maar een diepere betekenis kan ik niet spotten. Zo wordt de vraag over wat liefde is, niet beantwoord. Maar goed, ’traditionele’ kunst is soms ook onbegrijpelijk.

Discriminatie en de perfecte mens

Dan is het nu tijd om de clickbait-titel van dit bericht waar te maken. Ik vroeg Midjourney om een portret van een perfect mens. Hier was ik extreem benieuwd naar: hoe ziet een perfect mens eruit? Wat voor eigenschappen heeft een perfect mens? En bestaat een perfect mens eigenlijk wel?

Ethiek, here we come

(van links naar rechts, of van boven naar beneden op mobiel)

Hyperrealistic portret of a perfect human
Hyperrealistic portret of the most beautiful boy that ever existed
Hyperrealistic portret of the most beautiful girl that ever existed

Wat is het eerste dat je opvalt? Juist! Deze portretten zijn allemaal witte, westerse mensen. De AI discrimineert! Daar kan de AI overigens weinig aan doen. Ik vermoed dat het programma is getraind op veelal Europese en Amerikaanse gezichten, omdat de ontwikkelaars ook uit die gebieden komen. Dit verschijnsel heet training bias en zal zeker in de toekomst (niet noodzakelijk alleen in de AI-kunstwereld1) voor meer problemen zorgen.

Tot slot vroeg ik de AI om het gezicht van één meisje op te schalen. Dit is een functie die is ingebouwd in het programma. Ik was onder de indruk van het resultaat. Gezichten maken is moeilijk, zeker voor een computer. Toch slaagt Midjourney erin om een geloofwaardig eindresultaat op te leveren.

1Denk bijvoorbeeld aan algoritmes die in de toekomst bepalen of je recht hebt op een uitkering. Dan kunnen de gevolgen van training bias veel erger zijn.

Limitaties

Concluderend kunnen we stellen dat Midjourney, ondanks dat het mooie plaatjes produceert, enkele limitaties heeft. We zagen eerder al het gebrek aan inhoud en ook de training bias is op z’n minst zorgelijk te noemen. Ook ontbreekt een diepere betekenis in de geproduceerde schilderijen. Daarnaast kan Midjourney slecht omgaan met tikfouten. Zo gaf ik per ongeluk als input ‘A sad, lonely polar pear stuck on ice in the ocean’ in plaats van ‘A sad, lonely polar bear stuck on ice in the ocean’. De AI deed precies wat hem gevraagd werd, en ik kreeg een peer:

(van links naar rechts, of van boven naar beneden op mobiel)

A sad, lonely polar pear stuck on ice in the ocean
A sad, lonely polar bear stuck on ice in the ocean

Tot slot kun je met de gratis proefperiode dus slechts ongeveer 25 kunstwerken maken. Daarna moet je gaan betalen. Hier zit het verdienmodel van Midjourney.

Is dit het einde van de traditionele kunst?

Ik denk het niet. Momenteel is Midjourney niet in staat om een diepere betekenis in een schilderij te stoppen. Dit wordt vandaag de dag als essentieel in de kunstwereld gezien. Bovendien zijn er in de geschiedenis wel vaker van dit soort opschuddingen geweest: de fotografie maakte een einde aan de traditionele portretkunst. Schilderkunstenaars moesten opboksen tegen een apparaat dat het werk in een luttele minuut deed. Hierdoor werden kunstenaars van toen geforceerd in andere richtingen te denken. En zo werd bijvoorbeeld het expressionisme geboren. Het is nu alleen maar wachten met wat voor absurde kunstvorm de kunstwereld op deze AI zal reageren…

Mijn oordeel

Midjourney is een interessant project dat met behulp van AI kunstwerken kan genereren. De belofte van Midjourney is dat iedereen gratis en gemakkelijk 25 kunstwerken kan maken. Deze belofte komen ze ruimschoots na. Het gebruik van de Discordbot is relatief eenvoudig en binnen enkele minuten staat er een computergegenereerd schilderij op je beeldscherm. Ondanks dat ik tijdens dit artikel slechts een klein deel van de capaciteiten van de software2 heb laten zien, zijn de resultaten indrukwekkend. Simpele zinnetjes worden omgezet in kwalitatief mooie afbeeldingen. Over het algemeen is de geproduceerde kunst van zeer hoge kwaliteit. Midjourney heeft meer moeite met het uitdrukken van ingewikkelde, filosofische inputs. Zelden kent een schilderij een diepere laag of betekenis. 

De upscale van Hyperrealistic portret of a perfect human is vanuit een technisch oogpunt het beste uitgevoerd. Dit vind ik echter niet het mooiste schilderij. Voor mij wint de verdrietige peer op de ijsschots. Daar zit tenminste een verhaal achter.

“There are no mistakes, just happy accidents.”

2De AI kan nog veel meer: zo kent hij tal van schilderstijlen én kan hij ook afbeeldingen als input verwerken.

Verder leesvoer

(Toegevoegd op 6 september.) 
Een artikel in de Washington Post over een man die een kunstwedstrijd wint door een creatie van Midjourney in te zenden.

Een diepgaande analyse van de AI met behulp van cirkels.
De snelstartgids op de website van Midjourney.

Licentie

Volgens de algemene voorwaarden van Midjourney dienen niet-betalende gebruikers de kunstwerken te publiceren met een vermelding naar een ‘Naamsvermelding-NietCommercieel 4.0’ Creative Commons licentie. Echter, dankzij het citaatrecht, maak ik met dit artikel per definitie geen inbreuk op iemands auteursrecht (voor zover een computer ‘rechten’ kan hebben; interessante filosofische kwestie!) Omdat ik geen zin heb in juridisch geneuzel, hierbij alsnog de volledige licentie:

Creative Commons-Licentie

Alle kunstwerken in dit artikel zijn gegenereerd door de AI van Midjourney.

Disclosure

Stach Redeker is niet verwant met Midjourney of andere bedrijven die zijn besproken in dit artikel. Dit artikel bevat geen referrallinks.

Over de auteur

Stach Redeker

Stach Redeker

Stach Redeker is freelance WordPress-specialist. Hij bouwt sinds 2014 websites en webshops met WordPress. Daarnaast studeert hij Electrical Engineering aan de Universiteit Twente.

Scroll naar boven