Zal beeldgenererende software Dall-E 2 banen van fotografen afnemen?


DALL-E 2 is een nieuw kunstmatig intelligentiesysteem dat realistische beelden en kunst kan creëren op basis van een geschreven beschrijving. Geen ingewikkelde styling- en belichtingsopstellingen meer: je kunt nu gewoon een beschrijving geven van wat je wilt, en DALL-E-2 levert het beeld. Te mooi om waar te zijn? Te bedreigend voor de voor altijd-hitsende fotografie-industrie? Overtuig uzelf met mijn prerelease testrun.

DALL-E-2 zegt in zijn missie verklaring:

OpenAI’s missie is om ervoor te zorgen dat kunstmatige algemene intelligentie (AGI) – waarmee we zeer autonome systemen bedoelen die beter presteren dan mensen bij het meest economisch waardevolle werk – ten goede komt aan de hele mensheid.

Bekijk de dagprijs

Als je een fotograaf bent die het gevoel heeft dat de moderne technologie je vermogen om een onmisbare speler in de marketingindustrie te zijn voortdurend aantast, dan is deze uitspraak er zeker een om van ineen te krimpen. Ik kreeg pre-access tot het artificial general intelligence (AGI) platform, en ik nam het op de proef. Kan het echt doen wat wij kunnen doen? Kan het ons zelfs “overtreffen”? Is het een bedreiging voor de fotograaf? Is het een hulpbron? Of is het een combinatie van beide? Laten we eens kijken.

Er zijn een paar functies van de software. De eerste, en degene waar het het meest bekend om staat, is dat het een afbeelding of kunstwerk kan genereren op basis van een beschrijving. Op hun Instagram, bijvoorbeeld, vind je het resultaat van “een blauwe sinaasappel in tweeën gesneden op een blauwe vloer voor een blauwe muur”

Iedereen kan het ermee eens zijn dat het resultaat behoorlijk mind-blowing is. Ik heb zelf ook een poging gewaagd met een willekeurige beschrijving.

Het valt niet te ontkennen dat de technologie indrukwekkend is. Echter, mijn bedoeling bij het pre-testen was om uit te vinden of het een professionele fotograaf kon baan. Zou een klant, in plaats van ons in te huren, de beschrijving van wat hij wil kunnen intypen en de kosten van het inhuren van een vakman kunnen overslaan?

Test één: Zijn de gemaakte beelden vergelijkbaar met het werk van een professionele fotograaf?

Mijn eerste test was om te zien of DALL-E 2 visuele inhoud kon genereren die kon wedijveren met de beelden waar ik op dat moment aan werkte. Casestudie één: een chocolaatje gemaakt met cacao en dadels. Ik typte de beschrijving in van het beeld dat ik die ochtend had gemaakt: “Een dadel met chocoladesaus erover gegoten.”

Dit waren de resultaten:

Ik denk dat als je alleen een foto nodig hebt van dadels met chocolade, dat dit kan voldoen. Als je echter rekening houdt met belichting, compositie, kleurcorrectie, of esthetiek, dan voldoen deze foto’s niet aan mijn eisen.

Vervolgens besloot ik om een model in de test te gooien. Het merk had ooit een foto gemaakt waarbij een model chocolade op haar tong druppelde, en het was een zeer succesvolle foto. In die trant typte ik: “Een mooie vrouw met chocolade over haar hele lichaam gedruppeld.”

Mijn eerste observatie was dat de kunstmatige intelligentie blanke brunettes heeft gekozen als hun beeld van ultieme schoonheid, dus ik denk dat ik pech heb! Mijn tweede observatie was, net als in de vorige test, dat de esthetiek van de beelden een complete mislukking was. Het leek meer op een scène uit een Freddy-film dan op een reclame voor chocolade en lust. De software maakte indruk op me in de zin dat het op magische wijze beelden kon genereren uit een korte beschrijving, maar het werd al snel duidelijk dat het op geen enkele manier in staat was om een samenhangende set van esthetisch geslaagde beelden te creëren.

Test Twee: Kunnen de correctiefuncties een voordeel zijn voor de fotograaf?

Je hebt misschien de bijna ongeloofwaardige resultaten gezien van DALL-E 2 met het AI-gecorrigeerde wazige lieveheersbeestje, zoals te zien is in dit Tech Times artikel. Ik besloot ook een poging te wagen met deze functies. Mijn eerste poging was om een schaduw te verwijderen en die te vullen met een achtergrond met patroon. Ik denk dat ik meteen in het diepe ben gesprongen.

Nadat ik mijn afbeelding had geupload, selecteerde ik “Afbeelding bewerken” en typte in “Verwijder de schaduw van de huidverzorgingsfles en vul deze met de schaduw van het palmblad”. Ik was zonder twijfel onder de indruk van de beelden die het opleverde.

Het presteerde aanzienlijk beter dan Photoshop, dat het palmbladpatroon niet kon evenaren.

Voor de hoeveelheid kritiek die ik tot nu toe heb gegeven, moet ik echt mijn hoed afnemen voor de software op dit punt. Vervolgens probeerde ik een ander real-life scenario. Mijn salsa-klant vroeg me eens om de rode pepers in de afbeelding hieronder te vervangen door jalapeño-pepers. Onnodig te zeggen dat ik de foto opnieuw moest maken. Onder de indruk van DALLE-2’s laatste correctie, besloot ik te kijken of het de taak kon volbrengen.

“Verander de rode pepers in jalapeño pepers.”

(krekels)

“T, op mei!”?… en de pepers zijn nog steeds rood.

Een duidelijke mislukking voor deze opdracht.

Test Drie: Kan Dall-E-2 effectief elementen toevoegen aan het beeld van een fotograaf?

In mijn productfotografie doe ik vaak veel spetters en crashes. Mijn laatste test was om te zien of de software wat van dat werk voor mij zou kunnen doen. Geïnspireerd door de beelden die ik hieronder schoot, vroeg ik of het chips kon toevoegen aan een achtergrond.

Hier is het resultaat voor “Voeg tortilla chips toe aan de achtergrond.”

Ik heb de software ook gevraagd om meer waterkringen toe te voegen aan een opname.

Hieronder is het resultaat voor “Voeg een scheutje sap toe aan de achtergrond.”

De test hierboven genereerde geen gespat en enkele interessante alternatieven, zoals een wazige ananas die binnensluipt.

Conclusies

Na DALL-E-2 aan een groot aantal uitdagingen te hebben onderworpen, was het duidelijk dat de software nog niet aan zijn opdracht had voldaan om een professionele fotograaf “te overtreffen”. Hoewel de software een ongelooflijke prestatie levert, doet hij niet consequent wat er van hem wordt gevraagd. Als dat wel het geval is, is de esthetiek van het beeld niet op peil. Ik was wel verbaasd over het herstelwerk aan de palmschaduw, en ik vraag me af of het zichzelf zal positioneren als een geavanceerder programma dan Photoshop.

Wat zijn uw gedachten over deze nieuwe technologie die erop gericht is “de mens te overtreffen op een zo economisch mogelijke manier”? Deel uw gedachten hieronder.