De beste AI beeldgeneratoren in 2022


Of je ze nu leuk vindt of niet, Artificial Intelligence (AI) image generators zijn dit jaar geëxplodeerd in populariteit en de technologie vertoont geen tekenen van stoppen.

Begin 2022 waren er nauwelijks AI-tekst-naar-afbeelding generatoren beschikbaar voor het publiek, maar nu DALL-E eindelijk beschikbaar werd in bèta in juli en Stable Diffusion een maand later werd vrijgegeven, zijn er nu plots een hele reeks AI-afbeelding generatoren die strijden om de beste software op de markt te zijn.

Dus als u zich verward voelt over welke AI-beeldgenerator u in 2022 zou moeten gebruiken, is dit een volledige gids voor de beste opties die er zijn.

In een oogopslag

DALL-E 2

DALL-E 2, een product van het mede door Elon Musk opgerichte onderzoekslab OpenAI, waarnaar we zullen verwijzen als simpelweg DALL-E, is de software die de meeste mensen kunnen opnoemen als je hen vraagt naar AI tekst-naar-beeld generatoren.

Toen het in april werd gelanceerd, verbaasde DALL-E de sociale media met zijn vermogen om een korte beschrijving om te zetten in een fotorealistische afbeelding.

Voor de weinige mensen met bevoorrechte toegang tot de afgesloten tool was DALL-E zo uitzonderlijk dat het bijna als magie aanvoelde – of het nu ging om het genereren van foto’s van “een wasbeer-astronaut met de kosmos weerkaatsend op het glas van zijn helm” of “teddyberen die boodschappen doen in het Oude Egypte,” en dat alles op basis van een eenvoudige tekstopdracht.

Sindsdien heeft DALL-E een reputatie opgebouwd als de toonaangevende AI-tekst-naar-beeld generator die beschikbaar is. Het staat erom bekend de beste resultaten te produceren en een van de makkelijkst te gebruiken systemen te zijn.

Afbeelding van “Een man die een foto neemt met zijn digitale camera” gegenereerd door DALL-E 2

DALL-E is zeker niet de enige machine learning software die beelden kan genereren. Dus wat zit er achter de ongeëvenaarde reputatie van de AI-generator? En waarom wordt de technologie zo baanbrekend en ontwrichtend gevonden?

Allereerst is het feit dat de beelden die DALL-E creëert visueel aantrekkelijk zijn, een belangrijk onderdeel van zijn succes. Terwijl andere AI-beeldgeneratoren vaak kunstwerken produceren die een apocalyptische of duistere toon hebben, maakt Dall-E beelden die schokkend realistisch zijn en veel esthetischer voor ontwerpers die al een scherp artistiek gevoel hebben.

Beeld van “Gregory Crewdson, ’s avonds laat wasserette, mistig, neon” gegenereerd door DALL-E 2

Toen DALL-E op het toneel verscheen, betekende dat een enorme stap voorwaarts in de AI-beeldgeneratietechnologie. Vergeleken met zijn voorgangers was de software de eerste die gebruikers een buitengewone mate van controle gaf over de stijl, het onderwerp en de attributen van de digitale beelden die ze maakten, waarbij gebruikers zelfs de lens en het diafragma in hun AI-gegenereerde “foto’s” konden bepalen. De technologie leek eindeloze mogelijkheden te bieden op het gebied van beeldcreatie.

DALL-E blies gebruikers ook omver met zijn opmerkelijke vermogen om tekstinstructies beter te begrijpen dan alle andere software die eraan voorafging. Dit is te danken aan het feit dat DALL-E gebruik maakt van GPT-3 van OpenAI – waarschijnlijk het meest geavanceerde algoritme voor machinaal leren van natuurlijke taal – om op tekst gebaseerde instructies om te zetten in beelden.

Dus hoe kun je DALL-E gebruiken? Je kunt DALL-E niet alleen gebruiken om zinnen om te zetten in afbeeldingen, maar je kunt ook een afbeelding aan DALL-E vragen. Er zijn twee manieren om dit te doen: een variatie of een bewerking.

Een variatie vraagt DALL-E gewoon om een afbeelding, in plaats van geschreven tekst. Als antwoord op de gegeven afbeelding genereert DALL-E een reeks extra afbeeldingen, die de esthetiek en het onderwerp van het origineel weerspiegelen, maar elke afbeelding heeft zijn eigen draai.

Variaties op “Gregory Crewdson, ’s avonds laat wasserette, mistig, neon” gegenereerd door DALL-E 2

Bewerkingen zijn de derde manier om DALL-E te vragen en zijn misschien een van de meest revolutionaire functies van de software. Je kunt een foto geven en DALL-E vragen een “badende babyolifant” toe te voegen aan een foto met water, een onscherp lieveheersbeestje te verscherpen, een object in een foto te verwijderen of “het nacht te maken”. De AI-technologie begrijpt zelfs zaken als weerspiegelingen en zal deze bij het bewerken dienovereenkomstig bijwerken.

DALL-E genereert alleen vierkante outputs. Maar door de nieuwe bewerkingsfunctie “Outpainting” te gebruiken, kun je een beeld buiten zijn oorspronkelijke rand uitbreiden.

Met Outpainting kunnen gebruikers een afbeelding naar buiten toe uitbreiden tot een breder beeldkader, waardoor grotere afbeeldingen in elke beeldverhouding ontstaan. Door aanwijzingen in te voeren in DALL-E, zal de machine rekening houden met de bestaande visuele elementen van het beeld om de context van het originele beeld te behouden. Hij gebruikt schaduwen, reflecties en texturen om een AI-achtergrond te creëren die perfect in het originele beeld past.

Origineel: Meisje met de Parel van Johannes Vermeer
Bijschildering: August Kamp

Deze verbluffende mogelijkheden geven DALL-E het gevoel dat het in de toekomst een krachtige en belangrijke bewerkingstool voor fotografen kan worden.

Als je verkocht bent aan DALL-E en klaar bent om de software te gaan gebruiken, is er een addertje onder het gras.

OpenAI’s tweede generatie DALL-E 2 systeem is pas onlangs vrijgegeven voor het publiek en is nog steeds invite-only. DALL-E 2 is momenteel in beta, met een wachtlijst voor geïnteresseerden. In juli zei het bedrijf dat het zijn nieuwste versie geleidelijk zou aanbieden aan een miljoen mensen van die wachtlijst.

Afbeelding van “Een pizza etende hamster op een Hawaiiaans strand” gegenereerd door DALL-E

Elke DALL-E 2-account krijgt 50 gratis credits om op het systeem te gebruiken en elke maand nog eens 15 credits. Extra credits kosten $15 per 115 credits, en elke credit brengt je vier afbeeldingen voor een prompt of instructie terug.

OpenAI zegt expliciet dat gebruikers “volledige rechten krijgen om de afbeeldingen die ze met DALL-E maken te commercialiseren, inclusief het recht op herdrukken, verkopen en merchandise,” hoewel toegegeven dat dit nog een juridisch grijs gebied is. Het bedrijf heeft DALL-E 2 zo ontworpen dat het geen afbeeldingen van beroemdheden of publieke figuren genereert. Het systeem zal ook geen expliciete, bloederige of politieke inhoud genereren.

Hoe te beginnen: Om op de wachtlijst voor DALL-E 2 te komen, klik hier.

Stabiele Verspreiding

Hoewel je misschien lang moet wachten om toegang te krijgen tot DALL-E 2, is er een AI tekst-naar-beeld generator die top cijfers krijgt voor toegankelijkheid, en dat is Stable Diffusion.

Ontwikkeld door StabilityAI, in samenwerking met EleutherAI en LAION, is Stable Diffusion een uitstekende AI-afbeeldingengenerator voor degenen die nu willen beginnen met het maken van hun eigen digitale kunst.

Wat Stable Diffusion bijzonder maakt, is de transparantie van Stability AI met zijn software. Het bedrijf heeft de broncode van Stable Diffusion openlijk beschikbaar gesteld onder de Creative ML OpenRAIL-M licentie. Dit staat in schril contrast met concurrerende modellen als bijvoorbeeld DALL-E.

Afbeelding van “Een man die een foto maakt met zijn digitale camera” gegenereerd door Stable Diffusion

Omdat Stable Diffusion open source is, zijn gebruikers al begonnen met het verbeteren van en voortbouwen op de oorspronkelijke code. Er zijn tientallen repositories met verschillende mogelijkheden en optimalisaties. Een Reddit gebruiker heeft zelfs met succes een Photoshop plug-in gemaakt voor Stable Diffusion. Er is ook een plug-in beschikbaar voor Krita.

Het is deze gemeenschap en innovatie rond Stable Diffusion die de AI image generator zo opwindend maakt voor gebruikers, hoewel toegegeven, het kan moeilijk zijn om te navigeren tussen de verschillende repositories die online beschikbaar zijn.

Als je op zoek bent naar de originele Stable Diffusion, kun je de software op je computer draaien of je kunt toegang krijgen tot de beta-versie van de webinterface op Dream Studio. Wanneer gebruikers zich aanmelden op DreamStudio krijgen zij 200 credits om te gebruiken op Stable Diffusion, maar daarna kan men met £1 ($1.18) 100 generaties kopen. Met £100 (~$118) koop je 10.000 generaties.

Afbeelding van “Gregory Crewdson, ’s avonds laat wasserette, mistig, neon” gegenereerd door Stable Diffusion

De betaversie van Stable Diffusion kan fotorealistische 512×512 pixel beelden produceren. Net als met DALL-E kun je een tekst ingeven en het systeem genereert dan een afbeelding. Daarnaast kan het fotorealistische kunstwerken produceren met behulp van een geuploade afbeelding in combinatie met een geschreven beschrijving.

Om het Stable Diffusion-model te trainen, gebruikte Stability AI 4.000 Nvidia A100 GPU’s en een variant van de LAION-5B dataset. Stable Diffusion is dus in staat om supercreatieve afbeeldingen van beroemdheden, stripfiguren en publieke figuren te genereren die OpenAI met DALL-E 2 niet mogelijk maakt.

Beeld van “Brad Pitt in de jungle” gegenereerd door Stable Diffusion

De kwaliteit van de beelden geproduceerd in Stable Diffusion kan schijnbaar zeer indrukwekkend zijn. In een nu virale Reddit post, beweerde een gebruiker dat hij een tekst prompt gecombineerd met een schets had gebruikt om een hyperrealistische afbeelding van een futuristische metropool te genereren.

Stable Diffusion kan echter moeilijk onder de knie te krijgen zijn in vergelijking met DALL-E en de bètaversie is niet zo geavanceerd als zijn concurrenten. Het kan lastig zijn om de juiste balans in het beeld te krijgen en de tekst prompt juist te formuleren om het gewenste beeld te genereren – hoewel het bedrijf hier wel een handleiding voor geeft.

Afbeelding van “Een pizza etende hamster op een Hawaiiaans strand” gegenereerd door Stable Diffusion

Maar Stable Diffusion is nog steeds een opmerkelijk stukje technologie en de toegankelijkheid van de software is een keerpunt voor het genereren van AI-beelden.

Hoe te beginnen: Om Stable Diffusion in uw webbrowser te gebruiken, klik hier. Om Stable Diffusion op uw computer te downloaden, klik hier voor meer details.

Midjourney

Samen met DALL-E en Stable Diffusion is Midjourney ook een van de populairste en bekendste AI tekst-naar-beeld generatoren die er zijn.

Beschouwd als een van de meest tot de verbeelding sprekende platforms voor het genereren van AI-afbeeldingen, haalde Midjourney de krantenkoppen toen een van zijn gebruikers een wedstrijd voor beeldende kunst won met een afbeelding die hij met de software had gemaakt.

Afbeelding van “Een man die een foto neemt met een digitale camera” gegenereerd door Midjourney

Enigszins uniek, wordt Midjourney bediend door een Discord server en gebruikt Discord bot commando’s om afbeeldingen van hoge kwaliteit te genereren in een bijzonder artistieke stijl. Gebruikers kunnen een tekst ingeven om duidelijke en verbluffende beelden te maken die altijd een apocalyptische of griezelige kwaliteit lijken te hebben.

In tegenstelling tot DALL-E, zal Midjourney afbeeldingen genereren van beroemdheden en publieke figuren. Discord gebruikers gebruiken de software vaak om hun favoriete acteurs in bepaalde filmrollen.

Afbeelding van “Brad Pitt in een jungle” gegenereerd door Midjourney

Een mogelijk nadeel van Midjourney is dat de software extreem gestileerd is als een AI tekst-naar-beeld generator. Dit maakt het bijna onmogelijk om fotorealistische afbeeldingen te maken met Midjourney.

Het systeem is echter nooit ontworpen om realistisch ogende afbeeldingen te maken en dit is een belangrijk onderdeel van Midjourney’s filosofie als een AI generator.

“Wij hebben een standaardstijl en blik, en het is artistiek en mooi, en het is moeilijk te duwen [the model] weg van dat,” Midjourney oprichter David Holz vertelt The Verge. “Misschien als je 100 uur probeert, kun je een of andere juiste combinatie van woorden vinden waardoor het er echt realistisch uitziet, maar je moet echt hard werken om het op een foto te laten lijken.”

“We zijn erop gericht om alles er mooi en artistiek uit te laten zien,” voegt Holz toe.

Afbeelding van “Gregory Crewdson, ’s avonds laat wasserette, mistig, neon” gegenereerd door Midjourney

Als er een nadeel is aan Midjourney, dan is het dat je een Discord server moet gebruiken om een tekst prompt te plaatsen, wat in het begin lastig te begrijpen kan zijn. De interface van Discord kan ook frustrerend zijn om te gebruiken en je vindt vaak je eigen AI-kunst verloren tussen een myriade van andere door gebruikers gegenereerde vragen op een kanaal.

Maar volgens Holz was dit altijd opzettelijk omdat Midjourney bedoeld is als een “sociale ervaring.” En het kan zeker fascinerend zijn om de kunstwerken van andere gebruikers te zien terwijl je wacht tot jouw afbeelding op Midjourney is geladen.

Dus hoe gebruik je Midjourney? Het Midjourney platform opende voor iedereen als een beta in Juli. Zodra u zich bij de Midjourney Discord server hebt aangesloten, kan de AI generator op de webinterface van Discord of op de app van Discord worden gebruikt.

Om artwork te genereren op Midjourney, moet je vervolgens op een kanaal op Discord gaan, bijvoorbeeld #newbies-126.

Vanaf daar typ je het Bot commando “/imagine” in het Discord kanaal. Dit commando zal automatisch de “prompt:” tekst genereren. Dit is wanneer je beschrijft wat je wilt zien als een afbeelding.

Je moet je sleutelwoorden voor je afbeelding typen na de “prompt:” tekst of het commando zal niet werken. Daarna druk je op return en wacht je tot je kunstwerk is gemaakt.

U kunt dus bijvoorbeeld typen “Een pizza etende hamster op een Hawaiiaans strand” en na ongeveer een minuut zou uw afbeelding moeten worden gegenereerd tussen andere gebruikersverzoeken.

Afbeelding van “Een pizza etende hamster op een Hawaiiaans strand” gegenereerd door Midjourney

De drie regels van de Midjourney server bij het maken van kunstwerken zijn “wees geen eikel, gebruik de bot niet om ongepaste inhoud te maken, en wees respectvol naar iedereen.”

De eerste 25 afbeeldingen op Midjourney zijn gratis, en daarna is het basisplan $10 per maand voor 200 afbeeldingen. Er is ook een standaardlidmaatschap van $30 per maand voor onbeperkt gebruik. Midjourney zal bedrijfsgebruik van de gegenereerde beelden toestaan voor een speciaal bedrijfslidmaatschap van $600 per jaar. Anders, behoren de beelden tot u.

Als je het eenmaal onder de knie hebt, is Midjourney een uitstekende AI generator die consequent verbluffende en vaak tot nadenken stemmende afbeeldingen in zijn eigen unieke stijl produceert.

Hoe te beginnen: Om mee te doen met de beta versie van Midjourney, klik hier.

Craiyon (voorheen DALL-E mini)

Vroeger genoemd DALL-E mini, Craiyon is een andere AI beeldgenerator die online beschikbaar is.

Ondanks de vroegere naam DALL-E mini, heeft Craiyon niets te maken met Open AI, behalve dat het gebruik maakt van de grote hoeveelheid openbaar beschikbare informatie die OpenAI over hun model heeft verstrekt.

Afbeelding van “Een man die een foto maakt met een digitale camera” gegenereerd door Craiyon

In tegenstelling tot DALL-E is Craiyon volledig gratis te gebruiken en voor iedereen toegankelijk via zijn website. Het enige wat je hoeft te doen is een tekst ingeven en Craiyon zal ongeveer twee minuten nodig hebben om beelden te genereren van de interactieve webdemonstratie.

Een ander belangrijk verschil tussen DALL-E en Craiyon is dat de software helemaal niet gecensureerd is, wat betekent dat absoluut elke prompt door de AI-generator zal worden geaccepteerd. Je kunt ook vragen om de afbeelding in een bepaalde stijl te maken.

Afbeelding van “Gregory Crewdson, ’s avonds laat wasserette, mistig, neon” gegenereerd door Craiyon

Maar Craiyon, die werd gemaakt door software engineer, Boris Dayma, heeft wel moeite om DALL-E en andere concurrenten te evenaren in termen van beeldkwaliteit. De gezichten van beroemdheden en tekenfilms kunnen vaak onmerkbaar zijn in een gegenereerd kunstwerk.

Afbeelding van “Brad Pitt in een jungle” gegenereerd door Craiyon

Dit betekent echter niet dat Craiyon niet in staat is om gezichten te maken, het vereist gewoon veel werk en inspanning van de kant van de gebruiker. Sommige Craiyon gebruikers hebben naar verluidt ontdekt dat het schrijven van lange en gedetailleerde prompts, waarin de grootte en locatie van elk deel van het gezicht wordt genoemd, heeft geholpen om betere gezichten op hun kunstwerk te maken.

Afbeelding van “Een pizza etende hamster op een Hawaiiaans strand” gegenereerd door Craiyon

Het is ook alleen mogelijk om de afbeeldingen die u op Craiyon maakt te downloaden als een screenshot in plaats van een bestand met een hoge resolutie.

Hoewel het misschien niet het meest state-of-art systeem is, is Craiyon een ongefilterde en leuke AI-generator die voor iedereen gemakkelijk toegankelijk is.

Hoe te beginnen: Om Craiyon te gebruiken, klik hier.

TikTok

TikTok heeft een basis AI-afbeeldingengenerator gelanceerd die gebruikers kunnen gebruiken om aangepaste greenscreens voor hun video’s te maken.

Het nieuwe effect van het videoplatform heet “AI Greenscreen” en stelt TikTok-gebruikers in staat om een tekstprompt in te typen die de software vervolgens als afbeelding zal genereren.

Greenscreens gegenereerd door TikTok’s AI-tool

De basistekst-naar-beeld generator staat echter ver af van die van DALL-E 2 en Midjourney, omdat hij alleen maar wervelende, abstracte beelden lijkt te produceren.

Het trainen van een AI-afbeeldingenmaker vereist een grote hoeveelheid computerkracht, dus het basisuiterlijk van TikTok’s uitstapje is een duidelijke markering van de moeilijkheid van het creëren van een op maat gemaakte AI-afbeeldingsdienst.

TikTok’s tool benadrukt de explosie in populariteit die AI-afbeeldingsgeneratoren hebben gehad en zou de eerste inval van het bedrijf in deze ontluikende technologie kunnen zijn.

Hoe te beginnen: Om een AI Greenscreen op TikTok te maken, klik hier.