In dit artikel aandacht voor de AI afbeelding generator waarmee je foto’s kunt genereren met een tekst prompt. Hieronder volgt een review van de text to image generator ClipDrop die een super coole uncrop functie heeft voor het uitbreiden van je foto.
Foto’s bewerken met AI
Wie de afgelopen tijd een beetje heeft opgelet heeft gemerkt dat de wereld om ons heen snel verandert door de snelle opkomst van AI. Dit geldt ook voor het bewerken van foto’s en het automatisch genereren van foto’s. De zogenaamde AI image generator sites rijzen de pan uit en met de text to image functie zijn ze eenvoudig te bedienen door iedereen die kan lezen en schrijven. We doen verderop in dit artikel een review van clipdrop, waar je o.a. dit soort foto’s kan genereren, maar voor de liefhebber eerst een stukje uitleg over de onderliggende techniek. Als je dat niet interessant vindt, scroll dan naar beneden tot de tekst “Wat is Clipdrop” of de tekst “Text to image generator“.
Wat is een AI image generator?
Een AI image generator is een geavanceerd stuk software dat gebruik maakt van kunstmatige intelligentie om beelden te creëren. Deze systemen zijn getraind op grote datasets met miljoenen afbeeldingen, waardoor ze in staat zijn om nieuwe, unieke afbeeldingen te maken die nog nooit eerder zijn vertoond en dus feitelijk niet echt zijn. Ze kunnen worden gebruikt om allerlei soorten beelden te genereren, van portretten van mensen en landschappen tot abstracte kunstwerken.
Het creëren van afbeeldingen met AI maakt meestal gebruik van een machine learning model genaamd een Generative Adversarial Network (GAN). GAN’s bestaan uit twee delen: een generator en een discriminator. De generator maakt nieuwe afbeeldingen, terwijl de discriminator het verschil bepaalt tussen de afbeeldingen die door de generator worden geproduceerd en echte afbeeldingen uit de trainingsdataset. De twee netwerken worden samen getraind in een soort spel: de generator probeert de discriminator te “bedriegen” door steeds betere afbeeldingen te produceren, terwijl de discriminator probeert beter te worden in het herkennen van vervalsingen.
Dit proces leidt uiteindelijk tot software die zeer realistische afbeeldingen kan produceren. Deze beelden kunnen worden gecontroleerd door bepaalde parameters te veranderen, waardoor gebruikers het uiteindelijke beeld kunnen beïnvloeden.
Wat is text to image
“Text to image” is een techniek waarbij een kunstmatige intelligentie (AI) systeem wordt gebruikt om afbeeldingen te genereren op basis van geschreven tekst. Dit wordt vaak ook een prompt genoemd. Een prompt is in dit geval een beschrijving van wat jij op de foto wil hebben.
Dit proces gebruikt meestal een vorm van machine learning, dit is de eerder besproken Generative Adversarial Network (GAN), dat dus uit twee delen bestaat: een generator en een discriminator.
In een “text to image” context zou de generator beginnen met een willekeurige afbeelding en deze geleidelijk aanpassen om te proberen een afbeelding te creëren die overeenkomt met de tekstbeschrijving. De discriminator zou dan proberen om het verschil te bepalen tussen de door de generator geproduceerde afbeeldingen en echte afbeeldingen die overeenkomen met de tekstbeschrijving. Door dit proces meerdere keren te herhalen, kan de generator uiteindelijk leren om redelijk overtuigende afbeeldingen te maken die overeenkomen met de gegeven tekstbeschrijving.
Laten we een paar voorbeelden nemen om het proces beter te begrijpen:
Stel dat we een systeem hebben dat getraind is om dieren te genereren en we geven het de tekst “Een hond met bruin haar en blauwe ogen”. De generator begint met een willekeurige afbeelding en past deze geleidelijk aan om te proberen een hond met bruin haar en blauwe ogen te creëren. De discriminator vergelijkt deze afbeelding met echte afbeeldingen van honden met bruin haar en blauwe ogen en geeft feedback aan de generator over hoe goed het de taak uitvoert. Na vele herhalingen kan de generator een overtuigende afbeelding van een hond met bruin haar en blauwe ogen produceren.
Of stel dat we het systeem de tekst “Een zonsondergang boven de oceaan” geven. De generator zou dan beginnen met het creëren van een afbeelding die deze beschrijving zo goed mogelijk benadert en de discriminator zou weer helpen bij het verfijnen van deze afbeelding door de gegenereerde afbeelding te vergelijken met echte afbeeldingen van zonsondergangen boven de oceaan.
Het klinkt allemaal prachtig maar in de praktijk werkt het zeker nog niet feilloos. Wie vaak met AI image generator apps werkt weet dat honden met zes poten en twee koppen en mensen met misvormde handen aan de orde van de dag zijn. Toch worden er ook vaak wel hele mooie foto’s gemaakt. Je moet alleen soms wel wat geduld hebben. Onthoud ook dat de systemen nu in feite nog in de kinderschoenen staan en met de dag beter worden.
Wat is Clipdrop.co
ClipDrop is een online AI fotobewerkingsplatform dat een breed scala aan oplossingen heeft voor het genereren, bewerken en verbeteren van foto’s. Het bedrijf is 2020 opgericht en met een gebruikersbestand van 15 miljoen mensen en meer dan 100 miljoen verwerkte afbeeldingen is ClipDrop een grote speler in de wereld van fotobewerking en fotogeneratie.
ClipDrop is een ecosysteem van apps en plugins voornamelijk aangedreven door AI. Het stelt gebruikers in staat om afbeeldingen op te schonen, de achtergrond te verwijderen, belichting aan te passen, afbeeldingen te vergroten, afbeeldingen te genereren op basis van tekst, afbeeldingen uit te breiden, de achtergrond te vervangen en tekst uit afbeeldingen te verwijderen met hoge nauwkeurigheid.
De tool maakt gebruik van geavanceerde AI en netwerkcommunicatie om een unieke, continue workflow te bieden die naadloos werkt op populaire tools en apparaten zoals Photoshop, Figma, iOS en Android. Dit betekent dat ClipDrop naadloos kan worden geïntegreerd in een bestaande workflow.
Het is perfect voor fotografen, ontwerpers en digitale kunstenaars die tijd willen besparen en hun werk willen verbeteren maar ook voor hobbyisten of mensen zonder enige ervaring met fotobewerking om er lekker mee te spelen.
In maart 2023 heeft Stability AI, ’s werelds meest toonaangevende open source generatieve AI-bedrijf, ClipDrop overgenomen en sinds die tijd zijn vele verbeteringen doorgevoerd en nieuwe AI tools ingebouwd, zoals de uncrop functie.
(AI) Tools en gereedschap
ClipDrop biedt een breed scala aan (AI) tools om visuele content te optimaliseren en verbeteren, we noemen de volgende:
- Stable Diffusion XL: Genereert high-resolution realistische afbeeldingen met AI.
- Uncrop: Vergroot je foto’s naar elk beeldformaat en breidt je foto uit.
- Reimagine XL: Creëert meerdere varianten van een afbeelding met Stable Diffusion.
- Cleanup: Verwijdert objecten, mensen, tekst en defecten uit je foto’s automatisch.
- Remove Backgrounds: Haalt de achtergrond uit een foto
- Relight: Belicht je afbeeldingen opnieuw met prachtige lichten.
- Upscale: Vergroot je afbeeldingen 2 of 4x en kan ruis verwijderen en details herstellen.
- Replace Background: Verander de gehele achtergrond met AI.
- Text Remover: Verwijder tekst uit je afbeelding
Het gaat te ver om alle functies van Clipdrop in dit artikel te bespreken en we zullen ons nu beperken tot de twee meest spraakmakende: de text to image functionaliteit en de minder bekende uncrop functie.
Text to image generator
Zelf een “text to image generator” gebruiken is kinderlijk eenvoudig. Het enige wat je hoeft te doen is in te typen wat je op de foto wilt zien en eventueel een style te kiezen, dat laatste is optioneel.
In ons geval hebben we gevraagd om “an astronaut wearing a sombrero riding his bike in the desert”.
We hebben de prompt ingegeven in het Engels. Dit is niet strikt noodzakelijk. In het Nederlands werkt het ook, maar omdat we de indruk hebben dat Engels soms toch net even wat beter begrepen wordt, typen wij het liefst in de Engelse taal.
Verder hebben wij gekozen for a Photograhic style, maar dat is ook niet nodig om een mooie afbeelding te laten genereren.
The Stable Diffusion op Clipdrop levert vervolgens 4 foto’s. In ons voorbeeld is de AI in twee gevallen de sombrero vergeten, maar dat nemen we maar op de koop toe. We hadden ervoor kunnen kiezen om alle images opnieuw te laten genereren, maar we vonden de derde foto wel aardig en hebben die dan ook gedownload in HD kwaliteit met een resolutie van 2048 x 2048.
En zo simpel werkt een AI Text to image generator. Typ in wat je kan bedenken en kijk vervolgens wat de output is. Een kind kan de was doen en de enige beperking is je eigen fantasie.
Wat is Uncrop?
De wereld van beeldbewerking is de laatste tijd snel getransformeerd met de komst van kunstmatige intelligentie (AI). Een voorbeeld van een tool die de grenzen verlegt is de ‘Uncrop’-functie van ClipDrop
De ‘Uncrop’-tool is een speciale functie die je in staat stelt om de beeldverhouding van jouw afbeeldingen te veranderen zonder enig deel van de foto te verliezen. Het kan het lichaam of de achtergronden in foto’s genereren en uitbreiden, waardoor aan de afbeelding nieuwe inhoud wordt toegevoegd waar dat gewenst is.
Kortom je kan een bestaande foto, links, rechts onder en boven uitbreiden met gegenereerde beelden, waarbij rekening wordt gehouden met de bestaande content in de foto en waarbij het ook de bedoeling is om dit naadloos te laten aansluiten op de originele foto.
Hoe werkt uncrop?
Net als foto generering is ook dit proces betrekkelijk eenvoudig. Je uploadt een foto, selecteert de gewenste beeldverhouding en de Uncrop-tool genereert een afbeelding die overeenkomt met de nieuwe verhouding. Heb jij bijvoorbeeld een foto van een bos gemaakt, dan kan je het bos aan alle kanten uitbreiden. Of heb jij een foto van jezelf op het strand, dan kan je met uncrop het strand “verlengen”.
Uncrop is bij andere fotobewerkings-programma’s ook bekend onder de namen generative fill, zoom out of outpainting. Alle benamingen komen in de praktijk op hetzelfde neer, je breidt een bestaande foto uit met nieuwe content die aansluit bij de bestaande foto.
Twee uncrop voorbeelden van Clipdrop in de praktijk
Hieronder tonen we twee voorbeelden van de uncrop functie van Clipdrop. We pakken voor het gemak even de astronaut die we zojuist hiervoor in het voorbeeld van de Text To Image Generator hebben gecreëerd en vragen om deze foto uit te breiden in een landscape foto, wat in dit geval inhoudt dat de AI aan de linkerkant en rechterkant een stuk gaat toevoegen.
Er komen dan vervolgens vier resultaten terug en wij hebben gekozen voor onderstaande foto, die wij goed gelukt vinden. Het enige opvallende hieraan zijn wat rare letters die linksonder verschijnen, maar die kunnen eenvoudig worden verwijderd, bijvoorbeeld met Text-remover tool die Clipdrop zelf aanbiedt op de site. Behalve de rare tekst vinden we de uncrop redelijk goed geslaagd en is de foto aan zowel de linkerkant als rechterkant netjes uitgebreid/ verlengd op een manier die bij de originele foto past.
Voor onze twee tests hebben we onderstaande foto als input genomen. Deze is afkomstig van de Adobe stock images waar wij een abonnement hebben.
Het is op zich een mooie foto en we waren heel benieuwd hoe de AI de foto zou opvullen als we deze in potrait zouden maken, waarbij de rest van de auto zichtbaar zou worden en niet te vergeten hoe de rest van de vrouw in de foto eruit zou komen te zien.
Helaas bleek deze opgave een stuk moeilijker voor Clipdrop. We hebben de AI een stuk of 28 foto’s laten genereren en onderstaande foto was daarvan de beste en dat is wat ons betreft zeker nog niet goed genoeg.
De auto, de weg en de bomen zijn goed ingevuld maar de dame is een soort van rare creatie geworden, met veel te lange en te smalle benen of eigenlijk als je goed kijkt is het anderhalf been. De rest van de gegeneerde foto’s waren nog erger. Je kan drie voorbeelden daarvan zien in de thumbnails van bovenstaande foto, waarbij in de eerste twee foto’s een hoofd op een hoofd is geplaatst en er echt niet uitziet.
Conclusie Clipdrop Review
Het werken met de gratis AI image generator van Clipdrop en de uncrop foto uitbreidings-functie werkt in veel gevallen verbluffend goed, maar in sommige gevallen valt het nog erg tegen. Het werkt in onze optiek al redelijk vaak goed voor landschappen en voorwerpen, maar bij mensen en dieren is er zeker nog veel ruimte voor verbetering.
Zoals eerder opgemerkt is dit nog maar het begin van de AI revolutie in fotobewerking en fotogeneratie en we zijn ervan overtuigd dat binnen 1 tot 2 jaar veel betere output zal worden gegenereerd. Tot die tijd is het wat geduld hebben en wat vaker proberen, en het is sowieso heel leuk om dit soort AI tools te gebruiken, vooral als het gratis is
Clipdrop kan gratis worden gebruikt, maar als je een heavy user bent kan je ook een betaald abonnement nemen voor 7 of 9 euro per maand, afhankelijk of je voor een maand of jaar abonnement kiest. Hiervoor krijg je o.a. extra snelheid, geen wachtrijen meer en je kan op het moment van schrijven van deze review ongelimiteerd bezig zijn en de afbeeldingen/ foto’s genereren zonder watermerk.
Bezoek clipdrop.co