O kompaniji
23
Iskustva
13
Plate
Poslovi
INGSOFTWARE logo

INGSOFTWARE

4.5
29.03.2024.

GenAI alati u kreiranju arta - Friend or Foe?

Ana Branković, 2D Artist (Ingenios Studios/Ingsoftware)

Na slici: Naši Aca, Aleks i Uroš kao AI-generisani superheroji. Tela sa pozadinom su generisana u MidJourney-u, a lica su obrađena u Stable Diffusion-u pomoću inpaint-a i ekstenzije zvane Roop.

Prošle godine dodeljen mi je zadatak da istražim kakva se tehnologija kuvala proteklih godinu dana iza kulisa interneta i da procenim može li da nam bude korisna (ili pak štetna). Uspon Generativne AI tehnologije, tj. softvera koji generiše različite sadržaje (tekst, slike, video, audio, 3D modele, i sl.) na osnovu jednostavnih tekstualnih "upita" odnosno promptova nametnuo se ovde kao način za drastično povećanje produktivnosti i kreativnosti, tako da je pala odluka da se pozabavim baš ovom temom.

Plan je bio da saznamo što više o Gen AI sceni, da ocenimo nekoliko odabranih alata, razumemo za koje svrhe se mogu primenjivati, naučimo poneki novi workflow ili tehniku koji će nam omogućiti da ih najbolje iskoristimo, i na kraju odlučimo da li/kada/kako/za šta možemo da ih integrišemo u naš standardni set alatki i procesa. Na istraživanje sam se bacila početkom leta, krenuvši od nule sa pitanjima:

  1. Kako nastaje slika i kako izgleda workflow?
  2. Ko je lider na tržištu?
  3. Da li je moguće doći od skice do gotove slike za par minuta?
  4. Koliko to sve košta?
  5. Šta je sa autorskim pravima, kome se dodeljuju?

U ovom tekstu, od desetak alata koje sam istraživala, fokusiraću se na tri za koje sam zaključila da imaju najveći potencijal: Stable Diffusion (lokalno instaliran), Midjourney i Leonardo.ai. Svaki od njih ima svoje prednosti i mane i stoga sam odustala od toga da ih smestim na prvo, drugo ili treće mesto. Zato ću samo navesti šta mislim da je najvrednije kod njih. Stable Diffusion mi je bio favorit na početku istraživanja zbog velike preciznosti i kontrole nad generisanjem, a kako je open-source mnogo ga ljudi odjednom unapređuje i dodaje brdo ekstenzija. Takođe je besplatan i omogućava privatnost u stvaranju. Međutim istraživanje bez primene u praksi je nešto sasvim drugačije - mišljenja su se promenila kada sam počela da svakodnevno radim u ovim alatima. Midjourney i Leonardo.ai su mi postali novi favoriti jer su stilski rezultati koje oni kreiraju fantastični, pogotovo kada se koriste u segmentu pozadina i asseta, a odlični su i za brainstorming.

U nastavku teksta delim najvažnije zaključke vezano za gore pomenute Gen AI alate, uz obavezan disclaimer da sigurno ovde ima još štošta da se doda (a možda i oduzme), i da sam se fokusirala na ono čime se ja bavim, a to je - kreiranje 2D arta. Takođe je bitan i vremenski period kada sam radila analizu jer se stvari ovde menjaju neverovatno brzo i sigurno ima dosta novosti, kao što je npr. generisanje video sadržaja na osnovu promptova koje je omogućio Open AI sa svojim alatom Sora.

Prompt: (((photographic))), extremely high quality, high detail, RAW color photo, Portrait of a corgi riding a bike crossing the sea. Canon EOS R5 effect, warm tones, depth of field effect, bright and whimsical atmosphere

Stable Diffusion

Stable Diffusion je open-source generative AI software koji je napravio revoluciju u ovoj sferi i ogroman impact u svetu umetnosti. Na bazi njegovog algoritma su, sem Midjourney-a, nastali svi ostali programi za AI generisanje slika. Njegova moć se u punom sjaju vidi kada se koristi instaliran na lokalnom nivou (na našim računarima), ali postoji i online opcija sa UI-em. A evo i tutorijala za korišćenje i instalaciju.

Prednosti:

  • Kao open-source alat, potpuno je besplatan i oko njega se već stvorio ogroman community
  • Ima najveću kontrolu i privatnost nad generisanjem sadržaja zbog lokalne instalacije na računaru
  • Stilsko usmeravanje u Stable Diffusion-u se radi na nekoliko načina (pomoću tekstualnog prompta, pomoću slike reference, kao i pomoću sopstvenih modela Check Point i Lora)
  • Style prompt saving, trening modela, preciznost, editovanje, Inpaint, Outpaint, Upscaling, detaljne informacije o slici
  • Raznorazne ekstenzije
  • Lepota generisanog sadržaja

Mane:

  • Pomalo komplikovan proces instalacije
  • Potrebno je izdvojiti više vremena nego za druge programe kako bi naučili da ga optimalno koristimo
  • Sporije generisanje slika
  • Pucanje programa ako nam je računar slabiji i ponovno pokretanje SD-a
  • Može da se desi problem kada generišemo slike u većoj rezoluciji

Zaključak: Sve u svemu, mnogo više prednosti nego mana. Ako se posveti vreme učenju SD-a i ako se njime ovlada, može biti izuzetno koristan alat za rad. Naravno, ako nemamo za to vremena i želimo da brzo dođemo do rezultata onda predlažem druga dva programa. Od mene Stable Diffusion ima odličnu ocenu i definitivno ću nastaviti da ga koristim u projektima na kojima radim.

Od skice do ilustracije pomocu Stable Diffusion AI + ControlNet ekstenzije

Midjourney

Midjourney je softver za generisanje slika koji, za razliku od svih drugih, korišćenje bazira na Discordu, aplikaciji za dopisivanje i video pozive. Jedinstven je i po tome što koristi sopstveni algoritam, dok ostali generisanje vrše preko Stable Diffusion-a, a UI mu je odvojen i na posebnoj je web adresi. Po mom mišljenju (i mišljenju velikog broja korisnika), trenutno daje najkreativnije i estetski najprivlačnije slike, ali je s druge strane potrebno odvojiti malo vremena za usvajanje komandi koje su neophodne za njegovo pravilno korišćenje. Razlikuje se i po tome što nema user interface već se komande upisuju u Discord chat preko određene formule koju neću ovom prilikom objašnjavati da ne komplikujem mnogo (ali evo tutorijala kratkog i dugog). Naziru se uzbudljive promene na horizontu: najavljen je dolazak dugo očekivanog web sajta, a kada taj dan dođe i problem korišćenja ovog programa preko Discord-a nestane, nije naivno očekivati da će Midjourney postati lider na tržištu.

Prednosti:

  • Lepota i kreativnost slika, preciznost kontrole preko prompta, upscale, describe, blend, remix…
  • Inpaint i outpaint je od skoro dosao i u MJ, sa sjajnim rezultatima
  • Koristan je u segmentu pozadina i asseta, a kao i Stable Diffusion, odličan je i za brainstorming

Mane:

  • Ograničen broj generisanih slika po nalogu (ovo naravno važi za besplatnu verziju alata)
  • Sve što ovde stvorimo objavljuje se kao javno i meša se sa slikama drugih korisnika (ukoliko se ne pretplatimo na njihov paket)
  • Nema opciju treninga modela, ima manje opcija za editovanje, nema exporta bez pozadine

Zaključak: Proteklih meseci sam ga jako često koristila u kombinaciji sa promptovima koje kreira ChatGPT. Tada sam imala priliku da shvatim koliko je program koristan. Za jako malo vremena sam generisala stotine slika i mogla dovoljno da ih menjam, dolazeći do onoga što je posle ušlo u produkciju. Čak su usred mog rada izbacili verziju 6 gde je pisanje promptova poboljšano i postalo još lakše. Sa tim i sa jos mnogim novim stvarima u MJ-u bilo je zadovoljstvo raditi, a sigurna sam da će biti i ubuduće kako se dalje bude razvijao.

Prikaz oficijalnog Midjourney servera u Discord aplikaciji

Leonardo.ai

Leonardo je website koji je baziran na osnovi Stable Diffusion-a i njegovih modela, čiji je UI lep i lak za korišćenje. Ovaj alat ima funkcionalnosti koje podsećaju na Layer i Scenario (takođe predmeti ovog istraživanja sa visokim pozicijama na top listi), ali je definitivno malo kompleksniji i nudi više opcija za rad. Rezultati koje daje su često estetski predivni. Iz ovih razloga mogu da ga opišem kao kombinaciju navedenih alata, jer nudi editovanje, primenu stilova i treniranje modela kao Stable Diffusion, a estetika može da se poredi sa Midjourny-evom. Doduše, moram spomenuti da su mu rezultati ponekad hit-or-miss. Ima dnevni limit za generisanje od 150 kredita, a svaka slika košta minimum 7 kredita. Njega preporučujem za početnike jer se uz pomoć UI-a stvorenog za lako korišćenje i u par pokušaja može doći do lepih rezultata, ali je za pravu primenu (privatni generisani sadržaj i pristup Canvas Editor-u) potrebna pretplata na neki od paketa. U ovom alatu je od nedavno moguce praviti i Motion slike (na generisanu sliku možemo primeniti motion, odnosno mini animaciju)! Ono što je kod njega najinteresantnije jeste što je on zapravo društvena mreža na kojoj se share-uje tona user-generated contenta, koji možemo da koristimo kako za inspiraciju, tako i za remixing, tj. reuse-ovanje svačega - modela, promptova, ideja itd. Evo i tutorijala za korišćenje.

Prednosti:

  • Lepota i kreativnost generisanih slika
  • Jednostavnost korišćenja
  • Trening modela, Prompt Magic i Alchemy, Texture Generation, Upscale, export bez pozadine
  • Canvas Editor: Inpaint, Outpaint, Maskiranje, Sketching…
  • Motion slike

Mane:

  • Nekad ga je teže ukrotiti i daje čudne rezultate
  • Limit na broj generisanih slika (privatnost modela i generisanih slika dostupni su samo ako se plati)

Zaključak: Ono što rekoh za Midjourney, isto važi i za Leonardo. Radeći mesecima u ovom programu imala sam priliku da vidim šta sve može da se uradi i jako sam pozitivno iznenađena time. Novosti su česte na ovom web sajtu i dosta se ulaže u njega, uzbudljivo je biti deo toga i pratiti napredak. Ovo je moj apsolutni favorit za art projekte.

Izgled Home page-a za Leonardo.ai sa svojim lepim UI-em i pregledom najpopularnijih slika koje su generisali korisnici

Zaključak: Nećemo (još) ostati bez posla

Kada je glas o novoj AI tehnologiji krenuo da se širi, veliki broj kreativaca je počeo da paniči. Na prvu je delovalo kao da AI stvara besprekorne rezultate i da niko normalan više neće plaćati ljude da oslikavaju danima i nedeljama, kada program to radi za manje od minut! Srećom, nije to baš tako, barem za sada. Rezultati nisu uvek dobri, a laik sa ovim alatom opet ne bi znao kako da primeni sadržaj koji kreira i da vidi greške u anatomiji i ostalim pravilima u umetnosti. Kao i većina alata, Generative AI je koristan u rukama nekoga ko zna kako se s njim radi. Zavisno u kakve se svrhe koristi može biti i dobra i loša stvar. AI može da zameni početnike ili ljude koji se još ne snalaze, ali profesionalci koji imaju izgrađen stil, ideju i veštinu ne mogu biti zamenjeni. Naprotiv, njima AI pomaže u ubrzavanju radnog procesa. Ako bih se izražavala kroz metaforu rekla bih “Umesto da idemo peške vozićemo bajs, ali bajs bez čoveka neće sam da ide.” Nismo ovoga puta ulazili u loše aspekte AI alata koji leže u tome da neko može da imitira stil određenih umetnika bez njihove dozvole, jer to je ipak nešto što treba da se reši zakonom.

Dakle, AI nije još dostigao nivo savršenog generisanja gde se prompt potpuno poklapa sa rezultatima i gde iz prve dobijamo ono što smo zamislili, ima tu dosta natezanja i nadmudrivanja, potrebno je nešto doslikati ručno i sasvim sigurno su nam poslovi bezbedni bar još neko vreme 🙂 Ali korist koju imamo ako ga prihvatimo je zaista ogromna. S tim da se ova tehnologija razvija velikom brzinom možda će sve ovde navedeno biti odbačeno i brže nego što mislimo. Moj zaključak je da je (u mom poslu) trenutno najoptimalnije koristiti Stable Diffusion, Midjourney i Leonardo zajedno (u kombinaciji sa promptovima koje kreira ChatGPT). Za ulazak u svet AI generisanih slika predlažem Midjourney za brainstorming i fensi opšte generisane stvari i Leonardo da tu i tamo uskoči umesto MJ-a ako želimo besplatno da isprobavamo generisanje. Kombinovanjem ovih softvera trebalo bi da dobijemo šta nam treba, ali naravno uz neko osnovno znanje i iskustvo u dizajnu i  umetnosti.

Prompt: extremely high quality, high detail, three different cute robots standing next to each other, making cool poses. The background shows an intricate maze of cables in a modern lab. Cool tones of turquoise, depth of field effect, bright and whimsical atmosphere --ar 16:9 --v 6.0

Galerija