Midjourney je predstavio novu, „obrnutu AI-naredbu“: generator slika u tekstu

Sredina putovanja je upravo objavio novu naredbu „/opisati” koji korisnicima omogućuje korištenje ove moćne platforme umjetne inteligencije za preokret prethodne funkcije stvaranja slike iz tekstualnog opisa: s “/opisati“ Midjourney će izraditi tekstualni opis slike koju mu korisnik učita.

Povucite i ispustite slike vašeg teksta

Prve reakcije onih koji su ispitivali ovu inovaciju većinom su vrlo pozitivne, ali se u komentarima ističe kako /opisati ima velik potencijal praktične primjenjivosti. Jedan od najistaknutijih aspekata naredbe /opisati jest mogućnost upotrebe u postupcima koji olakšavaju korištenje interneta osobama s oštećenim vidom, kojima navigacija webom može biti vrlo zahtjevna. Kod slabovidnih i slijepih osoba problem čitanja teksta riješen je sintetizatorima govora (tekst u govor), a slike su predstavljene u tzv. alt-text, riječi koje opisuju “ono što se vidi na slici”. I ne samo za slabe, jer su svi algoritmi pretraživanja puno bolji i učinkovitije indeksiraju i pretražuju slike koje imaju detaljnije, bolje i opširnije opise. Međutim, takvi deskriptivni, alt-tekstualni elementi kreiraju se i dodaju slikama “ručno” prilikom dizajniranja web sadržaja, što oduzima puno vremena i podložno je subjektivnom doživljaju osobe koja opisuje sliku.

U svojoj trenutnoj iteraciji provedbe naredbi /opisatiMidjourney će, baš kao iu slučaju generatora teksta u slici, stvoriti četiri različita tekstualna opisa učitane slike, a moguće je i generirati nove varijacije na temelju opisa odabranog između te četiri ponude.

Postupak je zaista simplificiran: u promptu (naredbenom retku) Midjourneya samo napišete “/opisati” i pojavit će se polje za učitavanje slika koju potom možete u Midjourney ubaciti uploadanjem iz svoje arhive ili još jednostavnije – „drag and drop“. Nakon što umjetna inteligencija odradi svoj dio „čitanja“ slika sadržaja, ponudit će vam četiri generirana opisa, od kojih možete odabrati jedan i iskoristiti ga kao ulaznu naredbu kojom ćete napraviti „remiks“ (točnije, četiri nove verzije) izvorno učitane slike. Štoviše, prethodno možete urediti, dopuniti ili izmijeniti tekst kojeg vam je /describe ponudio, što vašem kreativnom procesu daje novi element kontrole.

Dakle, nova opcija generiranja slika u tekstu daje Midjourneyju mogućnost stvaranja vrlo zanimljivih „kružnih petlji“ s klasičnim Midjourneyovim AI-sustavom, onim koji pretvara tekst u sliku.

Za one kojima sve treba nacrtati

Ako vam ovaj opis funkcije /opisati nije dovoljno slikovit i jasan (što je lako moguće, jer autor ovog teksta kronično pati od potrebe za nepotrebnim komplikacijama), najbolje će biti da vam sve to slikovito prikažemo, uz nekoliko primjera.

Za testiranje nove funkcije korištena je ova fotografija koju je snimio Jaron Schneider Korištenje Tamron 35mm f/1.8 prime.

Nakon upisa naredbe /opisatifotografija je “drag-and-dropana” u predviđenom okviru kojeg je Midjourney ponudio, a potom u roku od par desetak sekundi sintetizirao četiri tekstualna opisa onoga što je njegova umjetna inteligencija vidjela na fotografiji:

  • mlada žena u haljini na točkicama stoji na vrhu brda, u stilu zamišljenog portretiranja, bljeskovi objektiv, voigtlander heliar 15mm f/4.5, trubadurski stil, krupni plan, calarts, jednostavno
  • mlada žena u crno-bijeloj haljini na točkicama stoji, u stilu maglovitih krajolika, zamišljen portret, boje natopljene suncem, iskreni portret, tumblewave, trubadurski stil, krupni plan
  • mlada žena u crno-bijeloj kariranoj haljini koja stoji na padini brda, u stilu anamorfnog odbljeska leće, točkice, kalifornijski plein, zamišljena tišina, boje natopljenog sunca, iskreni portreti, delikatan
  • leigh wyatt | vjenčanja u san franciscu|kćeri služavkeflake benson | san francisco, u stilu neo-pop senzibiliteta, nježne liričnosti

Prva dva opisa se čine dosta dobrima, pogotovo onaj drugi, kojeg su u ovom testu iskoristili kako bi na temelju njega generirali četiri „remiksa“, s prilično impresivnim rezultatima. Pogledajmo što je Midjourney generirao na temelju prompta „mlada žena u crno-bijeloj haljini na točkicama stoji, u stilu maglovitih krajolika, zamišljen portret, boje natopljene suncem, iskreni portret, tumblewave, trubadurski stil, krupni plan“

Pejzažne iteracije

Drugi primjer je ponovo stvaran život fotografija, ovoga puta pejzaž s američkog jezera Mono (autor je također Jaron Schneider).

Midjourney je nakon naredbe /describe i uploada slike generirao četiri većinom vrlo precizna tekstualna opisa.

  • mono jezero, las vegas, Utah, Sjedinjene Američke Države blizu kristala, u stilu snimanja na 70mm, mikalojus konstantinas ciurlionis, naknadna obrada, 32k uhd, antoni gaudí, magloviti krajolici, fenghua zhong
  • jednobojno jezero pri zalasku sunca nakon kiše, u stilu slaganja fokusa, svijetlo nebesko plava i brončana, 32k uhd, fotografija National Geographic, stock fotografija, dansaekhwa
  • mono jezero, Utah, u stilu 32k uhd, uravnotežena simetrija, američki tonalist, maglovito, kvaliteta iz snova, nikon d850, fenghua zhong
  • mono jezero, Kalifornija, fotografija izlaska sunca 1, u stilu 32k uhd, izolirani krajolici, mala dubina polja

Koristeći treći opis (mono jezero, Utah, u stilu 32k uhd, uravnotežena simetrija, američki tonalist, maglovito, kvaliteta iz snova, nikon d850, fenghua zhong) kao prompt za remiks, Midjourney je izradio četiri vrlo realistične nove slike:

Mozak u krošnji, krošnja u mozgu

I naposlijetku, igrama naizgled nema kraja! Recimo, napišite opis slike kakvu želite da vam Midjourney generira, primjerice „ilustracija mozga s korijenjem drveća, psihodelična umjetnost, živopisna, autor Alex Grey, autor Amanda Sage, autor Robert Venosa, neonske boje“ i potom od četiri ponuđene odaberite onu koja vam se najviše dopada, npr. ovu:

U idućem koraku naredite Midjourneyu da tekstualno opišete sliku koju je maloprije generirao na temelju vašeg zadanog teksta. Od četiri ponuđena opisa koje Midjourney izradi nakon naredbe /opisatiodaberite jedan za koji vam se čini da najbolje opisuje vašu prvu ideju stvaranja psihodeličnih slika drveta čija krošnja nalikuje ljudskom mozgu – u ovom slučaju to je Midjourneyjev tekst

  • slika apstraktnog moždanog stabla s korijenjem, u stilu Marka Hensona, blistave boje, tamna simbolika, detaljna anatomija, podebljane linije, žive boje, ilustracije psiholoških fenomena, kjaroskuro drvorezi

i onda taj stvarno detaljan opis koji bi malo tko od nas laika znao formulirati, vratite u proces: “ubacite” ga kao prompt za stvaranje četiri nove iteracije vaše slike. Rezultat je – barem za mene – još bolji i privlačniji:

Midjourneyev /opisati alat je intrigantan, čak iu svom ranom stadionu. Alat bi trebao pomoći kreatorima da naprave detaljniji Alt-tekst, opise, pa čak i različite umjetničke radove generirane umjetnom inteligencijom. Premda su neki dijelovi opisa pomalo konfuzni i zbunjujući, definitivno je riječ o AI-konceptu koji obećava puno više kreativnosti i korisnosti u izradi računalno generiranih ilustracija.

Više o temiIzvor:Bug.hr