Pokušao od AI ilustratora dobiti čistu bijelu sliku. Nije uspio

Zašto od sustava za generiranje slika možemo dobiti komplicirane ilustracije s mnogo detalja ili "kopije" umjetničkih djela, ali ne i jednostavne slike poput isključivo čiste bijele boje – otkriva ovaj eksperiment

Sandro Vrbanus ponedjeljak, 1. travnja 2024. u 10:45
📷 CZ Nash / AI
CZ Nash / AI

Prije više od stotinu godina Kazimir Maljevič predstavio je svijetu apstraktne slike "Crni kvadrat" i "Bijelo na bijelom", na kojima praktički nije bilo ničeg osim naslovne boje – tada je to bio umjetnički izraz suprematizma, "čistog osjećaja u umjetnosti, koji nastoji dosegnuti savršen sklad oblika i boja nepredmetnim slikama, crtama i osnovnim geometrijskim likovima". Budući da znamo da su današnji difuzijski modeli za stvaranje ilustracija trenirani na brojnim postojećim slikama, ponekad i umjetničkim djelima (bez dozvole autora), jedan se istraživač i podatkovni znanstvenik upitao što bi se dogodilo kada bi od umjetne inteligencije zatražio isto to – prazan bijeli kvadrat.

Njegovo ime je Cody Nash, a u svoju ideju je uložio podosta truda. Za naizgled jednostavan zadatak – natjerati AI ilustratora da izbaci potpuno bijelu sliku – ta se misija pokazala vrlo izazovnom, na granici nemogućega.

Slike, ali ne i ideje

Avanturu je započeo sa sustavom DALL-E, koji je na promptove poput "potpuno bijela slika bez detalja" generirao složene uzorke, zamišljao snježne prizore, bijele drvene okvire za slike, pejzaže i svašta nešto – sve, osim potpuno bijele površine. Slično se Nash proveo i istražujući mogućnosti modela Stable Diffusion XL, no nikako nije uspio dobiti ono što želi. Umjesto bijele slike, dobivao je bijele zečeve na bijeloj podlozi, eksplozije bijele boje, sobe s bijelim zidovima i ostala čuda i čudesa, ne uvijek bijela.

📷 CZ Nash / AI
CZ Nash / AI

Svoju "avanturu" Nash je opisao i detaljno potkrijepio primjerima na blogu, a zaključaka cijelog eksperimenta je nekoliko. Za početak, iz priloženog se vidi da difuzijski AI modeli nisu trenirani na "čistim" bojama i slikama bez detalja i da ne razumiju što se u tom slučaju od njih traži. Najbitniji zaključak jest – AI sustavi trenirani su na gotovim slikama, a ne na idejama ili objašnjenjima što te slike znače.

Čisti opisi onoga što želimo vidjeti u promptovima obično funkcioniraju dobro, dok je odemo u apstrakciju, a tada se svaki AI sustav pogubi. Za inspiraciju, ideju i koncept i dalje je ključan čovjek, umjetnik, a modeli umjetne inteligencije tu imaju još mnogo posla, čak i kad je riječ o najjednostavnijim konceptima, poput "potpuno bijele slike".