Stability AI lansirao najveći slikovni model, za još kvalitetnije ilustracije

Novi model generativne umjetne inteligencije, SDXL 1.0, najveći je na svijetu te donosi niz poboljšanja u odnosu na prošle modele Stable Diffusiona

Sandro Vrbanus nedjelja, 30. srpnja 2023. u 16:20

Tim Stability AI, koji stoji iza popularnog alata za AI generiranje slika Stable Diffusion objavio je ovoga tjedna svoj novi, najbolji i najveći do sada, model generativne umjetne inteligencije, SDXL 1.0, za koji kažu kako je "najbolji na svijetu". Testiran je u odnosu na postojeće modele, a ispitanici su potvrdili da im se više sviđaju ilustracije nastale korištenjem novog alata, u usporedbi sa svim (ionako dobrim) rezultatima koje je davao Stable Diffusion.

U oblaku ili lokalno

SDXL trenutačno sadrži čak 3,5 milijardi parametara u osnovnom modelu te dodatnih 6,6 milijardi u modelu koji služi za doradu slika. Najviše je to među svim sličnim javno dostupnim alatima, a ova kombinacija funkcionira na sljedeći način: u prvom koraku manji model pretvara tekst u sliku veličine 128x128 piksela, s mnogo šuma, a odatle posao preuzima drugi model i rafinira sliku, povećava je do 1.024x1.024 točaka i dotjeruje detalje.

Kažu kako su modeli optimizirani za rad u cloudu, ali i na računalima koja imaju na raspolaganju GPU s barem 8GB VRAM memorije. Za te svrhe moguće je novi SDXL preuzeti s GitHuba, a pristup je omogućen i putem API-ja.

Kad je riječ o poboljšanjima, SDXL 1.0 nudi mogućnost generiranja još kvalitetnijih fotorealističnih slika, podešen je za viši kontrast, življe i točnije boje, kao i realističniji prikaz svjetla i sjene od svojih prethodnika. Bit će, kažu, bolji i u zadacima koji su inače problematični kod AI modela – kao što su crtanje ruku, teksta i prostornog smještanja objekata unutar kompozicije slike.

Povrh toga, omogućena je i naknadna dorada slika, pretvaranje kompozicije u neki sasvim drugi prizor, promjena stila i slično.

Kako bi se dobili kvalitetni rezultati, novi alat treba i manje riječi u promptu, tj. sustav će bolje razumjeti tekstualne naredbe i generirati rezultate bliže onima koje korisnik očekuje. Stabilityjev SDXL 1.0 moguće je isprobati unutar njihove usluge Clipdrop, gdje se besplatno može generirati ograničen broj slika (400 na dan).