Stable Diffusion XL Turbo generira slike trenutno

Stable Diffusion XL Turbo tj. SDXL Turbo osim što brzo može generirati slike na temelju unosa teksta isto može jednako brzo činiti iz izvora kao što su web kamera ili slike

Tomislav Stanković petak, 1. prosinca 2023. u 15:37

Prema detaljima u objavi, tehnika koja omogućuje sintetiziranje slike u jednom koraku i generiranja teksta u sliku u stvarnom vremenu uz održavanje visoke vjernosti uzorkovanja zove se Adversarial Diffusion Destillation (ADD).

Iako SDXL Turbo još nije namijenjen za komercijalnu upotrebu očita je njegova sposobnost generiranja slike u jednom koraku za razliku od 20 do 50 koraka koje je zahtijevao njegov prethodnik.

Ipak SDXL Turbo se ne smatra zamjenom za prethodni model jer njegove slike nisu toliko detaljne kao SDXL slike proizvedene s većim brojem koraka. No za one kojima je važnija brzina rezultati i sposobnosti ovog modela biti će zapanjujući.

Stability AI nudi beta demonstraciju mogućnosti SDXL Turbo na svojoj platformi za uređivanje slika, Clipdrop.

S tehničke strane, "SDXL Turbo pruža velika poboljšanja brzine zaključivanja. Na A100, SDXL Turbo generira 512x512 sliku u 207 ms (brzo kodiranje + jedan korak uklanjanja buke + dekodiranje, fp16), gdje se 67 ms računa za jednu UNet procjenu naprijed".

Kada ga se uspoređuje s drugim difuzijskim modelima kao što su StyleGAN-T++, OpenMUSE, IF-XL i LCM-XL u objavi se navodi da SDXL Turbo nadmašuje i LCM-XL model s više koraka sa znatno nižim računalnim zahtjevima bez žrtvovanja kvalitete slike.