Metin AI model može s fotografija izrezati bilo koji objekt

U sklopu svojeg istraživanja umjetne inteligencije i računalnog vida, u Meti su izradili sustav Segment Anything, koji je u stanju prepoznati i s digitalne slike izdvojiti objekt, na temelju tekstualnog zadatka

Sandro Vrbanus ponedjeljak, 10. travnja 2023. u 06:00

Još jedan model umjetne inteligencije za manipulaciju grafičkim formatima objavljen je ovih dana. Ime mu je Segment Anything, a autori istraživači iz Facebookove krovne kompanije, Mete. Ovaj sustav prepoznaje sve objekte na zadanim mu slikama, pa ih razdvaja u "segmente", koji se potom mogu koristiti zasebno.

Pri izradi modela u meti su za trening koristili 11 milijuna slika, uz poštivanje autorskih prava i s dozvolom za to, pri čemu je nastalo oko milijardu segmenata. Tako treniran sustav sada može prepoznavati objekte na novim slikama, što dokazuje i javni demo, dostupan na ovoj stranici.

U demo verziju moguće je učitati vlastitu fotografiju ili ilustraciju, pustiti modelu da je analizira, a potom jednostavnim klikanjem po slici odabirati njezine AI-jem definirane segmente. Sustav naredbe može primati i u tekstualnom obliku, primjerice naredba "mačka" prepoznat će sve mačke na učitanoj fotografiji.

Ovaj model ima potencijal promijeniti način rada pri obradi fotografija i izradi ilustracija, a moguće će ga biti ugraditi u razne aplikacije, gdje bi prepoznavanje objekata moglo biti od koristi. Isto tako, njime se mogu nadopuniti drugi AI modeli, koji će tako dobiti multimodalno razumijevanje konteksta. Iz Mete naglašavaju da potencijalnu primjenu vide i u virtualnom (AR/VR) okruženju, gdje bi Segment Anything mogao omogućiti bolje "hvatanje" predmeta i prebacivanje istih iz stvarnog u virtualni svijet.