MAGE spaja prepoznavanje i generiranje slike

MIT-ov Masked Generative Encoder (MAGE) može istovremeno točno identificirati slike i stvarati nove, nevjerojatno nalik stvarnima

Mladen Smrekar subota, 1. srpnja 2023. u 21:00

MAGE su zajedničkim snagama osmislili stručnjaci iz Googlea i MIT-ovog Laboratorija za računalnu znanost i umjetnu inteligenciju Alex Schipps/MIT CSAIL

Kad se spominju slike, računala posjeduju dvije izvanredne sposobnosti: mogu ih identificirati i ponovno generirati. A sad su istraživači MIT-ovog Laboratorija za računalnu znanost i umjetnu inteligenciju (CSAIL) istrenirali sustav tako da može sam zaključiti koji dijelovi slike nedostaju, što je zadatak koji zahtijeva duboko razumijevanje sadržaja slike. Uspješno popunjavajući praznine, Masked Generative Encoder (MAGE) postiže dva cilja u isto vrijeme: točno identificira slike i stvara nove, nevjerojatno nalik stvarnima.

Semantički tokeni

Predstavljen na konferenciji o računalnom vidu i prepoznavanju uzoraka CVPR 2023, MAGE omogućuje bezbroj potencijalnih primjena, poput identifikacije i klasifikacije objekata unutar slika, brzog učenja iz minimalnih primjera, stvaranja slika pod specifičnim uvjetima i poboljšanja postojećih slika.

Rezultati rekonstrukcije pomoću MAE i MAGE s omjerom maskiranja 75%. MAE rekonstruira mutne slike niske kvalitete, dok MAGE može rekonstruirati visokokvalitetne slike s detaljima i dodatno poboljšava kvalitetu kroz iterativno dekodiranje 📷 MIT CSAIL — Rezultati rekonstrukcije pomoću MAE i MAGE s omjerom maskiranja 75%. MAE rekonstruira mutne slike niske kvalitete, dok MAGE može rekonstruirati visokokvalitetne slike s detaljima i dodatno poboljšava kvalitetu kroz iterativno dekodiranje MIT CSAIL

Za razliku od drugih tehnika, MAGE ne radi s neobrađenim pikselima. Umjesto toga, on pretvara slike u "semantičke tokene", kompaktne, ali apstraktne verzije dijelova slike. Baš kao što riječi tvore rečenice, ovi tokeni stvaraju apstrahiranu verziju slike koja se može koristiti za složene zadatke obrade, a istovremeno čuva informacije u izvornoj slici. To se može uvježbati unutar samonadziranog okvira, što mu omogućuje preduvježbavanje na velikim skupovima podataka slika bez oznaka.

Modeliranje maskiranog tokena

Čarolija počinje kada MAGE počne koristiti "modeliranje maskiranog tokena". On nasumično skriva neke od tih tokena, stvarajući nepotpunu slagalicu, a zatim trenira neuronsku mrežu da popuni praznine. Tako uči razumjeti uzorke na slici i generirati nove.

MAGE Framework 📷 MIT CSAIL — MAGE Framework MIT CSAIL

MAGE može generirati realistične slike od nule, ali to nije sve: korisnici mogu odrediti kriterije po kojima će im MAGE generirati odgovarajuću sliku. Nije mu problem ni uređivati slike tako što će s njih ukloniti razne elemente, zadržavajući pritom njihov realističan izgled.

Impresivni reztultati

Zadaci prepoznavanja još su jedna jača strana za MAGE. Sa svojom sposobnošću prethodnog treniranja na velikim neoznačenim skupovima podataka, može klasificirati slike koristeći samo naučene prikaze. Štoviše, ističe se u učenju u nekoliko koraka, postižući impresivne rezultate na velikim skupovima podataka o slikama poput iMAGeNeta sa samo nekoliko označenih primjera.

Slike koje je generirao MAGE 📷 MIT CSAIL — Slike koje je generirao MAGE MIT CSAIL

Dakako, proces pretvaranja slika u tokene neizbježno dovodi do gubitka nekih informacija pa istraživači žele istražiti načine komprimiranja slika bez gubitka važnih detalja. Buduće istraživanje moglo bi uključivati i obuku MAGE-a na većim neoznačenim skupovima podataka, što bi moglo dovesti do još boljih performansi.

Vezano

📢 Uštedi 130€

META Quest 2

339,99€ ~~469,99€~~ Kupi

📢 Uštedi 10%

Samsung monitor

116,99€ ~~129,99€~~ Kupi

📢 NOVO!

EPOCH Galaxia

899,99€ Kupi

Ronis Hi-Fi slušaonica na Velesajmu.

Rezervirajte svoj termin!

Želite doživjeti zvuk visoke kvalitete? Pridružite nam se u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Svestrani high-end Hi-Fi DAC.

TANGENT DAC II D/A pretvarač i pretpojačalo

Bluetooth 5.0 APTX Hd Sabre, Stereo Audio DAC, USB: 192kHz / 32-bit PCM (Stereo) – podržava DSD audio, 64/128/256/512, Opticki ulaz: 192kHz / 24-bit, Opticki izlaz: 192kHz / 24-bit

279 € Best Buy

Throw-back na ranije JBL receivere.

JBL SA750 integrirano pojačalo

Frekvencijski odziv 20Hz – 20kHz ± 1dB, nominalna osjetljivost: 1V, impedancija ulaza: 10kΩ, snaga izlaza na oba kanala pogonjena: 120W na 8Ω, 220W na 4Ω

2.499 € ~~2.999 €~~ Akcija

Za audio šmekere.

ACOUSTIC ENERGY AE109² zvučnici (par)

2.5-smjerni samostojeci zvucnik, frekvencijski raspon: 41Hz - 26kHz, crosssover frekvencija: : 275Hz, 2.5kHz, impedancija: 6 ohma, osjetljivost: 89dB, Peak SPL: 115dB, maksimalna snaga: 175W

692 € ~~769 €~~ Akcija

Kućno kino na samo dva zvučnika.

MARANTZ Stereo 70s receiver

75W po kanalu, 8K HDMI, dvostruki izlazi za subwoofer, HEOS® Built-in Multi-Room Streaming,

989 € Kupi

High-end performanse u kompaktnom dizajnu.

Stereo pojačalo PARASOUND HINT 6

2 x 160 W 8 Ohma. Burr Brown analog resistor ladder volume control. Dimmable front panel volume display. Updated USB receiver is Plug and play with Windows 10 and MAC.

3.999 € ~~4.999 €~~ Akcija

Aktivni subwoofer s jednostavnim podešavanjem.

Subwoofer ACOUSTIC ENERGY AE108²

Snaga: 150W, frekvencijski raspon: 30Hz - 110kHz, sealed box, Peak SPL: 105dB

539 € ~~599 €~~ Akcija

Poboljšana disperzija i veća snaga.

Zvučnici ACOUSTIC ENERGY AE300

2-sistemski zvucnici sa 130mm mid-bass jedinicama drivera, novim keramickim aluminijskim sandwich konusom i 28mm aluminijskim visokotoncem, frekvencijski raspon 45Hz -30kHz, osjetljivost 86 dB, vršni SPL 112dB, snaga 100W, crossover frekvencija 2.8kHz, impedancija 6 ohma.

719 € ~~799 €~~ Akcija

Best buy 8K receiver.

DENON AVR-X2800H AV receiver

7-kanalno pojačalo, 150 W po kanalu, 8K video, HEOS ugrađena tehnologija, Dolby Atmos® i DTS:X®, plus Dolby Surround i DTS Neural:X

799 € Kupi

San svakog audiofila.

Slušalice SENNHEISER HD 650

Max SPL: 103 dB na 1kHz/1 Vrms, THD: 0,05%, Impedancija: 300 ohm, Frekvencijski odaziv: 10 Hz - 39kHz, 6,35 mm TRS + 3,5 mm adapter

499 € Kupi

Idealan subwoofer za moderan dom.

BLUESOUND NODE streamer

Bluesound NODE otkljucava svijet hi-res streaming glazbe i multiroom zvuka kako bi stvorio moderan dodatak postojecim HiFi sustavima ili vašem omiljenom setu zvucnika s napajanjem.

650 € Best buy

Sinkronizirani light show