Beba nosila kameru na glavi kako bi AI podučila jeziku djece

AI modeli imaju problema u komunikaciji s djecom jer ne razumiju njihov govor pa su ga istraživači odlučili prilagoditi uzrastu

Mladen Smrekar ponedjeljak, 5. veljače 2024. u 09:04
AI je uspio preslikati riječi s vizualnim referencama koje je vidio putem kamere na djetetovoj glavi i osluškujući riječi kojima je dijete opisivalo razne objekte oko sebe 📷 NYU
AI je uspio preslikati riječi s vizualnim referencama koje je vidio putem kamere na djetetovoj glavi i osluškujući riječi kojima je dijete opisivalo razne objekte oko sebe NYU

Veliki jezični modeli poput OpenAI-jevog GPT-a koji pokreće njegov chatbot ChatGPT obučeni su na ogromnim količinama podataka kako bi mogli razgovarati s ljudima. No, mala djeca ne mogu razgovarati s ChatGPT-om jer na većinu onoga što ona kažu ChatGPT odgovara: "Čini se da ste unijeli nasumični ili besmisleni izraz."

Učenje "bebinog jezika"

Kako bi provjerili može li umjetna inteligencija naučiti glasovne izraze kojima se služe djeca, istraživači Sveučilišta u New Yorku punih su 18 mjeseci kamerom bilježili sve ono što tijekom dana izgovara i čini jedno dijete. I usput su izradili AI model koji će izprikupljenih podataka naučiti "jezik beba". Eksperiment je započeo kad je dijete imalo šest mjeseci i trajao je do njegovog drugog rođendana, kad većina djece izgovara svoje prve riječi.  

Istraživači su u tom razdoblju zabilježili oko jedan posto djetetovih sati budnosti, obično u vrijeme hranjenja, igranja i drugih aktivnosti. Tako su sakupili 60 sati snimaka s približno 250.000 riječi koje je dijete izgovorilo, mnoge od njih više puta.

Snimanje govora

Nakon pregledavanja podataka koje je prikupila multimodalna umjetna inteligencija, istraživači su primijetili da njihov model treniran na podskupovima inputa jedne bebe može učiti riječi u svakodnevnom okruženju. AI je uspio preslikati riječi s vizualnim referencama koje je vidio putem kamere na djetetovoj glavi i osluškujući riječi kojima je dijete opisivalo razne objekte oko sebe. 

Prizori snimljeni kamerom koje je dijete nosilo na glavi 📷 NYU
Prizori snimljeni kamerom koje je dijete nosilo na glavi NYU

No, pokazuju rezultati istraživanja objavljenog u časopisu Science, AI model nije bio potpuno savršen. Na primjer, brkao bi riječi kao što su "ruka" (hand) i "pijesak" (sand). Bez obzira na to, kažu istraživači, rezultati ovog eksperimenta nude nam uvid u to kako mala djeca uče novi jezik.

U 18 mjeseci prikupljeno je 60 sati snimaka s približno 250.000 riječi koje je izgovorilo dijete 📷 NYU
U 18 mjeseci prikupljeno je 60 sati snimaka s približno 250.000 riječi koje je izgovorilo dijete NYU

Istraživanje otvara i nova pitanja i mogućnosti: što bi se dogodilo kad bi se izmijenio način na koji veliki jezični modeli obrađuju podatke tako da ga se učini djetinjastijim? Bi li onda još bolje komunicirao s djetetom i bi li djeca još brže naučila govoriti razgovarajući s AI modelom?