Misli u govor – umjetna inteligencija iza cerebralne proteze

Neuroznanstvenici diljem svijeta razvijaju tehnologiju koja pretvara moždane valove u govor, kombinirajući moždane implantate i umjetnu inteligenciju za stvaranje glasovnih neuroproteza

Drago Galić utorak, 22. travnja 2025. u 20:32

Iako već desetljećima postoje uređaji koji omogućavaju komunikaciju nijemih i posve nepokretnih s okolinom, uglavnom prateći pomake oka za odabir slova, riječi i rečenica na ekranu, ovakav način komunikacije je vrlo spor i ograničen. U osnovi se svodi na prenošenje osnovnih zahtjeva i potreba okolini i nema dimenziju stvarnog govora.

Stoga i dalje traju istraživanja kojima je za cilj direktno očitavanje misli i njihovo prenošenje kao govora za one koji su posve nijemi i paralizirani, dakle u težem stanju od, primjerice, pokojnog Stephena Hawkinga koji je postao sinonim za korištenje kompjuteriziranog pomagala za stvaranje rečenica. Iako je njegov sintetizirani govor postao i dio pop-kulture pa i internetskih memova, valja imati na umu da on premda vrlo teško pokretan nije bio posve paraliziran - veliki dio svog života mogao je pomicati prste na ruci, a kasnije jezikom upravljati izbornicima na ekranu iz kojih je stvarao rečenice. Isto tako, to stvaranje rečenica i komunikacija nije bila trenutna, već je trajala minutama ili desecima minuta – za razliku od onoga što bi se moglo vidjeti u dokumentarcima u njegovom životu.

Ovo bi se moglo promijeniti zahvaljujući razvoju umjetne inteligencije i naglasku istraživanja na korištenju vanjskih ili sondi implantiranih u mozak koje bolje bilježe moždanu električnu aktivnost. Ovakve procedure pokazuju mogućnost da umjesto ograničenog i vremenski zahtjevnog načina komunikacije kakva je do sada bila dostupna ovakvim osobama, očitavanje moždane aktivnosti i njena interpretacija u govor korištenjem posebno istreniranih modela umjetne inteligencije bude jednako brzo kao i uobičajeni razgovor.

Prema pisanju ArsTechnice, istraživanja koje u ovom pravcu vode američka sveučilišta u partnerstvu s komercijalnim tvrtkama, pokazuju izuzetne rezultate koji bi uskoro mogli biti dostupni onima pogođenima raznim bolestima i stanjima koja im onemogućavaju govor i bilo kakvu komunikaciju s okolinom.

Govor nakon 18 godina

Istraživači na kalifornijskim sveučilištima i tvrtke poput Precision Neuroscience prednjače u razvoju tehnologije koja generira prirodni govor iz moždanih signala. Dok su se ranija istraživanja fokusirala na implantate za upravljanje računalima, novi smjer istraživanja koncentrira se na pretvaranje misli u govor.

Istraživači sa Sveučilišta Kalifornije u San Franciscu objavili su rad o osobi s kvadriplegijom koja 18 godina nije mogla govoriti. Trenirala neuronsku mrežu pokušavajući u tišini izgovarati rečenice, a onda je zvuk njezinog glasa stvoren prijenosom neronskih podataka u model koji kombinira sintezu govora i dekodiranje teksta.

Ova tehnika smanjila je kašnjenje između moždanih signala i zvuka s osam na jednu sekundu, približavajući se normalnom vremenskom razmaku u govoru. Sustav je postigao brzinu od 47,5 riječi u minuti, što je trećina brzine normalnog razgovora.

Tvrtka uključena u ovo istraživanje - Precision Neuroscience – koristi metodu bilježenja moždanih signala više rezolucije zahvaljujući gušće raspoređenim elektrodama koji se nalaze na senzoru dimenzija 3,2 milimetra četvorna. Ovaj senzor se implantira u mozak u podruje orofacijalnog senzornog korteksa i govornog motornog korteksa na do 30 dana, što omogućuje stvaranje opsežne baze neuronskih podataka.

Važna prepreka razvoju je vrijeme učenja korištenja sustava. Ključno pitanje je koliko se obrasci u motoričkom korteksu razlikuju među ljudima. Naime, ako bi ostali slični, modeli trenirani na prethodnim pacijentima mogli bi se koristiti za nove, ali od ranije je poznato da se mozgovi morfološki razlikuju između spolova i između osoba, pa i lokacija regija varira od osobe o sobe.

Istraživači se fokusiraju na motorički korteks gdje neuroni aktiviraju mišiće za govor, bez dokaza da bi se govor mogao generirati iz drugih područja mozga ili dekodiranjem unutarnjih misli.

Razvoj sintetičkog glasa dobrog kao prirodni govor mogao bi još biti prilično daleko. Iako je dekodiranje misli o govoru doseglo točnost od 98%, ali izlaz glasa nije trenutačan i ne bilježi kvalitete poput tona.

Krajnji cilj je da glasovna neuroproteza pruži puni ekspresivni raspon ljudskog glasa, uključujući kontrolu visine, vremena i mogućnost pjevanja.