Poput ljudskog mozga i ChatGPT bolje rješava probleme kad uspori

Na testovima osmišljenim da prevare ljude, noviji jezični modeli pokazuju složeniju moć zaključivanja

Mladen Smrekar srijeda, 1. studenog 2023. u 06:00

vecstock

Kad se nađe pred problemom, vaš mozak ima dvije mogućnosti: da nastavi brzo i intuitivno ili polako i metodično. Ove dvije vrste obrade poznate su kao "brzo" i "sporo" razmišljanje, kako ih je najbolje opisao nobelovac, psiholog Daniel Kahneman.

Rješavanje problema u koracima

Veliki jezični modeli poput ChatGPT-a kreću se brzo prema zadanim postavkama. Postavite im pitanje i oni će izbaciti odgovor, ne nužno točan, koji sugerira da su sposobni za brzu obradu. Ipak, kako se ti modeli razvijaju, mogu li usporiti i pristupiti problemima u koracima, izbjegavajući netočnosti koje proizlaze iz brzih odgovora? Čini se da mogu i pritom čak nadmašiti ljude u osnovnim testovima razmišljanja i donošenja odluka, zaključio je Stanfordov profesor Michal Kosinski nakon istraživanja koje objavljuje Nature Computational Science.

Stanfordovi istraživači Michal Kosinski, Sarah Fabi i Thilo Hagendorff

Kosinski i suradnici, filozof Thilo Hagendorff i psihologinja Sarah Fabi, suočili su 10 generacija OpenAI LLM-a s nizom zadataka dizajniranih za brze odgovore. Zanimalo ih je hoće li LLM-i pokazati kognitivne predrasude poput onih koje zbune ljude kad se oslanjaju na automatsko razmišljanje. Primijetili su da rani modeli poput GPT-1 i GPT-2 "nisu mogli stvarno razumjeti što se događa" te da su na složenijim testovima njihovi odgovori bili sve sličniji reakcijama koje bi imali ljudi, objašnjava Kosinski.

Usporavanje procesa

Nimalo neočekivano, LLM-ovi dizajnirani za predviđanje nizova teksta nisu mogli sami razmišljati. "Ti modeli nemaju unutarnje petlje razmišljanja. Oni se ne mogu iznutra usporiti i reći: dajte mi vremena da razmislim o problemu; dopustite mi da analiziram pretpostavke", kaže Kosinski.

I veliki jezični modeli mogu usporiti i pristupiti problemima u koracima, izbjegavajući netočnosti koje proizlaze iz brzih odgovora 📷 Hagendorff, Fabi i Kosinski — I veliki jezični modeli mogu usporiti i pristupiti problemima u koracima, izbjegavajući netočnosti koje proizlaze iz brzih odgovora Hagendorff, Fabi i Kosinski

Međutim, kasnije verzije GPT-a i ChatGPT-a mogu "usporiti" i uključiti se u strateškije, pažljivije rješavanje problema. "Odjednom, GPT3 postaje sposoban, iz jedne sekunde u drugu, bez ikakve prekvalifikacije, bez razvijanja novih neuronskih veza, riješiti ovaj zadatak. To pokazuje da ti modeli mogu učiti odmah, poput ljudi", otkriva Kosinski.

Test kognitivne refleksije

"Svaki dan se broj ljiljana koji rastu u jezeru udvostruči. Ako je potrebno 10 dana da se jezero potpuno prekrije, koliko je dana potrebno da se prekrije polovica jezera?", glasio je jedan od problema koje su istraživači zadali GPT modelima. Riječ je o vrsti testa kognitivne refleksije koji zahtijeva rasuđivanje, a ne intuiciju. Da biste dobili točan odgovor, morate usporiti, možda zgrabiti blok papira ili kalkulator i analizirati zadatak (da, da, točan odgovor nije pet nego devet dana).

Just Like Your Brain, ChatGPT Solves Problems Better When It Slows Down | Stanford Graduate School of Business https://t.co/xDG7ERR0la
— Michal Kosinski (@michalkosinski) October 27, 2023

Ovakvu vrstu zadataka dobro shvaća manje od 40% ljudi. Ranije verzije modela koje su prethodile ChatGPT-u imale su još lošije rezultate. Ipak, GPT-3 je došao do točnih odgovora složenijim rezoniranjem "lanca misli" kada je dobio pozitivno potkrepljenje i povratnu informaciju od istraživača.

"Ako mu samo date zadatak, GPT-3 će ih točno riješiti manje od 5% i nikada neće ići korak po korak. Ali ako mu odredite smjer kojim mora ići, naprimjer 'upotrijebi algebru za rješavanje ovog problema', on će ići korak po korak i njegova će točnost skočiti na oko 30%, što je povećanje od 500%", kažu istraživači. Pritom učestalost brzih odgovora pada s 80% na 25%, što pokazuje da čak i kad pogriješi, nije toliko sklon intuitivnim pogreškama. A kad je ChatGPT-4 koristio rezoniranje u lancu misli, ponudio je točan odgovor u gotovo 80% ovih vrsta testova.

Kasnije verzije GPT-a i ChatGPT-a mogu "usporiti" i uključiti se u strateškije, pažljivije rješavanje problema 📷 freepik — Kasnije verzije GPT-a i ChatGPT-a mogu "usporiti" i uključiti se u strateškije, pažljivije rješavanje problema freepik

Istraživači su otkrili još nešto: čak i kad je bio spriječen u provođenju sporog rezoniranja, ChatGPT je ipak bio bolji od ljudi. To je, kaže Kosinski, dokaz da je "intuicija" LLM-a možda bolja od naše.

Više od zbroja dijelova

Ova otkrića još su jedan dokaz da bi model umjetne inteligencije mogao biti "više od zbroja svojih dijelova". Neuronske mreže iza jezičnih modela, slične ljudskim mozgovima, nastavljaju pokazivati svojstva koja nadilaze njihovu obuku. Kosinski se ne slaže s tvrdnjama da modeli ne razmišljaju.

Experimental results presented in our Nature comp. sci. paper stuggest that ChatGPT (and other LLMs) can engage in both System 1 and System 2 thinking. ChatGPT's intuitions are more accurate than those of humans. https://t.co/KmHJg86O4P
— Michal Kosinski (@michalkosinski) October 5, 2023

Istraživači napominju da oni ne misle izjednačiti umjetnu inteligenciju i ljudske kognitivne procese jer "iako su učinci umjetne inteligencije često slični onima koje proizvode ljudi, ona obično funkcionira na bitno drugačije načine". No trebali bi se, kažu oni, zapitati zašto inzistiramo na tome da kad čovjek učini nešto, to podrazumijeva razumijevanje, ali ako to uradi model, mi uporno tvrdimo da je riječ o nečemu drugom, a ne razumijevanju.

Vezano

📢 Uštedi 70€

Lenovo V15

529,99€ ~~599,99€~~ Kupi

📢 Uštedi 29%

Oscal C70

119,99€ ~~169,99€~~ Kupi

📢 Uštedi do 23%

Veger prijenosni punjači

Od 19,99€ Kupi

Ronis Hi-Fi slušaonica na Velesajmu.

Rezervirajte svoj termin!

Želite doživjeti zvuk visoke kvalitete? Pridružite nam se u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Hi-Fi po pristupačnoj cijeni.

Zvučnici JBL Stage A130

Dvosmjerni bookshelf, Frekvencijski odziv: 55Hz – 40kHz; Osjetljivost: 86 dB; Snaga pojačala: 2-125W; Impedancija: 6 Ohma.

279 € Kupi

Topao, bogat zvuk.

AV Receiver MARANTZ Cinema 70s

7 kanala, max power 100 W pri 6 ohma, 1 kHz, 10% THD za 1 kanal, DTS, Dolby Atmos, HEOS Multi-room, AirPlay 2, TuneIn, Wi-Fi, Bluetooh

749 € Kupi

Dvokanalno pojacalo visokih performansi.

Mrežni receiver DENON DRA-900H

Network stereo receiver, dvokanalno pojacalo visokih performansi, napredna 8K HDMI veza, ugraden HEOS®. Visokokvalitetno iskustvo slušanja i 8K video s 2-kanalnog mrežnog stereo prijemnika.

739 € Kupi

Proizvedeni u sam0 100 primjeraka.

Zvučnici FALCON ACOUSTICS LS3/5A 50 anniversary Golden madrona

2-smjerni standmount, bas-mid: Falcon B-110, bextrene 127 mm, visoki: Falcon T-27, mylar, 19 mm, frkevencijski raspon: 70 Hz – 20 kHz, osjetljivost: 83 dB / 1W, 1m, impedancija 15 Ohma

3.120 € ~~3.120 €~~ Akcija

Kompaktni bežični zvučnik s impresivnim zvukom.

Bežični Hi-Fi zvučnik HARMAN KARDON Citation ONE MKIII

Ovaj WiFi zvucnik ima snagu od 40 W, visok je manje od 20 centimetara, tako da Citation ONE lako stane u ormar, na policu za knjige ili na stol, ali proizvodi impresivan zvuk kakav biste ocekivali od veceg zvucnika.

199 € ~~229 €~~ Akcija

Čista vintage estetika.

Gramofon CROSLEY VOYAGER Tan

Spin 33 1/3, 45 ili 78 RPM snima ili pokrenite ugradeni Bluetooth prijemnik za bežicni prijenos vaše digitalne glazbe kroz stereo zvucnike gramofona.

101 € ~~109 €~~ Akcija

Poboljšana disperzija i veća snaga.

Zvučnici ACOUSTIC ENERGY AE300

2-sistemski zvucnici sa 130mm mid-bass jedinicama drivera, novim keramickim aluminijskim sandwich konusom i 28mm aluminijskim visokotoncem, frekvencijski raspon 45Hz -30kHz, osjetljivost 86 dB, vršni SPL 112dB, snaga 100W, crossover frekvencija 2.8kHz, impedancija 6 ohma.

719 € ~~799 €~~ Akcija

Triple Design Reduction za čisti zvuk.

Linija DENON RCD-M41 DAB silver

Micro CD receiver, ugrađeni CD i FM radio DAB/DAB+, pojačalo snage 2x30 W, integriran Bluetooh, broj kanala: 2

379 € Kupi

Poništavanje buke svjetske klase.

Slušalice BOSE QuietComfort Ultra Headphones

Ugrađeni mikrofon, aktivno poništavanje buke, Bluetooth 5.3, Bose Music, USB-C, Bose Immersive Audio

525 € Kupi

Stereo zvuk visoke rezolucije.

Bežični zvučnik BOWERS & WILKINS Zeppelin 2021

Ovaj dizajn karakterizira karakteristicno kucište, zahvaljujuci kojem ga je teško zbuniti za bilo kojim drugim uredajem. Kompatibilnost s Apple AirPlay 2 i Spotify Connect, podrška za Bluetooth i aptX Adaptive kodek

699 € Kupi

Novi ultimativni PartyBox iz JBL-a.