Project Strawberry: OpenAI-ev veliki korak prema umjetnom rasuđivanju

Rasuđivanje se smatra ključnim za postizanje ljudske ili nadljudske inteligencije u AI sustavima. OpenAI, nedavno je na internom sastanku demonstrirao Project Strawberry, prethodno poznat kao Q*. za koji tvrdi da posjeduje vještine rasuđivanja nalik ljudskima

Ivan Podnar nedjelja, 14. srpnja 2024. u 12:07

Prema izvješćima dvoje sudionika prezentacije, koji su razgovarali s Reutersom, Project Strawberry, prethodno poznat kao Q*, o kome smo pisali, pokazuje značajno unaprijeđene sposobnosti u rješavanju složenih znanstvenih i matematičkih pitanja u usporedbi s trenutno dostupnim komercijalnim modelima. Na internom sastanku održanom prošli tjedan, OpenAI je prikazao projekt za koji tvrdi da posjeduje vještine rasuđivanja nalik ljudskima.

Post-trening

Projekt Strawberry uključuje specijalizirani način obrade UI modela nakon što je prethodno obučen na vrlo velikim skupovima podataka. Ovaj pristup, poznat kao "post-trening", uključuje metode poput "finog podešavanja" koje se koriste za prilagodbu postojećih modela.

Važnost rasuđivanja

Rasuđivanje se smatra ključnim za postizanje ljudske ili nadljudske inteligencije u AI sustavima. Dok postojeći veliki jezični modeli mogu brzo sažimati tekstove i sastavljati prozne tekstove, često im nedostaje sposobnost rješavanja problema zdravorazumskog karaktera ili prepoznavanja logičkih pogrešaka. Sam Altman, izvršni direktor OpenAI-a, ranije je izjavio da će "najvažnija područja napretka u AI-u biti vezana uz sposobnost rasuđivanja."

Usporedba s drugim istraživanjima

Projekt Strawberry pokazuje sličnosti s metodom razvijenom na Sveučilištu Stanford 2022. godine, nazvanom "Self-Taught Reasoner" ili "STaR". Ova metoda omogućuje UI modelima da "sami sebe unaprijede" stvaranjem vlastitih podataka za obuku.

"Mislim da je to istovremeno uzbudljivo i zastrašujuće... ako stvari nastave ići u tom smjeru, imamo ozbiljne stvari o kojima moramo razmišljati kao ljudi," rekao je jedan od njegovih tvoraca, profesor sa Stanforda Noah Goodman, koji nije povezan s OpenAI-om i nije upoznat sa Strawberryjem.

Najvažnija područja napretka u AI-u biti vezana uz sposobnost rasuđivanja - Sam Altman

I druge tvrtke poput Googlea, Mete i Microsofta također eksperimentiraju s različitim tehnikama za poboljšanje rasuđivanja u AI modelima, kao i većina akademskih laboratorija koji provode AI istraživanja. Istraživači se, međutim, razlikuju u mišljenjima o tome jesu li veliki jezični modeli sposobni integrirati ideje i dugoročno planiranje u svoja “promišljanja”. Na primjer, jedan od pionira moderne AI, Yann LeCun, koji radi u Meti, često je tvrdio da veliki jezični modeli nisu sposobni doseći ljudsko rasuđivanje, kako smo o tome ovdje pisali.

LHT I CUA

Među ključnim ciljevima Strawberryja je sposobnost izvršavanja dugoročnih zadataka (long-horizon tasks, LHT), koji zahtijevaju od modela da planira unaprijed i izvršava niz akcija tijekom duljeg razdoblja. OpenAI također radi na razvoju "agenta koji koristi računalo" (computer-using agent, CUA), sustav koji može autonomno pretraživati Internet i poduzimati akcije na temelju pronađenih informacija.