Koliko su pouzdani veliki jezični modeli kao GPT?

Mnogo ljudi bez imalo straha važne projekte i odluke prepušta umjetnoj inteligenciji. Nova istraživanja pokazuju zašto to ne bismo trebali činiti

Mladen Smrekar nedjelja, 27. kolovoza 2023. u 13:05

Nova studija pokazuje da su popularni modeli zadržali vjerojatnost toksičnosti od 32% i da lako otkrivaju privatne informacije vecstock

Generativna umjetna inteligencija možda je prožeta halucinacijama, dezinformacijama i pristranostima, ali to nije spriječilo više od polovice ispitanika nedavne globalne studije da kažu kako bi ovu tehnologiju koristili za osjetljiva područja kao što su financijsko planiranje i medicinski savjeti. Sanmi Koyejo sa Stanforda i Bo Li sa Sveučilišta Illinois Urbana-Champaign su uz pomoć suradnika sa Sveučilišta Berkeley i Microsoft Researcha odlučili istražiti koliko su zapravo pouzdani ovi veliki jezični modeli.

Osam perspektiva povjerenja

"Čini se da svi misle kako su LLM-ovi savršeni i sposobni u usporedbi s drugim modelima. To je vrlo opasno, pogotovo ako ljudi ove modele primjenjuju u kritičnim domenama" kažu autori koji su iz ovog istraživanja naučili da "modeli još nisu dovoljno pouzdani za kritične poslove".

Toksičnost GPT-3.5 i GPT-4 modela 📷 Sanmi Koyejo, Bo Li — Toksičnost GPT-3.5 i GPT-4 modela Sanmi Koyejo, Bo Li

Usredotočujući se posebno na GPT-3.5 i GPT-4, procijenili su osam različitih perspektiva povjerenja: toksičnost, pristranost stereotipa, kontradiktornu i izvan distribucijsku robusnost, otpornost na kontradiktorne demonstracije, privatnost, strojnu etiku i pravednost. Iako se pokazalo da su ovi noviji modeli manje toksični od prethodnih modela, još uvijek ih se lako može dovesti u zabludu da generiraju toksične i pristrane rezultate, kao i da privatne informacije cure iz podataka o obuci i razgovora korisnika.

Toksični učinak

"Laici ne razmišljaju o tome da se ispod haube ipak nalaze modeli strojnog učenja s manama", objašnjava Koyejo. "Ovi modeli pokazuju razne sposobnosti iznad očekivanja, poput vođenja prirodnih razgovora, pa ljudi imaju velika očekivanja od inteligencije i prepuštaju im da odlučuju umjesto njih. Ali vrijeme za to još nije sazorilo."

"Još nije sazrijelo vrijeme da ljudi odluke prepuste umjetnoj inteligenciji", kažu autori istraživanja Sanmi Koyejo i Bo Li

Nakon što su modelima dali benigne upute, istraživači su otkrili da su GPT-3.5 i GPT-4 značajno smanjili toksični učinak u usporedbi s drugim modelima, ali su još uvijek zadržali vjerojatnost toksičnosti oko 32%. Kad se modelima daju kontradiktorni upiti i potom ih se potakne na zadatak, vjerojatnost toksičnosti raste na 100%. Ipak, njihova otkrića sugeriraju da su razvojni inženjeri modela GPT-3.5 i GPT-4 identificirali i zakrpali probleme iz ranijih modela i ispravili neke najosjetljivije stereotipe, poput rasnih i spolnih.

Novi modeli su manje toksični od prethodnih ali ih se još uvijek lako može dovesti u zabludu da generiraju pristrane rezultate 📷 Sanmi Koyejo i Bo Li — Novi modeli su manje toksični od prethodnih ali ih se još uvijek lako može dovesti u zabludu da generiraju pristrane rezultate Sanmi Koyejo i Bo Li

Otkrivanje osjetljivih podataka

Oba GPT modela spremno otkrivaju osjetljive podatke o obuci, poput adresa e-pošte, ali su oprezniji s brojevima socijalnog osiguranja. Pokazalo se da je GPT-4 skloniji curenju privatnosti nego GPT-3.5, ali i da određene riječi koje se odnose na privatnost kod njega izazivaju različite odgovore. Tako će GPT-4 otkriti privatne informacije kad se nešto kaže "povjerljivo", ali ne i kad se ista informacija kaže "u povjerenju".

Mapa pokazuje usklađenost GPT-3.5 i GPT-4 modela sa stereotipima prema različitim demografskim skupinama 📷 Sanmi Koyejo i Bo Li — Mapa pokazuje usklađenost GPT-3.5 i GPT-4 modela sa stereotipima prema različitim demografskim skupinama Sanmi Koyejo i Bo Li

Koyejo i Li priznaju da GPT-4 pokazuje poboljšanja u odnosu na GPT-3.5 i nadaju se da će budući modeli biti pouzdaniji. U međuvremenu korisnicima savjetuju da zadrže zdrav skepticizam kad koriste sučelja koja pokreću ovi modeli.

"Pazite da vas ne prevare, osobito u osjetljivim slučajevima. Ljudski nadzor nad umjetnom inteligencijom i dalje ima smisla", zaključuju Koyejo i Li.

Vezano

📢 Uštedi 130€

ASUS VivoBook 15 OLED

Svestrani laptop s briljantnim zaslonom!

669,99 799,99 Kupi

📢 Akcija!

Logitech gaming periferija

Podigni razinu igre!

Od 29,99€ Kupi

📢 Fly so high!

DJI Mini 2 SE

Snimi nezaboravne kadrove!

289,99 Kupi

Zadnji komentari na forumu

PzKpfw 27. kolovoza 2023.

Hm, ma AI/ML je super područje za učiti o tome kaj se nalazi ispod haube, te uživati u ljepotama toga.Međutim, nedajte nikome da ključne odluke vašeg života donosi, umjesto vas. Nit' ljudima, nit strojevima, ni algoritmu.Vi i na hitnoj možete odbiti da vam bude pružena pomoć.

Keso 27. kolovoza 2023.

Ako laže u blizu 50% slučajeva, nije bolji od generatora slučajnih odgovora. Samo što ih elokventno formulira.

Ronis Hi-Fi slušaonica na Velesajmu.

Rezervirajte svoj termin!

Želite doživjeti zvuk visoke kvalitete? Pridružite nam se u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Primare UFDP 2 tehnologija pojačanja.

PRIMARE I25 stereo pojačalo

UPFD 2 2 x 100W 8 ohms / 2 x 200 4 ohms, RCA 5 x pari stereo analog ulaza, RCA 1 x stereo par analognih LINE izlaza, RCA 1 x stereo par analognih PRE izlaza, C25 IR daljinski upravljac, 3.5 mm ulaz/ izlaz.

2.379 € ~~2.799 €~~ Akcija

Vrhunski 3D surround zvuk.

JBL Bar 500 soundbar

5.1-kanalni soundbar s MultiBeam tehnologijom i Dolby Atmosom, bežični subwoofer od 10", AirPlay, Alexa, Chromecast

529 € ~~579 €~~ Akcija

Glatke visoke frekvencije.

ACOUSTIC ENERGY AE120² zvučnici

Frekvencijski raspon: 39Hz - 26kHz, osjetljivost: 90dB Peak SPL: 116dB, snaga opterećenja: 200w

956 € ~~1.062 €~~ Akcija

Elegantni gramofon s Bluetooth izlazom.

CROSLEY C6 gramofon

Remenski pogon, dvije brzine, 7”, 10” or 12” ploče, Bluetooth out, RCA out, anti skating prilagodba

229 € ~~249 €~~ Akcija

Dolby Atmos, DTS:X, 8K Ultra HD i HEOS built-in streaming.

MARANTZ Cinema 60 AV receiver

7.2 kanalni AV prijamnik, 100W po kanalu, Dolby Atmos, DTS:X, Audyssey MultEQ XT, HEOS, AirPlay, Wi-Fi, Bluetooth

1.049 € Kupi

Napredna 8K HDMI veza.

DENON DRA-900H mrežni receiver

Network stereo receiver, dvokanalno pojacalo visokih performansi, napredna 8K HDMI veza, ugraden HEOS®. Visokokvalitetno iskustvo slušanja i 8K video s 2-kanalnog mrežnog stereo prijemnika.

739 € Kupi

Neusporedive performanse.

MARTIN LOGAN Motion Foundation B1 zvučnici

Frekvencijski odziv: 48 Hz - 23 kHz ± 3 dB, preporučena snaga pojačala: 15 - 100 watts, osjetljivost: 89 dB, impedancija: 5 ohm

809 € Kupi

Masivni JBL Pro zvuk.

JBL Xtreme 4 prijenosni zvučnik

Baterija max 24h, vodootponi dizajn, frekvencijski raspon: 44 Hz - 20k Hz, SNR> 80 dB, Bluetooth 3.5

445 € Novo

Snažan newcomer.

MARSHALL Woburn III BT bežični zvučnik

Frekvencijski raspon: 35–20,000 Hz, podesive kontrole basova i visokih tonova, Wi-Fi, 3.5 mm input, RCA input, HDMI input

569 € Kupi

Zabava uz snažan bas i dinamičnu rasvjetu.

JBL PartyBox 110 party zvučnik

Nova, poboljšana verzija vrlo popularnog prijenosnog party zvucnika pored vec poznatog JBL Original Pro zvuka i dinamicnih svjetlosnih efekata uskladenih s glazbom donosi još bolju zaštitu od kapljica vode

349 € ~~366 €~~ Akcija

JBL Signature zvuk s poboljšanim basom.

JBL Live 660NC over-ear slušalice

Uz njihovo aktivno prigušivanje buke možete uživati u slušanju glazbe po cijele dane bez ometajucih ambijentalnih zvukova. Istodobno, znacajke TalkThru i Smart Ambient omogucuju vam održavanje kontakta sa svojim prijateljima i okolinom.

156 € ~~179 €~~ Akcija

Nabolje pojačalo na tržištu.

ARCAM Radia A15 integrirano pojačalo

A15 ima Bluetooth s AptX adaptivnom tehnologijom koja omogucuje slušanje formata sve do 24-bitne HD rezolucije koje možete streamati s mobitela ili tableta. Možete ga spojiti i na BT slušalice za slušanje u kasnim satima. ESS ES9018 DAC i digitalni ulazi za su ukljuceni.

1.239 € Kupi

Hrvatska premijera- Davis Acoustics Ariane!

KEF LSX II aktivni zvučnici

Ovaj sveobuhvatni sustav zvucnika u svojoj drugoj generaciji: nadograden za isporuku uravnoteženijeg zvuka. Jednostavno streamajte bilo što ukljucujuci AirPlay 2, Chromecast, Spotify i Tidal ili neprimjetno povežite LSX II sa svojim prijenosnim racunalom, TV-om i mnogim drugim uredajima.

1.389 € Kupi

Preporučamo

Automobili

Automobili prijatelji prirode

Budućnost autoindustrije leži u održivosti - od korištenja recikliranih materijala do čiste energije

Autonet.hr 16. svibnja 2024.

Obrazovanje

BUG[2] specijal

Darujemo besplatno digitalno izdanje o informatičkim studijima

Bug.hr 8. svibnja 2024.

Trenutno najpovoljnije cijene na tržištu

Vezano

Umjetna inteligencija

igra konsenzusa

Ideje iz teorije igara podižu pouzdanost jezičnih modela

Mladen Smrekar nedjelja

App dana

Umjetna inteligencija

Claude - poznati chatbot konačno je dostupan i na području EU, a to znači i u Hrvatskoj

Matija Gračanin 15. svibnja 2024.

Umjetna inteligencija

Hinjeno suosjećanje, iskreno manipuliranje

Suosjećajnost umjetne inteligencije

Igor Berecki 1. svibnja 2024. 3

Istraživanja

Indeks umjetne inteligencije 2024.

AI pobjeđuje ljude u osnovnim zadacima i zato nam trebaju nova mjerila

Mladen Smrekar 18. travnja 2024. 26

Istraživanja

MEGAVERSE

Usporedna analiza velikih jezičnih modela

Mladen Smrekar 15. travnja 2024. 1

Umjetna inteligencija

simulacije

Holodeck, sustav za generiranje interaktivnih 3D okruženja

Mladen Smrekar 14. travnja 2024.