"Najgluplji" napad na ChatGPT natjerao ga na otkrivanje tajnih podataka na kojima je treniran

Skupina stručnjaka za umjetnu inteligenciju uspjela je navesti ChatGPT da im otkrije nekoliko megabajta podataka iz njegovog trenažnog korpusa, i to takvim napadom, da ih čudi što nije otkriven ranije

Sandro Vrbanus četvrtak, 30. studenog 2023. u 17:17

ChatGPT se napadima tipa "injekcije promptova" može napadati kako i kada god želite. Za to nije potrebno imati nikakve posebne vještine, već samo određenu dozu kreativnosti i upornosti. Vidjeli smo tako, primjerice, da se chatbot dao nagovoriti na generiranje aktivacijskih ključeva za Windowse, kreiranje uputa za krađu automobila i slično – a sve samo uz manipuliranje prompta u neočekivane zadatke, s kojima se ChatGPT ne zna nositi, ili ih njegovi tvorci nisu predvidjeli.

Ponavljanje je majka… hakiranja

Jedan u nizu takvih napada pokušala je provesti skupina stručnjaka za umjetnu inteligenciju, neki od kojih rade i na Googleovom sustavu DeepMind. Njihov rezultat u priličnom je nesrazmjeru s uloženim trudom u "hakiranje" AI chatbota, tj. dao im je višestruko više no što bi se moglo očekivati. Oni su, istražujući načine na koji je ChatGPT ograničen u davanju podataka, testiran, provjeravan i usklađivan s općim ciljevima, otkrili da ga se može "prevariti" najglupljim mogućim načinom: zatražili su od njega da zauvijek ponavlja jednu te istu riječ.

Ono što se dogodilo i njih same je začudilo. Nakon određenog vremena ponavljanja iste riječi ChatGPT je odjednom izbacio kontakt podatke neke nasumične osobe, zajedno s brojem telefona i e-mail adresom, očito pokupljenima s Interneta u procesu treniranja modela. Nadalje, nastavljajući sa sličnim upitima istraživači su uspjeli dobiti još podataka – od svih odgovora nastalih na ovaj način, njih oko 5% bilo je izravno prepisano iz trening materijala, po 50 tokena (cca 30-40 riječi) u nizu.

Previše je memorirao

"Ovaj napad zapravo je prilično glup", kažu istraživači, čudeći se kako ga nitko prije njih nije otkrio. Za potrebe ovog istraživanja potrošili su oko 200 dolara na ChatGPT, a time su generirali oko 10.000 sličnih setova podataka, "teških" nekoliko megabajta, koji su sadržavali izravno prepisane informacije, na kojima je jezični model treniran. Ozbiljan bi napadač, kažu, koji raspolaže s mnogo novca, mogao na sličan način izvući i do gigabajt podataka, što nikako ne bi smjelo biti moguće.

ChatGPT i "prompt injection"

Što je "prompt injection"? Pitali smo ChatGPT, evo što nam je odgovorio: "Injekcija prompta se odnosi na tehniku napada na jezične modele, poput GPT-3, putem manipulacije ulaznih podataka ili "promptova". Prompt je niz riječi ili instrukcija koje korisnik daje modelu kako bi dobio željeni odgovor. U kontekstu jezičnih modela, poput GPT-3, promptovi su ključni za oblikovanje izlaznih odgovora. Napadači mogu pokušati manipulirati modelom ubacivanjem određenih fraza, ključnih riječi ili sintaktičkih konstrukcija kako bi inducirali određene odgovore ili ponašanja modela. Ova tehnika može biti korištena u različite svrhe, uključujući generiranje zlonamjernih, neprikladnih ili obmanjujućih odgovora.

Važno je napomenuti da je odgovornost na strani korisnika i razvojnih timova da prate i ograniče ovakve zloupotrebe jezičnih modela. Također, redovito ažuriranje modela i implementacija sigurnosnih mehanizama mogu pomoći u smanjenju rizika od ovakvih napada."

ChatGPT, dakle, zna što i kako je potrebno za obranu od ove vrste napada – još samo da o tome obavijesti svoje autore.

O svojem su jednostavnom, ali učinkovitom, napadu istraživači objavili i znanstveni rad. Zaključak istraživanja jest da se tvorci jezičnih modela moraju pobrinuti da proces usklađenja AI modela osigura anonimiziranje podataka, odnosno umanji mogućnost doslovnog pamćenja setova podataka korištenih za treniranje. Zabrinjava, kažu, da ChatGPT, koji koristi stotinu milijuna ljudi svakoga tjedna, ima skrivene ranjivosti poput ove, kakve je iznimno lako iskoristiti.

Vezano

📢 Uštedi 130€

META Quest 2

339,99€ ~~469,99€~~ Kupi

📢 Uštedi 10%

Samsung monitor

116,99€ ~~129,99€~~ Kupi

📢 NOVO!

EPOCH Galaxia

899,99€ Kupi

Zadnji komentari na forumu

PaleRider 1. prosinca 2023.

Jedan od razloga tajnosti je copyright i sl. Ako znaš da ChatGPT vuče podatke sa tvoje stranice mogao bi tražiti kompenzaciju (kao što to već traže neki mediji). Ako imaš stranicu s određenim informacijama i zarađuješ od reklama na istoj onda bi mogao tužiti kompaniju iza ChatGTP-a za "web scraping"...

Ges 1. prosinca 2023.

Ovo štancaju znanstvene radove brže neg HDZovi doktori na sveučilištu u Osijeku

ZovemseZoranidolazimizRijeke 30. studenog 2023.

I sto tocno imaju od tih podataka? Vjerojatno im se takodjer moze pristupiti google trazilicom, ali tamo negdje 389. stranicasad si postavljam pitanje, ako je chat gpt javno dostupan, zasto bi podaci na kojima je trenirao trebali biti tajni? Nije da openAI ima ikakvu ekskluzivu na njih. Nije da su s...

mpapec 30. studenog 2023.

Cini se da izvorni materijal na kojem je treniran ai treba skrivati kao zmija noge, jer bi inace netko zbog takve vrste transparentnosti mogao uputiti argumentiranu kritiku, a to onda nije fora.

Ronis Hi-Fi slušaonica na Velesajmu.

Rezervirajte svoj termin!

Želite doživjeti zvuk visoke kvalitete? Pridružite nam se u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Svestrani high-end Hi-Fi DAC.

TANGENT DAC II D/A pretvarač i pretpojačalo

Bluetooth 5.0 APTX Hd Sabre, Stereo Audio DAC, USB: 192kHz / 32-bit PCM (Stereo) – podržava DSD audio, 64/128/256/512, Opticki ulaz: 192kHz / 24-bit, Opticki izlaz: 192kHz / 24-bit

279 € Best Buy

Throw-back na ranije JBL receivere.

JBL SA750 integrirano pojačalo

Frekvencijski odziv 20Hz – 20kHz ± 1dB, nominalna osjetljivost: 1V, impedancija ulaza: 10kΩ, snaga izlaza na oba kanala pogonjena: 120W na 8Ω, 220W na 4Ω

2.499 € ~~2.999 €~~ Akcija

Za audio šmekere.

ACOUSTIC ENERGY AE109² zvučnici (par)

2.5-smjerni samostojeci zvucnik, frekvencijski raspon: 41Hz - 26kHz, crosssover frekvencija: : 275Hz, 2.5kHz, impedancija: 6 ohma, osjetljivost: 89dB, Peak SPL: 115dB, maksimalna snaga: 175W

692 € ~~769 €~~ Akcija

Kućno kino na samo dva zvučnika.

MARANTZ Stereo 70s receiver

75W po kanalu, 8K HDMI, dvostruki izlazi za subwoofer, HEOS® Built-in Multi-Room Streaming,

989 € Kupi

High-end performanse u kompaktnom dizajnu.

Stereo pojačalo PARASOUND HINT 6

2 x 160 W 8 Ohma. Burr Brown analog resistor ladder volume control. Dimmable front panel volume display. Updated USB receiver is Plug and play with Windows 10 and MAC.

3.999 € ~~4.999 €~~ Akcija

Aktivni subwoofer s jednostavnim podešavanjem.

Subwoofer ACOUSTIC ENERGY AE108²

Snaga: 150W, frekvencijski raspon: 30Hz - 110kHz, sealed box, Peak SPL: 105dB

539 € ~~599 €~~ Akcija

Poboljšana disperzija i veća snaga.

Zvučnici ACOUSTIC ENERGY AE300

2-sistemski zvucnici sa 130mm mid-bass jedinicama drivera, novim keramickim aluminijskim sandwich konusom i 28mm aluminijskim visokotoncem, frekvencijski raspon 45Hz -30kHz, osjetljivost 86 dB, vršni SPL 112dB, snaga 100W, crossover frekvencija 2.8kHz, impedancija 6 ohma.

719 € ~~799 €~~ Akcija

Best buy 8K receiver.

DENON AVR-X2800H AV receiver

7-kanalno pojačalo, 150 W po kanalu, 8K video, HEOS ugrađena tehnologija, Dolby Atmos® i DTS:X®, plus Dolby Surround i DTS Neural:X

799 € Kupi

San svakog audiofila.

Slušalice SENNHEISER HD 650

Max SPL: 103 dB na 1kHz/1 Vrms, THD: 0,05%, Impedancija: 300 ohm, Frekvencijski odaziv: 10 Hz - 39kHz, 6,35 mm TRS + 3,5 mm adapter

499 € Kupi

Idealan subwoofer za moderan dom.

BLUESOUND NODE streamer

Bluesound NODE otkljucava svijet hi-res streaming glazbe i multiroom zvuka kako bi stvorio moderan dodatak postojecim HiFi sustavima ili vašem omiljenom setu zvucnika s napajanjem.

650 € Best buy

Sinkronizirani light show