Seks je tema svakog desetog razgovora s chatbotom

Američki i arapski istraživači pročešljali su teme milijun razgovora s 25 velikih jezičnih modela na 150 svjetskih jezika

Mladen Smrekar petak, 13. listopada 2023. u 08:22
Korisnici 'chatbot' rado koriste za razmjenu erotskog sadržaja, eksplicitnih seksualnih fantazija i scenarija igranja uloga 📷 julos
Korisnici 'chatbot' rado koriste za razmjenu erotskog sadržaja, eksplicitnih seksualnih fantazija i scenarija igranja uloga julos

Chatbotovi su dizajnirani i obučeni da odgovore na svako vaše pitanje. To može biti bilo što, od vrtlara koji vam daje savjet o tome koliko sunčeve svjetlosti treba biljci do generatora koda. No,čini se da puno ljudi također koristi chatbotove za eksplicitan sadržaj. Tako barem pokazuju rezultati velike studije, objavljene u preprint repozitoriju radova Arxiv.  

Glavne teme komunikacije

Istraživači nekoliko američkih sveučilišta od Berkeleyja, preko San Diega i Carnegie Mellona do Stanforda te Sveučilišta umjetne inteligencije Mohamed Bin Zayed (MBZUAI) iz Ujedinjenih Arapskih emirata proučili su načine na koji ljudi stupaju u interakciju s velikim jezičnim modelima (LLM) u scenarijima iz stvarnog svijeta. U svom radu predstavili su LMSYS-Chat-1M, skup podataka velikih razmjera koji sadrži milijun razgovora 210.000 korisnika s chatbotovima na 150 svjetskih jezika. 

Popis najčešćih upita koje korisnici upućuju 'chatbotovima' 📷 UC Berkeley, UC San Diego, Carnegie Mellon University, Stanford, MBZUAI
Popis najčešćih upita koje korisnici upućuju 'chatbotovima' UC Berkeley, UC San Diego, Carnegie Mellon University, Stanford, MBZUAI

Rasprave o softverskim pogreškama i rješenjima glavna su tema komunikacije s chatbotovima, a slijede ih upiti o UI alatima, dizajnu softvera i programiranju. Ostali upiti uključuju savjete o zemljopisu i putovanju, zahtjeve za sažimanjem tekstova te stvaranjem i poboljšanjem poslovnih strategija.

Seksualne fantazije

No, premda je većina korisničkih upita bila povezana s kodiranjem i softverom, uočen je i značajan broj drugih tema koje spadaju u kategoriju "zahtjeva za eksplicitnim i erotskim pričanjem priča" i "eksplicitnih seksualnih fantazija i scenarija igranja uloga". Dapače, takav eksplicitni sadržaj tema je svakog desetog upita kojeg ljudi postavljaju chatbotovima

Problem nisu savjeti za ljubavne probleme nego eksplicitni sadržaj koji prolazi ispod radara 📷 upklyak
Problem nisu savjeti za ljubavne probleme nego eksplicitni sadržaj koji prolazi ispod radara upklyak

Ovi razgovori mogu poslužiti kao bogat izvor za ispitivanje sigurnosnih pitanja LLM-a, kažu istraživači koji navode kako API za moderiranje može točno otkriti vrlo toksičan sadržaj, ali mnogi potencijalno štetni razgovori ostaju neoznačeni. Interesting Engineering još je početkom ljeta pisao o tome kako se Meta LLaMA otvorenog koda koristi za izradu sexbota. Jedan od njih navodno je korišten za prikaz fantazija silovanja i zlostavljanja na internetu.

Primjeri necenzuriranih razgovora koje su korisnici vodili s 'chatbotovima' 📷 UC Berkeley, UC San Diego, Carnegie Mellon University, Stanford, MBZUAI
Primjeri necenzuriranih razgovora koje su korisnici vodili s 'chatbotovima' UC Berkeley, UC San Diego, Carnegie Mellon University, Stanford, MBZUAI

Istraživači razmatraju mogućnost kvartalnog osvježavanja informacija i potiču druge kolege da istraže teme iznesene u skupu podataka za obuku boljih modela, privatnosti podataka i sigurnosti umjetne inteligencije.