Curenje LLaMA pokrenulo novu revoluciju u generativnoj UI

Izrada neuralnih mreža otvorenog koda omogućuje istraživačima da pogledaju "ispod haube" i shvate zašto sustavi ponekad na pitanja odgovaraju na nepredvidive načine, ali i budi razne strahove

Mladen Smrekar petak, 23. lipnja 2023. u 20:26

Umjetna inteligencija uskoro će naučiti dovoljno da egzistencijalno ugrozi čovječanstvo, strahuju neki kjpargeter

Ne posustaje pomama za generativnom umjetnom inteligencijom, započeta pojavom OpenAI-jevog ChatGPT-a. No dok velike tehnološke tvrtke kao što su OpenAI i Google privlače pozornost šire javnosti, i zaradu od svojih UI alata, prava revolucija događa se u tišini, u nizu malih kompanija. I dok velike kompanije često skrivaju svoje adute, mali igrači ne odustaju od otvorenosti i principa otvorenog koda, piše Nature.

Veliki jezični modeli

To posebno vrijedi za velike jezične modele (LLM), umjetne neuronske mreže gladne podataka koje pokreću niz tekstualno orijentiranih softvera, uključujući chatbotove i automatizirane prevoditelje. Tako na primjer njujorški Hugging Face na svojoj web stranici navodi više od 100 LLM-ova otvorenog koda.

BLOOM je višejezični sustav otvorenog koda namijenjen istraživačima 📷 BigScience — BLOOM je višejezični sustav otvorenog koda namijenjen istraživačima BigScience

Ova tvrtka koja razvija alate za izradu aplikacija pomoću strojnog učenja, najpoznatija po biblioteci transformatora za obradu prirodnog jezika i platformi koja omogućuje dijeljenje modela strojnog učenja i skupova podataka, lani je predvodila BigScience, koaliciju volontera istraživača i akademika koja je razvila model BLOOM višejezični sustav otvorenog koda namijenjen istraživačima.

Mogućnosti LLaMA

Pokret otvorenog koda novi je poticaj dobio u veljači kad je na internetu procurio pristup modelu LLaMA koji je Meta prvotno namijenila samo odabranim vanjskim programerima. Dostupnost LLaMA-e promijenila je igru za istraživače umjetne inteligencije. Puno je manji od drugih LLM-ova, što znači da ne zahtijeva velike računalne kapacitete za ugošćavanje prethodno obučenog modela ili za njegovu prilagodbu za specijalizirane aplikacije, kao što je pomoćnik u matematici ili chatbot korisničke službe.

#aMUSTread Meta LLaMA: How the open-source community is changing artificial intelligence. https://t.co/wVZszxBPzW
— Carmen Beatriz Fernández (@carmenbeat) June 20, 2023

Najveća verzija LLaMA-e sastoji se od 65 milijardi parametara: varijabli postavljenih tijekom početnog, općenamjenskog treninga neuronske mreže. To je manje od polovice BLOOM-ovih 176 milijardi parametara i djelić od 540 milijardi parametara Googleovog najnovijeg LLM-a, PaLM2.

Daljnji eksperimenti

Samo nekoliko tjedana nakon što je procurio LLaMA, programeri su uspjeli proizvesti verzije koje mogu stati na prijenosna računala, čak i na Raspberry Pi, golo računalo veličine kreditne kartice. Hugging Face pak primarno koristi LLaMA i ne planira forsirati BLOOM-2.

Verzija LLaMA stana na i najmanja prijenosna računala kao što je minijaturni Raspberry Pi 📷 Raspberry Pi — Verzija LLaMA stana na i najmanja prijenosna računala kao što je minijaturni Raspberry Pi Raspberry Pi

Programeri otvorenog izvornog koda sad eksperimentiraju s načinima još većeg smanjenja LLaMA-e. Neke tehnike uključuju zadržavanje broja parametara uz smanjenje preciznosti; riječ je o pristupu koji ne uzrokuje neprihvatljive padove performansi. Drugi pak smanjuju broj parametara treniranjem zasebne, manje neuronske mreže na odgovorima velike, unaprijed obučene mreže.

Pogled "ispod haube"

Istraživači umjetne inteligencije godinama su rutinski svoj kod činili otvorenim i svoje rezultate objavljivali u spremištima kao što je arXiv. Izrada neuronskih mreža otvorenog koda omogućuje istraživačima da pogledaju "ispod haube" i pokušaju razumjeti zašto sustavi ponekad na pitanja odgovaraju na nepredvidive načine i prenose pristranosti i toksične informacije iz podataka na kojima su obučavani.

Model BLOOM je 117 dana obučavan na superračunalu Jean Zay 📷 Jean Zay — Model BLOOM je 117 dana obučavan na superračunalu Jean Zay Jean Zay

No, unatoč procvatu politike otvorenog izvornog koda, samo je nekoliko tvrtki sposobno stvoriti jezične modele od nule. Razvoj zahtijeva goleme resurse; procjenjuje se da su GPT-4 i Googleov PaLM 2 koštali desetke milijuna dolara vrijednog računalnog vremena, a da bi se došlo do "glavnog jela", da se poslužimo kulinarskom alegorijom, potreban je i niz "tajnih sastojaka" o kojima programeri šute, baš kao što kuhari čuvaju svoje recepte.

Strah od dostupnosti

Sve su glasniji i kritičari koji smatraju kako široka dostupnost snažnih jezičnih modela povećava mogućnost da oni završe u krivim rukama. I da će umjetna inteligencija uskoro postati dovoljno inteligentna da egzistencijalno ugrozi čovječanstvo pa joj u tome ne bi trebalo dodatno pomagati, zaključuje Nature svoj pregled velikih jezičnih modela i politike otvorenog koda.

Vezano

📢 Uštedi 130€

META Quest 2

339,99€ ~~469,99€~~ Kupi

📢 Uštedi 10%

Samsung monitor

116,99€ ~~129,99€~~ Kupi

📢 NOVO!

EPOCH Galaxia

899,99€ Kupi

Ronis Hi-Fi slušaonica na Velesajmu.

Rezervirajte svoj termin!

Želite doživjeti zvuk visoke kvalitete? Pridružite nam se u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Svestrani high-end Hi-Fi DAC.

TANGENT DAC II D/A pretvarač i pretpojačalo

Bluetooth 5.0 APTX Hd Sabre, Stereo Audio DAC, USB: 192kHz / 32-bit PCM (Stereo) – podržava DSD audio, 64/128/256/512, Opticki ulaz: 192kHz / 24-bit, Opticki izlaz: 192kHz / 24-bit

279 € Best Buy

Throw-back na ranije JBL receivere.

JBL SA750 integrirano pojačalo

Frekvencijski odziv 20Hz – 20kHz ± 1dB, nominalna osjetljivost: 1V, impedancija ulaza: 10kΩ, snaga izlaza na oba kanala pogonjena: 120W na 8Ω, 220W na 4Ω

2.499 € ~~2.999 €~~ Akcija

Za audio šmekere.

ACOUSTIC ENERGY AE109² zvučnici (par)

2.5-smjerni samostojeci zvucnik, frekvencijski raspon: 41Hz - 26kHz, crosssover frekvencija: : 275Hz, 2.5kHz, impedancija: 6 ohma, osjetljivost: 89dB, Peak SPL: 115dB, maksimalna snaga: 175W

692 € ~~769 €~~ Akcija

Kućno kino na samo dva zvučnika.

MARANTZ Stereo 70s receiver

75W po kanalu, 8K HDMI, dvostruki izlazi za subwoofer, HEOS® Built-in Multi-Room Streaming,

989 € Kupi

High-end performanse u kompaktnom dizajnu.

Stereo pojačalo PARASOUND HINT 6

2 x 160 W 8 Ohma. Burr Brown analog resistor ladder volume control. Dimmable front panel volume display. Updated USB receiver is Plug and play with Windows 10 and MAC.

3.999 € ~~4.999 €~~ Akcija

Aktivni subwoofer s jednostavnim podešavanjem.

Subwoofer ACOUSTIC ENERGY AE108²

Snaga: 150W, frekvencijski raspon: 30Hz - 110kHz, sealed box, Peak SPL: 105dB

539 € ~~599 €~~ Akcija

Poboljšana disperzija i veća snaga.

Zvučnici ACOUSTIC ENERGY AE300

2-sistemski zvucnici sa 130mm mid-bass jedinicama drivera, novim keramickim aluminijskim sandwich konusom i 28mm aluminijskim visokotoncem, frekvencijski raspon 45Hz -30kHz, osjetljivost 86 dB, vršni SPL 112dB, snaga 100W, crossover frekvencija 2.8kHz, impedancija 6 ohma.

719 € ~~799 €~~ Akcija

Best buy 8K receiver.

DENON AVR-X2800H AV receiver

7-kanalno pojačalo, 150 W po kanalu, 8K video, HEOS ugrađena tehnologija, Dolby Atmos® i DTS:X®, plus Dolby Surround i DTS Neural:X

799 € Kupi

San svakog audiofila.

Slušalice SENNHEISER HD 650

Max SPL: 103 dB na 1kHz/1 Vrms, THD: 0,05%, Impedancija: 300 ohm, Frekvencijski odaziv: 10 Hz - 39kHz, 6,35 mm TRS + 3,5 mm adapter

499 € Kupi

Idealan subwoofer za moderan dom.

BLUESOUND NODE streamer

Bluesound NODE otkljucava svijet hi-res streaming glazbe i multiroom zvuka kako bi stvorio moderan dodatak postojecim HiFi sustavima ili vašem omiljenom setu zvucnika s napajanjem.

650 € Best buy

Sinkronizirani light show