Sophia, novi način optimiziranja, obučava velike jezične modele u pola vremena

Inženjeri sa Stanforda razvili su novi način optimiziranja predobučavanja velikih jezičnih modela koji je dvostruko brži od trenutnih pristupa

Mladen Smrekar utorak, 4. srpnja 2023. u 19:52

Kombinacija procjene zakrivljenosti i clippinga omogućila je optimizaciju u upola manjem broju koraka i upola kraćem vremenu rawpixel

ChatGPT i druge aplikacije koje se oslanjaju na velike jezične modele (LLM) sve se više koriste i privlače veliku pažnju medija. Tim prostorom dominira nekoliko velikih, dobro financiranih tehnoloških tvrtki jer je prethodna obuka (pretraining) ovih modela iznimno skupa, minimalno 10 milijuna dolara, a često i desetke puta više. Kako bi to promijenili, istraživači Sveučilišta Stanford odlučili su poboljšati trenutne LLM metode optimizacije. Rezultat je novi pristup nazvan Sophia koji prepolovljuje vrijeme prije treninga.

Procjena zakrivljenosti

LLM modeli imaju milijune ili čak milijarde parametara, a jedno od njihovih svojstava je njihova zakrivljenost. Program za optimizaciju koji može procijeniti tu zakrivljenost, mogao bi i predobučavanje učiniti učinkovitijim. Problem je u tome što je procjena zakrivljenosti postojećim metodama izuzetno teška i skupa. To je i jedan od razloga zašto trenutno najsuvremeniji pristupi optimizaciji predobučavanja, poput Adama i njegovih izvedenica, odustaju od procjene zakrivljenosti.

Nakon punih devet godina postignut je prvi značajan napredak u predobučavanju jezičnog modela 📷 arXiv — Nakon punih devet godina postignut je prvi značajan napredak u predobučavanju jezičnog modela arXiv

Umjesto da se zakrivljenost procjenjuje u svakom koraku optimizacije, istraživači sa Stanforda odlučili su proces učiniti učinkovitijim smanjujući broj ažuriranja i dizajnirali Sophiju koja će zakrivljenost parametara procjenjivati svakih 10 koraka. To je, pokazali su eksperimenti, bio dobar potez. Baš kao i clipping kojim su riješili problem netočne procjene zakrivljenosti.

Sophia poboljšava stabilnost prije treninga i neosjetljiva je na hiperparametre 📷 arXiv — Sophia poboljšava stabilnost prije treninga i neosjetljiva je na hiperparametre arXiv

U konačnici, ova kombinacija procjene zakrivljenosti i clippinga omogućila je optimizaciju u upola manjem broju koraka i upola kraćem vremenu nego što je to bilo potrebno Adamu.

Sophijin izbor

"Sofijina prilagodljivost razlikuje je od Adama kojemu je teže rukovati parametrima s heterogenim zakrivljenjima jer ih ne može predvidjeti", objašnjavaju istraživači koji su prvi značajan napredak u predobučavanju jezičnog modela postigli punih devet godina nakon standarda koji je postavio Adam.

A New Approach Trains Large Language Models in Half the Time https://t.co/wO1c2S4HRs
— fshines (@frankshines) July 3, 2023

Istraživači se nadaju da će korištenjem Sophije razviti veći LLM te da će je primijeniti i na druga područja strojnog učenja kao što su modeli računalnog vida ili multimodalni modeli.

Vezano

📢 Uštedi 130€

ASUS VivoBook 15 OLED

Svestrani laptop s briljantnim zaslonom!

669,99 799,99 Kupi

📢 Akcija!

Logitech gaming periferija

Podigni razinu igre!

Od 29,99€ Kupi

📢 Fly so high!

DJI Mini 2 SE

Snimi nezaboravne kadrove!

289,99 Kupi

Ronis Hi-Fi slušaonica na Velesajmu.

Rezervirajte svoj termin!

Želite doživjeti zvuk visoke kvalitete? Pridružite nam se u našoj Hi-Fi slušaoni Ronis Velesajam i iskusite zvuk najpoznatijih svjetskih Hi-Fi brendova.

Kupi

Jasan i uravnotežen dinamički raspon.

ACOUSTIC ENERGY AE1 ACTIVE zvučnici

Aktivni zvucnici snage 2 x 50 W s integriranim A/B pojacalom i aktivnim mrežama za filtriranje, frekvencijskog raspona 40Hz-25kHz +/-6dB

1.096 € ~~1.290 €~~ Akcija

40 godina naslijeđa u kompaktnom zvučniku.

MARTIN LOGAN Motion Foundation B1 zvučnici

Frekvencijski odziv: 48 Hz - 23 kHz ± 3 dB, preporučena snaga pojačala: 15 - 100 watts, osjetljivost: 89 dB, impedancija: 5 ohm

809 € Kupi

3D iskustvo Dolby Atmosa.

SONOS BEAM Gen 2 soundbar

Streamajte glazbu, radio, podcaste i još mnogo toga kada je televizor iskljucen. Beznaporni setup s samo dva kabla i pametno Trueplay™ podešavanje.Fleksibilnost za proširenje vašeg sustava tijekom vremena te uživanje u pravom surround zvuku i multi-room slušanju.

589 € Kupi

Bookshelf zvučnici u vintage stilu.

WHARFEDALE Super Denton zvučnici

Frekvencijski odziv: 52-20 000 Hz (±3dB), preporučena snaga pojačala: 25-120 watta osjetljivost: 87 dB, nazivna impedancija: 6 ohma

1.200 € Kupi

Bogatstvo streaming opcija.

NAD C 700 pojačalo

Hibridno digitalno UcD pojacalo, 80 W po kanalu u 8/4 ohma, Zvuk visoke razlucivosti do 24-bit/192 kH ,BluOS multi-room,Apple AirPlay 2, Spotify Connect i Tidal Connect

1.499 € Kupi

Dolby Atmos, DTS:X, 8K Ultra HD i HEOS built-in streaming.

MARANTZ Cinema 60 AV receiver

7.2 kanalni AV prijamnik, 100W po kanalu, Dolby Atmos, DTS:X, Audyssey MultEQ XT, HEOS, AirPlay, Wi-Fi, Bluetooth

1.049 € Kupi

Napredna 8K HDMI veza.

DENON DRA-900H mrežni receiver

Network stereo receiver, dvokanalno pojacalo visokih performansi, napredna 8K HDMI veza, ugraden HEOS®. Visokokvalitetno iskustvo slušanja i 8K video s 2-kanalnog mrežnog stereo prijemnika.

739 € Kupi

Masivni JBL Pro zvuk.

JBL Xtreme 4 prijenosni zvučnik

Baterija max 24h, vodootponi dizajn, frekvencijski raspon: 44 Hz - 20k Hz, SNR> 80 dB, Bluetooth 3.5

445 € Novo

Snažan newcomer.

MARSHALL Woburn III BT bežični zvučnik

Frekvencijski raspon: 35–20,000 Hz, podesive kontrole basova i visokih tonova, Wi-Fi, 3.5 mm input, RCA input, HDMI input

569 € Kupi

Zabava uz snažan bas i dinamičnu rasvjetu.

JBL PartyBox 110 party zvučnik

Nova, poboljšana verzija vrlo popularnog prijenosnog party zvucnika pored vec poznatog JBL Original Pro zvuka i dinamicnih svjetlosnih efekata uskladenih s glazbom donosi još bolju zaštitu od kapljica vode

349 € ~~366 €~~ Akcija

JBL Signature zvuk s poboljšanim basom.

JBL Live 660NC over-ear slušalice

Uz njihovo aktivno prigušivanje buke možete uživati u slušanju glazbe po cijele dane bez ometajucih ambijentalnih zvukova. Istodobno, znacajke TalkThru i Smart Ambient omogucuju vam održavanje kontakta sa svojim prijateljima i okolinom.

156 € ~~179 €~~ Akcija

Nabolje pojačalo na tržištu.

ARCAM Radia A15 integrirano pojačalo

A15 ima Bluetooth s AptX adaptivnom tehnologijom koja omogucuje slušanje formata sve do 24-bitne HD rezolucije koje možete streamati s mobitela ili tableta. Možete ga spojiti i na BT slušalice za slušanje u kasnim satima. ESS ES9018 DAC i digitalni ulazi za su ukljuceni.

1.239 € Kupi

Hrvatska premijera- Davis Acoustics Ariane!

KEF LSX II aktivni zvučnici

Ovaj sveobuhvatni sustav zvucnika u svojoj drugoj generaciji: nadograden za isporuku uravnoteženijeg zvuka. Jednostavno streamajte bilo što ukljucujuci AirPlay 2, Chromecast, Spotify i Tidal ili neprimjetno povežite LSX II sa svojim prijenosnim racunalom, TV-om i mnogim drugim uredajima.

1.389 € Kupi