Kineski DeepSeek preko noći postao ozbiljan rival američkim AI kompanijama
Unutar Metinih odjela za umjetnu inteligenciju vlada izvanredno stanje. Direktor infrastrukture Matthew Oldham i njegovi AI timovi ozbiljno su zabrinuti zbog novog konkurenta na području umjetne inteligencije...
DeepSeek, AI model razvijen od strane kineskog fonda rizičnog kapitala, pokazuje potencijal da nadmaši performanse nadolazećeg modela Llama i istraživači umjetne inteligencije u Meta Platformsu su u panici, javlja TheInformation.
DeepSeek dostigao i nadmašio konkurente
High-Flyer Capital Management iz Hangzhoua iznenadio je cjelokupnu AI industriju predstavljanjem DeepSeeka. Evaluacije neovisnih istraživačkih institucija, iskustva korisnika te intervjui sa šest istraživača iz vodećih američkih AI kompanija potvrđuju da je ovaj model dostigao, a u nekim aspektima i nadmašio, sposobnosti sustava koje su razvili Meta, OpenAI i Anthropic.
Meta kreira specijalističke timove
Meta je na ovu situaciju reagirala formiranjem četiri specijalizirana tima: dva se bave analizom DeepSeekove metodologije treniranja i operativne učinkovitosti, treći istražuje podatkovne setove korištene za razvoj modela, dok četvrti proučava mogućnosti restrukturiranja Metinih modela prema DeepSeekovoj arhitekturi. Situacija je posebno složena za Metu jer su, za razliku od DeepSeeka, značajno investirali u strategiju otvorenog koda za svoje AI modele.
Uspjeh i utjecaj "preko noći"
Tržišni utjecaj DeepSeeka već je značajan. Model je dostupan za besplatno preuzimanje te putem cloud API-ja po cijeni koja predstavlja tek djelić troškova konkurentskih rješenja. Mobilna chatbot aplikacija zauzela je drugo mjesto među besplatnim aplikacijama u Apple Storeu, neposredno iza ChatGPT-a. Uspjeh modela priznao je i OpenAI-jev istraživač Noam Brown, ističući DeepSeekovu sposobnost postizanja iznimnih rezultata uz optimalno korištenje računalnih resursa.
Utjecaj DeepSeeka vidljiv je i šire. Together AI, platforma specijalizirana za implementaciju AI modela otvorenog koda, zbog rastućeg interesa korisnika bilježi dnevno udvostručenje zahtjeva za integraciju DeepSeeka. Manje tvrtke poput SuperFocusa razmatraju prelazak na DeepSeek, privučene njegovim superiornim performansama i ekonomičnošću.
Ipak, problem: iz Kine je
Problem je ipak za neke kinesko podrijetlo DeepSeeka. Model sadrži programska ograničenja vezana uz osjetljive teme, a dodatnu dimenziju predstavljaju političke implikacije, posebice u odnosu na novu administraciju koja tek definira odnos s Kinom oko utjecaja kineske tehnologije.
Meta, naravno, javno ne govori o panici i održava optimističan ton. Njihov glasnogovornik Jon Carvill ističe važnost Llame za svijet AI sustava otvorenog koda i najavljuje nova poboljšanja s dolazećom Llamom 4.