Qwen Chat (Qwen 2.5-Max) - Moćan ekosustav modela
Qwen je čitava obitelj modela otvorena kôda iza kojih stoji gigant Alibaba, a ubrzo nakon što je DeepSeek prouzročio pravu malu revoluciju, objavljen je Qwen 2.5, koji je u više benchmarka uspio nadmašiti i sâm DeepSeek, opet potvrđujući Kinu kao ozbiljnog izazivača zapadnih velikih jezičnih modela. Štoviše, Qwen se nameće kao vrlo moćan chatbot koji nudi solidne mogućnosti kojima uspijeva nadmašiti konkurenciju, a opremljen je čak i generiranjem slika i videozapisa, potpuno besplatno…

Qwen 2.5 još je jedan model koji samo dodatno pokazuje da se zahuktava ubrzani razvoj rješenja u području umjetne inteligencije, i to ne samo u smislu suparništva Kine i SAD-a, nego i lokalnog suparništva među općim kineskim modelima. Naime, ubrzo nakon što je objava DeepSeeka prilično odjeknula unutar tehnološke zajednice, Alibaba je učinila dostupnom najnoviju i dosad najsposobniju iteraciju svojeg velikog jezičnog modela Qwen 2.5. Prema javno dostupnim podacima, na benchmarcima kao što su Arena-Hard, LiveBench, LiveCodeBench, MMLU i GPQA-Diamond, ovaj model uspijeva nadmašiti i sâm DeepSeek (misli se na model DeepSeek-V3), nudeći pritom i prilično zanimljive mogućnosti, a svakako vrijedi istaknuti da su arhitekturno ta dva modela vrlo slična (koristi se MoE arhitektura, kombinira SFT i RLHF, dok je predtreniranje obavljeno na 20 trilijuna tokena).