Imamo i mi svoj AI jezični alat: zove se Hrvojka i plaćen je 650.000 eura

Središnji državni ured za razvoj digitalnog društva i Filozofski fakultet Sveučilišta u Zagrebu predstavili su portal Hrvojka, nacionalni portal za jezične tehnologije

Sandro Vrbanus četvrtak, 20. srpnja 2023. u 16:27

Središnji državni ured za razvoj digitalnog društva, u suradnji s Filozofskim fakultetom Sveučilišta u Zagrebu, predstavio je nacionalni portal za jezične tehnologije Hrvojka. Projekt je nastao u okviru projekta Instrumenta za povezivanje Europe "Nacionalna platforma za jezične tehnologije". Ukupna vrijednost projekta bila je 4.888.000 kuna (648.750 eura); od čega je Europska komisija sufinancirala 85%.

Što je Hrvojka?

Evo kako izradu i postojanje ovog alata objašnjavaju iz SDURDD-a: "Pokretanjem portala Hrvojka po prvi se puta u državnu upravu uvode jezične tehnologije na temelju umjetne inteligencije, pruža se višejezični pristup javnim sadržajima i uslugama za domaće i strane korisnike, te u konačnici pridonosi standardizaciji jezika javne uprave". Pojednostavljeno rečeno, riječ je o alatu za strojno prevođenje tekstova i internetskih stranica, osnaženome umjetnom inteligencijom.

Ovaj se portal temelji na već postojećoj latvijskoj platformi hugo.lv i rezultatima prethodnoga CEF-projekta "Prevoditelj za predsjedanje Vijećem Europske unije" iz 2020. godine. Tako objedinjena platforma u međuvremenu je doživjela proširenja i omogućila javnoj upravi i javnosti sigurni pristup visokokvalitetnom strojnom prevođenju, integraciju s alatima za računalno potpomognuto prevođenje (Computer Assisted Translation, CAT) i dodatke za trenutačni prijevod mrežnih stranica, pojašnjavaju pokretači Hrvojke.

Čemu zaista služi Hrvojka?

Ovaj alat donosi "profesionalno prevoditeljsko okružje", koje će biti dostupno putem HTML sučelja. Ovaj skup usluga postavljen je kao polazni, ali modularni dizajn Platforme dopušta dodavanje i drugih jezičnih tehnologija kako se za hrvatski jezik budu razvijale u budućnosti, stoji na stranicama projekta. Krajnji cilj je da ovaj portal postane središnja prijevodna infrastruktura koja će pridonijeti kvaliteti prijevoda, standardizaciji jezika javne uprave i smanjenju prijevodnih troškova.

Želite li i sami iskušati kako Hrvojka funkcionira, možete se uputiti na ovu stranicu. Trenutačno je omogućen strojni prijevod između 30-ak jezika, a osim lijepljenja teksta (kao, na primjer, u Google Translate), u njegov prozor možete dovući i datoteku (.docx, .xlsx, .odt, .odp, .ods, .txt) veličine do najviše 10 megabajta, a on će je prevesti na odabrani jezik te isporučiti natrag u istom datotečnom formatu.

Za usluge prevođenja pomoću računala (CAT), kao i za prevođenje web stranica, potrebno je imati korisnički račun, koji se dobiva izravno od SDURDD-a.


NADOPUNA: Nakon objave teksta javili su nam se iz SDURDD-a, sa sljedećim informacijama:

Nacionalni portal za jezične projekte Hrvojka, nastao je u okviru projekta "Nacionalna platforma za jezične tehnologije" (National Language Technology Platform) koji se sufinancira sredstvima Europske unije iz Instrumenta za povezivanje Europe (Connecting Europe Facility, CEF). U projektu sudjeluje pet zemalja: Latvija, Estonija, Malta, Island i Hrvatska, a koordinator projekta je latvijska tvrtka Tilde, vodeći europski inovator u području jezične tehnologije.

Nositelji projekta u ime Hrvatske su Filozofski fakultet Sveučilišta u Zagrebu i Središnji državni ured za razvoj digitalnog društva.

Ukupna vrijednost projekta Nacionalna platforma za jezične tehnologije (National Language Technology Platform) u kojem je sudjelovalo prethodno pet navedenih zemalja iznosi 648.749,00 eura, od čega je za Središnji državni ured za razvoj digitalnog društva, kao hrvatskog partnera koji je bio zadužen za tehničku izvedbu projekta osigurano 62.000,00 eura.

Portal Hrvojka se temelji na postojećoj latvijskoj platformi hugo.lv i rezultatima prethodnoga prevoditelja: “Prevoditelj za predsjedanje Vijećem Europske unije” (https://hr.presidencymt.eu) iz 2020.godine. Svaka je država, partner u projektu, razvijala svoju, nacionalnu inačicu platforme i svaka je pri tome bila dužna razviti prepoznatljivo ime proizvoda kao i pripadajući logotip.

Ime Hrvojka ima karakteristična hrvatska obilježja – bitna je nacionalna komponenta u nazivu, a važno je istaknuti i ime u ženskom rodu. Budući da su sve platforme u zemljama sudionicama projekta zapravo, identične, uz samo ime odabran je vizual - slovo glagoljice koje je prvo poznato pismo kojim su se služili Hrvati.

Ime Hrvojka je zapravo, anagram koji ukazuje na moderan besplatni javni alat za prevođenje, a sastavljen je od Hrvatskog Računalnog Višejezičnog Operativnog Javnog Komunikacijskog Alata.

Platforma, osim strojnog prevođenja, onog što se u javnosti kolokvijalno naziva „Google prevoditelj“, između ostalog nudi siguran i besplatan pristup profesionalnom prevoditeljskom okružju s integriranim tehnološkim bazama podataka i alatom za strojno potpomognuto prevođenje (Computer Assisted Translation, CAT), kao i alat za prijevod mrežnih stranica na jezike Europske unije. Važnost uvođenja Nacionalne jezične platforme Hrvojka, osim praktične uporabe, svakako je i to što je ona prvenstveno alat za jačanje uloge i uporabe hrvatskog jezika u digitalnom okruženju i osiguravanje njegovog opstanka u komunikacijskim kanalima 21. stoljeća, te u podizanju svijesti o važnosti prikupljanja i pohranjivanja jezičnih izvora kao temelja daljnjeg razvoja jezičnih tehnologija za hrvatski jezik.

Hrvojka ne pokušava biti Google prevoditelj već je platforma s više jezičnih alata od kojih je samo jedan strojno prevođenje. Budući da se radi o državama u projektu koje imaju manji broj korisnika svojih jezika očekivano je da će platforma Hrvojka dati bolje rezultate u strojnom prevođenju od drugih dostupnih globalnih alata, osobito kad se radi o prevođenju cjelovitog teksta, a ne pojedinačnih riječi. Prilikom korištenja usluga Hrvojke, treba biti svjestan kako mora postojati i ljudski nadzor, jer su moguće pogreške.

Smatramo da je jako bitna komunikacija između građana i javne uprave za funkcioniranje života na svim razinama u svakoj državi. Izazovi su veliki za učinkovitu komunikaciju s javnom upravom u svakom društvu, a posebice u zemljama s više službenih jezika, sa zastupljenim nacionalnim manjinama, ili višejezične potrebe državne uprave u europskom okruženju s 24 jezika. Krajnji cilj je da ovaj portal postane središnja prijevodna infrastruktura koja će pridonijeti kvaliteti prijevoda, standardizaciji jezika javne uprave i smanjenju prijevodnih troškova.