Iskušali smo najnoviji hit iz AI svijeta – automatsko generiranje podcasta

Podcasti su sveprisutni i vrlo popularni, autora je mnogo, slušatelja još više… Od sada, uz Googleove jezične modele, baš svatko može pokrenuti podcast, a pritom ne treba gotovo nikakvu opremu

Sandro Vrbanus utorak, 1. listopada 2024. u 12:32

NotebookLM, Googleov servis pogonjen njihovim jezičnim modelima Gemini, ovoga je ljeta postao globalno dostupan, dobio multimodalne mogućnosti i razne funkcije vezane uz dubinsko istraživanje tema. Osnovna namjena ovog je servisa da istraživačima i znanstvenicima bude od pomoći kod "dubokog uranjanja" u određenu tematiku, tako što će umjesto njih pročitati velike količine tekstova te vrlo brzo postati ekspertom za temu. Nakon toga u stanju je izrađivati sažetke, provjeravati činjenice, pomoći pri izradi studija i slično.

Svatko može biti podcaster

No, nova mogućnost Audio Overview postala je popularna u kratko vrijeme, jer omogućava da se bilo koji dokument pretvori u zvučni zapis razgovora o toj temi između dvaju sugovornika. Praktički, riječ je o automatiziranom stvaranju pojedinih epizoda podcasta, čija se tema vrti oko zadanih materijala. Rezultat NotebookLM-a su zanimljivi razgovori, tek ponekad s "robotskim" prizvukom, koji mogu zainteresirati slušatelja, uvući ga u tematiku te osnovne ideje prenijeti glasom umjesto pisanim tekstom.

NotebookLM kao ulazne materijale može uzeti tekstualne dokumente svih oblika, web stranice, obični tekst ili pak datoteke smještene u oblaku. Nakon toga potrebno je tek kliknuti za početak generiranja i kroz nekoliko minuta dobivate realističan dijalog dvoje ljudi o vašoj temi. Kako ne bismo previše objašnjavali što je u tome toliko fascinantno, pokazat ćemo vam primjerom i dokazati da svatko danas u nekoliko klikova može postati autorom podcasta.

Podcast o našim člancima

U NotebookLM dodali smo kao ulazne podatke dva nedavna članka s našeg Autoneta, koji se bave dolaskom prvog Cybertrucka u Hrvatsku. Članke smo mu dali samo kao hiperlinkove, u originalnom obliku, na hrvatskom jeziku. Nakon par trenutaka jezični model je stvorio sažetak tekstova na engleskom jeziku, a nakon toga trebalo mu je 3-4 minute kako bi stvorio i epizodu podcasta, dugu gotovo 8 minuta. (Želite li ulazne članke poslušati na hrvatskom, na našim stranicama to možete učiniti kroz naš text-to-speech sustav i trebat će vam nešto više od 11 minuta za oba, ali to je klasično čitanje teksta).

U "našem" video podcastu dvoje voditelja na engleskom jeziku odmah kreće s uvodom, objašnjava detalje naučene iz članka, diskutira o njima, izvlači zaključke, daje kontekst, koristi se vokabularom koji nije dio ulaznih tekstova te ističe neke detalje, za koje vjeruje da su zanimljivi slušatelju. Razgovor je prirodan, "voditelji" prenose svoje emocije na prilično realan način, ponekad malo pretjeruju zbog dramatičnog efekta, ponekad jedno drugom objašnjavaju koncepte iz članaka… Ne znamo za vas, ali mi smo impresionirani.

Ulazni članci na hrvatskom nalaze se ovdje: Link1, Link2, a podcast, na temelju njih stvoren u nekoliko klikova,  poslušajte u nastavku.