Google je bez velike najave predstavio novu aplikaciju koja bi mogla promijeniti način na koji koristimo diktiranje na pametnim telefonima. Riječ je o alatu koji uz pomoć vještačke inteligencije pretvara govor u prirodan, uređen tekst, i to čak i bez internet konekcije.
Nova aplikacija, nazvana AI Edge Eloquent, za sada je dostupna na iOS uređajima i dolazi kao eksperimentalno rješenje zasnovano na Gemma modelu za prepoznavanje govora. Njena ključna prednost je mogućnost lokalnog rada, nakon preuzimanja modela na uređaj, svi podaci ostaju na telefonu, bez potrebe za slanjem u cloud.
Za razliku od standardnih aplikacija za diktiranje, Eloquent ide korak dalje. Umjesto doslovnog prepisivanja govora, aplikacija automatski uklanja poštapalice poput „hm“ ili „uh“, ispravlja prekide u rečenicama i oblikuje tekst tako da zvuči prirodnije i profesionalnije. Rezultat je sadržaj koji više liči na pažljivo napisan tekst nego na sirovi transkript.
Tokom diktiranja korisnici mogu pratiti tekst u realnom vremenu, dok aplikacija nakon pauze dodatno „ispegla“ sadržaj. Dostupne su i opcije za prilagođavanje – od izdvajanja ključnih tačaka, preko skraćivanja teksta, do njegove formalizacije, što ovu aplikaciju čini korisnom i za poslovnu komunikaciju.
Iako podržava potpuno lokalni rad, aplikacija nudi i mogućnost povezivanja sa cloud servisima, gdje se za dodatnu obradu koriste napredni Gemini modeli. Takođe, može povući termine i imena iz Gmail naloga, a korisnicima je omogućeno i dodavanje vlastitih riječi i izraza.
Zanimljiva funkcija je i pamćenje istorije diktiranja, uz mogućnost pretrage ranijih zapisa, kao i uvid u statistiku, uključujući brzinu govora i ukupan broj izgovorenih riječi.
Ovim potezom Google ulazi u sve konkurentnije tržište aplikacija za pretvaranje govora u tekst, gdje već postoje rješenja poput Wispr Flow. Razvoj vještačke inteligencije dodatno ubrzava popularnost ovakvih alata, koji postaju sve precizniji i praktičniji za svakodnevnu upotrebu.







