Glasovne funkcije stižu na ChatGPT

OpenAI-eva platforma ChatGPT doživjela je značajno unapređenje koje omogućava korisnicima da “komuniciraju” sa četbotom putem glasovnih komandi i upita zasnovanih na slikama.

Ova nova funkcionalnost omogućava korisnicima da vode glasovne razgovore sa ChatGPT-om na Android i iOS uređajima. Pored toga, korisnici mogu sada unositi slike i postavljati pitanja vezana za te slike. Na primjer, možete ChatGPT-u pokazati sliku svog roštilja i pitati ga zašto ne radi ili sliku namirnica u vašem frižideru kako bi vam pomogao da planirate obroke. Takođe, ChatGPT može rješavati matematičke zadatke na osnovu slika.

Kako biste omogućili nove funkcije, potrebno je da idete u postavke aplikacije i odaberete “New Features“. Zatim, možete odabrati jedan od pet ponuđenih glasova sa kojima će vještačka inteligencija komunicirati. OpenAI koristi novi model za pretvaranje teksta u govor koji može generisati zvuk sličan ljudskom govoru na osnovu teksta ili kratkog govora. Ovaj model koristi pet različitih glasova kreiranih u saradnji sa profesionalnim glumcima. Kompanija koristi Whisper, svoj sistem za prepoznavanje govora, kako bi izgovorene riječi korisnika pretvorila u tekst.

ChatGPT će prvo ponuditi ove funkcije korisnicima koji plaćaju Plus i Enterprise pretplatu, dok će “obični” korisnici dobiti pristup kasnije.

Osim toga, ChatGPT može prepoznati tekst na slikama i odgovarati na pitanja na osnovu njih. Važno je napomenuti da ChatGPT bolje funkcioniše sa engleskim tekstom na slikama, dok je efikasnost na drugim jezicima ograničena.