Novost iz kompanije Meta je alat baziran na generativnoj vještačkoj inteligenciji, koji uz audio snimak u trajanju od dvije sekunde generiše govor na drugom jeziku.

Uz pomoć snimka dugog dvije sekunde Voicebox omogućava generisanje audio klipova putem sinteze govora.

Ova funkcionalnost omogućava multilingvalno djelovanje, što znači da Voicebox može generisati govor na drugom jeziku dok obrađuje zadati uzorak.

Voicebox omogućava korisnicima da unesu audio uzorak i odlomak teksta na jednom od šest jezika: engleskom, španskom, portugalskom, francuskom, njemačkom i poljskom. Zatim, AI tehnologija preobrađuje i čita tekst na željenom jeziku. Ovo omogućava korisnicima da dobiju odgovor u audio formatu, da generišu tekst u govoru ili da promijene dio govora koji nije dobro generisan zbog ometanja koje je napravila spoljašnja buka.

Voicebox koristi uzorak glasa koji se nalazi u zadatom audio klipu kako bi generisao sličan zvuk. Ova tehnologija pruža napredno rješenje za reprodukciju i manipulaciju glasovnih podataka, otvarajući vrata novim mogućnostima u oblasti sinteze i obrade govora.

Šta sve ovo može da donese u budućnosti? Ljudi bi mogli da pošalju glasovnu poruku na bilo kom jeziku, iako ga ne znaju. Ili bi slabovide osobe mogle da podese da se tekstualne poruke koje im šalju njihovi prijatelji čitanju njihovim glasom. Ili da svoje audio zapise uređuju da budu bolji.

Moguće su i brojna podmetanja, za šta iz Meta-e kažu da su svjesni, pa rade i na načinima da se spriječe potencijalne zloupotrebe.