Šta sve može novi GPT-4o

Kompanija Open AI predstavila je multimodalni model generativne AI GPT-4o (o=omni), kao novi veliki korak ka prirodnijoj interakciji između čovjeka i računara.

Ovaj jezički model vještačke inteligencije učiniće ChatGPT još pametnijim i jednostavnijim za korištenje.

GPT-4o je sposoban da analizira bilo koju kombinaciju teksta, zvuka, slike i videa u realnom vremenu i emituje multimedijalni odgovor u realnom vremenu.

Odgovara izuzetno brzo, na audio unose u roku od samo 232 milisekunde, što je jednako brzini ljudskog odgovora tokom razgovora.

GPT-4o još bolje analizira slike i zvuk nego prethodni modeli, a još jedna sjajna novina je da može čak da prepozna emocije u glasu korisnika, te da odlično komunicira na 50 različitih jezika.

Tehnološka direktorka Open AI Mira Murati izjavila je da je ovo prvi ogroman iskorak s ciljem postizanja jednostavnijeg korištenja.

Pojasnila je da će ažurirana verzija ChatGPT-a imati i sposobnost pamćenja, odnosno sjećanja, što znači da može učiti iz prethodnih razgovora sa korisnicima.

Sam Altman, izvršni direktor Open AI, ranije je najavio da je to što spremaju “magija” i plod napornog rada za koji vjeruju da će se dopasti korisnicima.