Dom Softver Tehnologija prepoznavanja glasa: korisna ili bolna?

Tehnologija prepoznavanja glasa: korisna ili bolna?

Sadržaj:

Anonim

Jeste li ikad zvali tvrtku da vam pomogne ili plati račun, samo da vas dočeka ugodan snimljeni glas koji želi razgovarati s vama - ali ne može razumjeti ni pola onoga što govorite? Ili možda posjedujete iPhone, a iako se Siri isprva činila kao dobar saveznik, shvatili ste da to ponekad (u redu, budimo iskreni, često) jednostavno ne shvaća? Tehnologija prepoznavanja glasa (VRT), poznata i kao govor u tekst, upada u zajedničku zamku: ima potencijal da bude nevjerojatno cool (i dečko, jesmo li mi za to), ali češće se radi o grickanju zuba vježba u frustraciji.


Jednom kada je ideja koja je pripadala carstvu znanstvene fantastike, prepoznavanje glasa narasla od svog početka 1950-ih, kada je Audijev sistem Bell Laboratories dizajniran za prepoznavanje cifara izgovorenih u jedan glas, do moderne mreže razgovorne elektronike s kojom sada komuniciramo svakodnevno - uz mješovite rezultate.

Da biste razgovarali s ljudima, pritisnite 0

Mnoga današnja poduzeća danas koriste sustave koji se nazivaju interaktivni govorni odgovor (IVR) za obradu poziva korisnika. Najčešća se upotreba koristi za glasovne izbornike, ali neke tvrtke koriste IVR sustave koji mogu pristupiti podacima o korisničkom računu i odgovarati na manja pitanja. Softver izbornika IVR obično ima ograničen vokabular, koji može biti ograničen na "da", "ne" i brojeve. Kompliciraniji sustavi mogu prepoznati riječi i izraze određene za tvrtku.


Ovi sustavi postaju sve popularniji - barem za tvrtke - iz jednostavnog razloga: isplativi su. Prema izvještaju iz Wall Street Journala za 2010. godinu, uobičajeni poziv kupca koji dosegne agenta košta između 3 i 9 USD, dok poziv koji se vodi putem automatiziranog sustava košta samo pet do sedam centi. I, naravno, računalni se programi ne umaraju, nazovu bolesne ili frustriraju kupce (iako kupci zasigurno postaju frustrirani zbog njih!).


Srećom, to ne znači da IVR ljudima oduzima posao - ili barem da svi ljudi nestaju iz pozivnih centara. Ovi pomagači koji omogućuju pristup glasu omogućuju ljudskim predstavnicima službe za korisnike da budu produktivniji usmjeravanjem poziva i odgovaranjem na jednostavna pitanja.


Naravno za ljudske korisnike koji komuniciraju s tim tehnologijama, nije uvijek glatko jedrenje. Tehnologija pomaže poboljšati uobičajene probleme u tehnologiji IVR, poput problema s naglascima, ali otpuštanje automatiziranih sustava i dalje je česta tema na mreži. Pogledajte ovo komedije o dizalu opremljenom prepoznavanjem glasa, što naglašava frustraciju koju smetnje u IVR sustavima mogu proizvesti.

Aplikacije za osobni telefon: Siri, Google Now

Većina ljudi je upoznata s prepoznavanjem glasa za pametne telefone. Iako većina najnovijih modela telefona dolazi s VR-om, njihova popularnost - i notornost - naglo je nabrekao kad je Apple predstavio Siri, blago sarkastičan, glasno aktivirani "osobni asistent" za iPhone 4S 2011. godine. Google je ubrzo stvorio izravnog konkurenta: Google Sada za Android Jelly Bean OS. Oba sustava imaju ženske glasove i sofisticirane značajke prepoznavanja koje omogućuju korisnicima da "razgovaraju" na svojim telefonima koristeći povremeni jezik.


No iako su ovi sustavi znatno sofisticiraniji i funkcionalniji od svojih prethodnika, oni također pokazuju da tehnologija još uvijek ima dug put. Šale zbog Sirijinog neuspjeha postale su popularna internetska mema. Jedan je čovjek čak tužio Apple za lažno oglašavanje u vezi sa Siriinim mogućnostima.


Možda je to razlog zašto je Apple stvorio Siri da bi bio napredan i informativan, VR softver je također malo staložen. Primjerice, ako govorite o jednoj od najzloglasnijih linija inteligencijske tehnologije u povijesti kina iz filma iz 1968. "2001: Svemirska odiseja" - "otvorite vrata zaljeva", Siri će odgovoriti bilo odgovornom linijom iz filma, " Žao mi je (vaše ime), bojim se da ne mogu to učiniti, "ili još sarkastičnije", očigledno da mi agenti obavještajne službe to nikada nećemo živjeti ".


Pozvati vas imenom samo je jedna od funkcija koja pokušava Siri olakšati ljubav, a malo više ljudsku. VR pomoćnik može slijediti glasovne naredbe za upućivanje poziva, diktiranje i slanje tekstova, internetsko traženje informacija, pronalaženje trgovina u blizini, davanje uputa za vožnju i još mnogo toga, bez potrebe da bilo što dodirujete. Telefon istovremeno govori i prikazuje se na zaslonu.


Google Now, VR dio Android platforme Jelly Bean, vrlo je sličan Siri. Sustav nudi iste opsežne mogućnosti prepoznavanja prevodeći povremeni govor u naredbe koje korisnicima omogućavaju upućivanje poziva, slanje tekstova, pokretanje pretraživanja, obavljanje izračuna i pretvaranja, hvatanje definicija riječi, postavljanje alarma, reprodukciju pjesama i dobivanje karata i uputa.


Za osobne glasovne asistente poput Siri i Google Now-a, prednosti su očite. Sve, od pozivanja i slanja poruka do pretraživanja i zabave, brže je i lakše. Samo recite što želite i (većinu vremena) VR aplikacija to prihvati za vas. Zgodna tehnologija VR-a posebno je korisna tijekom vožnje. I dok su mnogi ljudi umanjivali Sirijeve mane, a pisci su tvrdili da je sposobnost Google Now-a da u osnovi vodi živote korisnika obmanjujuća i pomalo uvredljiva, većina ljudi i dalje smatra da su ove futurističke tehnologije prilično cool.


Naravno, aplikacije za osobni telefon poput Siri i Google Now nisu daleko od savršenih - iako zaista pokazuju gdje bi se ta tehnologija mogla uputiti u budućnosti. To znači da ćemo se čak i kad Siri pokaže pogrešan odgovor, vjerojatno smijati i oprostiti joj, znajući da će sljedeća verzija biti puno bolja.

Tamo gdje VR pada

Ako ste ikada naišli na IVR kada ste nazvali tvrtku, možda ste primijetili određene prepreke u komunikaciji. Neki programi koriste robotski glas s tekstom u govor koji pogrešno izgovara riječi i čini stvari teško razumljivima. Drugi imaju problema s osjetljivošću zbog kojih softver ne može obraditi ono što govorite ako ste preglasni, premekani ili ne izgovarate pažljivo.


Uz to, mnogi se i dalje jednostavno ne osjećaju ugodno razgovarajući sa strojem. Ako pokrenete nekoliko pretraga na IVR-u, naići ćete na popise ljudi koji su sastavili načine kako zaobići IVR sustave i doći do "prave osobe". Ova rješenja variraju od "nastavi pritiskati 0 za operatera" do "psovati u stroju dok ne nađe čovjeka". Kao rezultat toga, velik dio nedavnog razvoja IVR sustava vrti se oko toga što ih čini ukusnijima za ljude; čineći glasove simpatičnijima i manje robotiziranima, čineći sustav lakšim za kretanje i davanjem pozivatelju pozivima koliko će vremena trebati od početka do kraja. To sugerira da je bolja tehnologija samo pola bitke ovdje; druga polovica je privikavanje korisnika na razgovor s strojem.

Što budućnost drži

Unatoč tim izazovima, tehnologija prepoznavanja glasa neprestano se poboljšava. Aplikacije poput Siri i Google Now-a - nedostaci i sve - i dalje su neobično impresivne u svojim performansama, a nekoliko tvrtki proširuje VR mogućnosti na druge aplikacije.


Na primjer, Nuance, tvorci Dragon NaturallySpeaking softvera za govor u tekst, već su razvili glasovne kontrole za televizore i automobile, a verzije ove tehnologije ugrađene su u neke Samsungove televizore i SYNC zabavne sustave koji se koriste u određenim Fordovim vozilima.


I dok Google i Apple nastavljaju s pronalaženjem nove upotrebe za tehnologiju prepoznavanja glasa, vjerojatno ćemo sve više razgovarati o svim vrstama svakodnevnih strojeva, od televizora do tostera. I, još jednom, izgleda da je znanstvena fantastika bila u pravu. Samo ćemo se nadati da su ovi pametni pisci bili u krivu zbog jedne stvari. Ako ove strojeve preuzmu, mogli biste biti u velikoj nevolji sljedeći put kad zatražite Siri da "otvori vrata ležišta."

Tehnologija prepoznavanja glasa: korisna ili bolna?