Analiza vorbirii este o tehnică computerizată utilizată pentru a analiza conținutul vorbirii. Nu este doar un instrument de conversie de la vorbire la tehnologie. În schimb, este conceput pentru a detecta modele în vorbire, inclusiv conținut și ton.
Cea mai simplă utilizare a analizei vorbirii este de a măsura cât de des sunt folosite anumite fraze. Înainte de analiza vorbirii, acest lucru era posibil doar prin transcrierea unei înregistrări, apoi folosind un computer sau căutare manuală pentru a căuta anumite fraze. Cu analiza vorbirii, un sistem computerizat poate fi preprogramat pentru a „asculta” un anumit cuvânt și poate chiar produce informații în timp real.
Există mai multe utilizări pentru o astfel de tehnologie. O companie cu un call center ar putea analiza conversațiile pe care personalul le are cu clienții pentru a detecta modele în reclamații. De exemplu, în timp ce jurnalele de apeluri pot arăta că un anumit produs provoacă o mulțime de plângeri sau interogări, analiza vocală poate arăta că un anumit aspect al produsului, cum ar fi o linie din instrucțiuni, este menționat frecvent. O autoritate de aplicare a legii sau un serviciu de securitate ar putea analiza apelurile telefonice pe care le monitorizează pentru a vedea dacă o anumită expresie este menționată de suspecți.
Analiza vorbirii mai sofisticate poate fi folosită pentru a analiza tonul și chiar contextul. De exemplu, o companie de telemarketing va ține, de obicei, evidența procentului de apeluri pe care le efectuează care au ca rezultat o vânzare, dar nu va avea neapărat statistici care să arate de ce oamenii au refuzat oferta. Analiza tonului ar putea arăta că numărul de persoane care răspund cu un ton supărat este disproporționat de mare la un anumit moment al zilei. Acest lucru poate sugera că problema nu este atât de mult faptul că produsul este neatractiv, ci mai degrabă că oamenii sunt enervați că sunt sunați după o anumită oră și sunt mai probabil să fie ostili unei încercări de vânzare, indiferent de produs.
Există mai multe tipuri diferite de analiză a vorbirii, fiecare aducând un plus de precizie rezultatelor și crescând atât timpul necesar pentru scanarea vorbirii, cât și cantitatea de vorbire necesară pentru a detecta un model. Cel mai simplu tip este fonetic, care descompune vorbirea în sunete individuale. Deși nu este sofisticat, acest lucru facilitează căutarea de noi fraze fără a fi nevoie să rescanați discursul de la zero. Localizarea cuvintelor cheie caută cuvinte întregi încă de la început. Recunoașterea continuă a vorbirii cu un vocabular mare urmărește să transcrie în mod eficient tot discursul, astfel încât o întreagă conversație să fie disponibilă pentru analiză.