Ce este transcrierea audio?

Transcrierea audio este procesul de preluare a cuvintelor rostite și de transformare a acestora în text scris. În trecut, o persoană stătea și scria cuvinte pe măsură ce erau rostite. Acum, există înregistrări audio de diferite tipuri și mai multe metode de transcriere. Metodele de înregistrare analogice și digitale vor permite unei persoane care nu este prezentă în timpul convorbirii să transcrie în continuare textul. În plus, multe pachete software vor citi fișierele audio și le vor converti rapid în text, fără a fi nevoie să le redați efectiv.

Timp de mulți ani, transcrierea audio a fost o profesie specializată și plictisitoare. Oamenii care transcriu vorbirea trebuiau să fie prezenți în momentul vorbirii, ceea ce înseamnă adesea că companiile ar trebui să angajeze oameni instruiți în tehnici avansate, cum ar fi stenografia. Acest lucru a limitat, de asemenea, serviciile de transcriere la cei care aveau acces la un transcriptor instruit.

Odată cu inventarea înregistrărilor audio, acest domeniu s-a schimbat dramatic. Cu o înregistrare, transcriptorul poate lucra de oriunde unde ar putea fi livrată înregistrarea. În plus, transcrierea nu mai are nevoie de stenografie, deoarece înregistrarea putea fi inversată și ascultată de mai multe ori. Un singur transcritor putea lucra și pentru o multitudine de clienți simultan, deoarece nu mai avea nevoie să fie prezentă la discursuri.

Odată cu creșterea utilizării computerelor și a vitezei de internet, domeniul transcripției audio a rămas în mare parte același. Fișierele, mai degrabă decât casetele, erau adesea trimise prin e-mail în loc să fie trimise prin poștă normală. Viteza procesului a crescut, dar metodele nu.

Acest lucru s-a schimbat la sfârșitul anilor 90 odată cu utilizarea tot mai mare a software-ului de recunoaștere a vorbirii și dictare. Meseria de transcriere mergea din ce în ce mai mult către asistența computerizată și apoi automatizarea completă. Au apărut pachete software care ar putea citi informațiile din interiorul unui fișier audio și să folosească modelele de unde ale vorbitorului pentru a construi o versiune text a unui discurs. Acest lucru ar dura mai degrabă secunde decât minutele sau orele unui transcriptor uman.

Transcrierea audio automatizată de computer are câteva defecte greu de depășit, dintre care cea mai mare este o relativă lipsă a vorbirii corective. Atunci când un transcriptor uman ascultă text, ea poate corecta mici erori din vorbire pentru a-l face mai lizibil. În timp ce unele transcriere sunt textuale, ceea ce înseamnă că este exact ceea ce a spus persoana, majoritatea nu este. Fără vorbire corectivă, un om va trebui adesea să verifice transcrierea pentru erori înainte de a fi folosită.

Celălalt defect comun al transcripției audio bazate pe computer constă în însăși vorbirea oamenilor. Deoarece oamenii au o gamă uriașă de tonuri și modele atunci când vorbesc, crearea unui program de calculator care poate citi și traduce cu precizie întreaga gamă este excepțional de dificilă. Aceasta înseamnă că o anumită cantitate de eroare este comună în aproape toate programele de transcriere. Cel mai obișnuit mod de a rezolva acest defect este prin vorbire învățată, în care programul și un singur vorbitor lucrează suficient de mult împreună încât programul să se concentreze pe tiparele unei singure persoane.