Ce este transcrierea automată?

Transcrierea automată este procesul de producere a unei transcriere scrisă a vorbirii vorbite sau înregistrate prin utilizarea computerelor și fără intervenția umană directă. Transcrierea automată precisă necesită un software de transcriere de înaltă calitate și un dispozitiv care poate primi cu acuratețe intrările auditive. În general, este, de asemenea, necesar ca vorbirea sau înregistrarea care urmează să fie transcrisă să fie în mod rezonabil lipsită de distorsiuni și interferențe din cauza zgomotului de fond. De asemenea, s-au încercat transcrierea muzicii cu ajutorul computerelor care rulează software specializat de transcriere. Transcrierea muzicii implică scrierea notelor unei piese muzicale date, în special atunci când nu există o notație preexistentă pentru acea muzică, așa cum este cazul solo-urilor improvizate.

Un software de transcriere bun este necesar pentru transcrierea automată de succes. Software-ul este responsabil pentru procesarea intrării auditive, separarea unui flux continuu de limbă în cuvinte separate, recunoașterea acestor cuvinte și reprezentarea corectă a acestora în text. Un eșec în orice etapă a acestui proces are ca rezultat, în general, o transcriere care diferă oarecum de materialul sursă. Un software bun de transcriere automată ar trebui să fie capabil să recunoască diferențele subtile dintre cuvinte similare și să compenseze diferitele stiluri și viteze de vorbire. Accentele dificil de înțeles tind să fie problematice chiar și pentru cel mai bun software de transcriere.

Unii oameni folosesc software de transcriere automată, deoarece preferă dictarea în loc să tasteze direct sau să scrie textul lor. Unele forme de software de transcriere automată sunt deosebit de bune în acest scop, deoarece pot „învăța” vocile persoanelor ale căror cuvinte le transcriu. În astfel de cazuri, transcrierea automată nu este utilizată pentru a crea transcrieri ale vorbirii dintr-o varietate de surse diferite, astfel încât nu este nevoie ca software-ul să fie deschis la o mare varietate de modele de vorbire. Permiterea acestui proces de optimizare, care poate avea loc în timpul utilizării extinse a software-ului de către o singură persoană sau în timpul unei calibrări preliminare, poate crește foarte mult acuratețea și viteza potențială a dictarii.

Din păcate, computerele nu sunt la fel de potrivite pentru a recunoaște în mod consecvent și precis vorbirea umană precum oamenii. Ei nu pot, de exemplu, să folosească indicii contextuale dacă nu înțeleg un anumit cuvânt. Ca atare, este adesea necesar ca un om să corecteze transcrierile create prin transcriere automată. Erorile minore de formatare și diverse erori de transcriere sunt, în multe cazuri, frecvente, cu excepția cazului în care vorbirea transcrisă este foarte clară. Cu toate acestea, utilizarea transcripției computerizate poate constitui rapid o bază solidă pentru o transcriere care necesită doar intervenție umană limitată înainte de transmitere sau utilizare.