Ce este deformarea dinamică a timpului?

Deformarea dinamică a timpului (DTW) implică o metodă de calcul, numită algoritm, pentru a compara sunete, videoclipuri și grafice care pot fi similare, dar mostrele din care pot avea diferențe subtile. Calculele formulează de obicei o reprezentare liniară a eșantionului și măsoară diferențele în funcție de timp. Diferitele elemente ale unui eșantion pot fi mapate pe o grilă pentru a identifica asemănările, în timp ce comenzile pentru funcții folosesc adesea simboluri pentru a identifica fiecare variabilă. Recunoașterea vorbirii, de exemplu, folosește uneori deformarea dinamică a timpului pentru a potrivi cuvintele, chiar dacă sunt rostite la viteze diferite sau anumite părți sunt pronunțate diferit.

Multe programe de recunoaștere a vorbirii folosesc deformarea dinamică a timpului, deoarece oamenii vorbesc adesea la ritmuri diferite. Anumite sunete vocale pot fi anunțate diferit în funcție de emoții sau de alți factori. Unele programe pot recunoaște cuvintele rostite indiferent cine vorbește. Din acest motiv, de obicei nu este eficient să adunăm distanțele în intervale de timp pentru a compara sunete. Cu DTW, sunt analizate diferite puncte specifice timpului pentru fiecare semnal; aceste distanțe sunt calculate pe o grilă care se întinde de la stânga jos la dreapta sus.

Asemănările în părțile corespunzătoare ale două mostre pot fi măsurate folosind distanța Levenshtein. Literele sunt folosite pentru a reprezenta schimbările dintre o sursă și alta. Soluția algoritmului este de obicei un număr mai mare cu cât cele două mostre sunt mai diferite. Acest concept este adesea folosit pentru recunoașterea vorbirii, precum și pentru verificarea ortografică și analiza materialului genetic.

În unele măsurători, modificările de frecvență pot compensa capacitatea de deformare dinamică a timpului. Semnalele pot fi calculate în așa fel încât forma lor să fie utilizată indiferent de frecvență. Semnalele modulate pot pune, de asemenea, o problemă, dar o grilă care calculează distanțele dintre segmentele de linie în loc de puncte poate compensa.

Alinierea secvenței este în general matematică și sunt necesare unele abilități de programare pe computer pentru a o înțelege pe deplin. Algoritmii dinamici de deformare a timpului depind de unele condiții de bază pentru a calcula în mod realist diferențele dintre probele audio sau vizuale. Considerând un eșantion ca o cale de-a lungul unei grile, algoritmul urmează adesea reguli, cum ar fi calea nu se poate întoarce și că este măsurată pas la un moment dat. Pe lângă formatul din stânga jos spre dreapta sus, măsurătorile sunt limitate la locații apropiate de o linie diagonală. Valorile prea abrupte sau puțin adânci sunt adesea ignorate, deoarece pot cauza erori în măsurarea finală.