Citirea pe buze nu este o formă nouă de comunicare: este un instrument principal al comunității surzilor, ca să nu mai vorbim de o abilitate utilă pentru transmiterea de mesaje într-o petrecere zgomotoasă sau peste capul copiilor. Cu toate acestea, o nouă formă de tehnologie încearcă să mecanizeze această metodă veche de comunicare. Citirea automată a buzelor, cunoscută și sub denumirea de citire automată a vorbirii, este o ramură în creștere a tehnologiei de recunoaștere a vorbirii. În teorie, prin monitorizarea mișcărilor buzelor unui vorbitor și a altor elemente conexe, programele de calculator special concepute pot interpreta mesajele verbale chiar și atunci când interferența zgomotului sau alte obstacole interzic ca vocea umană să fie auzită corect.
De obicei, citirea automată a buzelor necesită un videoclip al difuzorului. Formele și ritmurile formate de buze sunt adesea cei mai importanți factori în interpretare, dar o varietate de alte mișcări pot ajuta și la descifrarea mesajului vorbitorului. Expresiile feței și mișcările capului pot fi factori determinanți. Dacă este disponibil orice sunet util, procesul de citire automată a buzelor este facilitat în mod semnificativ, deoarece indicii de context din porțiunea audibilă pot sugera cuvinte inaudibile sau fragmente de vorbire.
Dezvoltarea tehnologiei de citire automată a buzelor se bazează pe capacitatea de a identifica cuvinte izolate care folosesc aceleași mișcări ale buzelor de fiecare dată când sunt rostite. Lip Geometry Estimation (LGE) este unul dintre cele mai avansate sisteme informatice existente care monitorizează și interpretează astfel de modele. Oamenii de știință au dezvoltat un sistem de citire automată a buzelor și de recunoaștere a vorbirii notabil pentru limba olandeză, dar, în general, domeniul are încă destul loc pentru progres.
Citirea automată a buzelor a primit recent un val de interes și atenție datorită implementării sale pe videoclipurile arhivate de acasă ale lui Adolf Hitler. Filmate de Eva Braun în timpul războiului, filmele odată tăcute au prins viață atunci când tehnologia de recunoaștere a vorbirii a fost aplicată în filmare. Indiferent dacă interpretările sunt sau nu complet corecte, programul de citire automată a buzelor a oferit o privire asupra unei figuri istorice care, fără îndoială, va crea un interes continuu în domeniul citirii automate a buzelor.