Τι είναι ένα Corpus ομιλίας;

Το σώμα ομιλίας, γνωστό και ως προφορικό σώμα, είναι μια συλλογή ομιλιών που διατηρούνται σε μορφή ήχου ή κειμένου. Αυτές οι συλλογές είναι χρήσιμες για την ανάπτυξη λογισμικού ομιλίας και τη διεξαγωγή γλωσσικών μελετών. Οι δύο ποικιλίες του σώματος ομιλίας είναι ο αυθόρμητος λόγος και ο αναγνωσμένος λόγος.
Είναι σημαντικό να ορίσουμε τι σημαίνουν οι λέξεις «ομιλία» και «corpus». Ο λόγος περιλαμβάνει συλλογές σκέψεων και γεγονότων, συνήθως σε προφορική μορφή. Κάποιος μπορεί επίσης να δει οποιαδήποτε προφορική έκφραση ως ομιλία. Ένα corpus, με τη σειρά του, αναφέρεται σε μια επίσημη συλλογή από διάφορες πληροφορίες.

Οι χρήστες γενικά δημιουργούν ένα σώμα ομιλίας είτε μέσω ηχογραφήσεων είτε μέσω μεταγραφών που βασίζονται σε κείμενο. Οι εγγραφές μπορούν να γίνουν μέσω τεχνολογιών αποθήκευσης ήχου και να αποθηκευτούν — συχνά ως αρχεία MP3 σε ηλεκτρονικές βάσεις δεδομένων — για τη δημιουργία ενός σώματος. Ένας μεταγραφέας, από την άλλη πλευρά, μετατρέπει τον προφορικό λόγο σε γραπτή μορφή, η οποία στη συνέχεια συντάσσεται με άλλες μεταγραφές.

Οποιοσδήποτε τύπος ομιλίας μπορεί να βρεθεί σε ένα σώμα ομιλίας, αλλά τέτοιες βάσεις δεδομένων γενικά χωρίζονται σε δύο κατηγορίες. Η πρώτη, αυθόρμητη ομιλία, περιέχει μη επισημοποιημένες ομιλίες που μπορεί να εκφωνήσει ένα άτομο, όπως αυτές που βρίσκονται σε συνομιλίες ή στην προφορική αφήγηση. Οι αναγνωσμένες ομιλίες, ωστόσο, έχουν μια πιο επισημοποιημένη και προσχεδιασμένη δομή. Τα παραδείγματα μπορεί να περιλαμβάνουν πολιτικές ομιλίες, εκπομπές ειδήσεων και αναγνώσεις ακουστικών βιβλίων. Ορισμένες ποικιλίες μπορεί να εξαρτώνται από το συγκεκριμένο πλαίσιο, όπως οι συνεντεύξεις.

Ένα σημαντικό πλεονέκτημα των εργαλείων σώματος ομιλίας είναι η πρακτική χρησιμότητά τους στη δημιουργία λογισμικού που βασίζεται στην ομιλία. Για παράδειγμα, πολλοί υπολογιστές και άλλες ηλεκτρονικές συσκευές διαθέτουν δυνατότητες αναγνώρισης ομιλίας ως επιλογή, όπως ανάγνωση πληκτρολογημένου κειμένου, μετατροπή προφορικών λέξεων σε κείμενο ή αναγνώριση ομιλητή με μοναδικά φωνητικά χαρακτηριστικά. Εξαγωγές από ένα σώμα ομιλίας μπορεί να βοηθήσουν στην ενίσχυση αυτής της τεχνολογίας εφαρμόζοντας μαθηματικά βασισμένα σύνολα στατιστικών που ονομάζονται ακουστικά μοντέλα σε κάθε μεμονωμένο ήχο. Επιπλέον, οι βάσεις δεδομένων μπορούν να βοηθήσουν στην ανάπτυξη ηχητικών κασετών εκμάθησης γλωσσών.

Αυτές οι λειτουργίες συνδέονται με μια άλλη εφαρμογή για ένα σώμα ομιλίας. Δηλαδή, οι μελετητές μπορούν να πάρουν αυτά τα διατηρημένα αρχεία ήχου ή γραπτά και να μελετήσουν τις λεπτές γραμματικές παραλλαγές που περιλαμβάνουν τη γλώσσα. Επομένως, ένα σώμα ομιλίας μπορεί να χρησιμεύσει ως πολύτιμο εργαλείο για την εκμάθηση σχετικά με την προφορά, τη σειρά λέξεων και άλλα γλωσσικά μοντέλα. Οι ερευνητές μπορούν να συγκρίνουν περαιτέρω ομοιότητες και διαφορές σε διάφορες τοπικές διαλέκτους και γλώσσες εάν δημιουργήσουν μια συλλογή με πολλές γλώσσες ή ένα πολυγλωσσικό σώμα. Η αξιολόγηση των σωμάτων που περιλαμβάνει ομιλία είναι μια εξειδικευμένη ερευνητική συγκέντρωση γνωστή ως γλωσσολογία σωμάτων και η μηχανογραφημένη εφαρμογή της ονομάζεται υπολογιστική γλωσσολογία.

Πολλές βάσεις δεδομένων μεταγραφής περιλαμβάνουν σημειώσεις ή ετικέτες που περιέχουν πληροφορίες σχετικά με τα μεμονωμένα στοιχεία σε ένα κομμάτι κειμένου. Αυτή η διαδικασία ονομάζεται σχολιασμός. Στη διαδικασία της αφαίρεσης, οι γλωσσολόγοι θα τεκμηριώσουν και θα μεταφράσουν διάφορους όρους σε μια ομιλία. Μια τέτοια εισαγωγή μπορεί να είναι χρήσιμη εάν ένα άτομο επιθυμεί να μάθει για άγνωστους πολιτισμούς μέσω κειμένων. Το τελικό βήμα της μελέτης του σώματος περιλαμβάνει ανάλυση ή εξαγωγή συγκρίσεων και θεωρητικών ιδανικών από μια συλλογή στοιχείων ομιλίας.