Τι είναι η κατανομή ιστογράμματος;

Η κατανομή ιστογράμματος στις στατιστικές αναφέρεται στα μοτίβα, τα σχήματα και τις θέσεις των μονομεταβλητών γραμμών δεδομένων σε ένα ιστόγραμμα. Το πώς και πού κατανέμονται οι ράβδοι μπορεί να χρησιμοποιηθεί για την ανάλυση και την εξαγωγή συμπερασμάτων σχετικά με τα δεδομένα. Η ανάλυση κατανομής ιστογράμματος είναι σημαντική για τον εντοπισμό χαρακτηριστικών όπως η κανονικότητα των δεδομένων, οι πολυτροπικές κατανομές και τα λοξά δεδομένα.

Το ιστόγραμμα είναι μια μονομεταβλητή εμφάνιση δεδομένων που χρησιμοποιεί ορθογώνια ανάλογα με την περιοχή προς την κατηγορία ή τις συχνότητες bin για να εμφανίσει οπτικά χαρακτηριστικά δεδομένων. Τα σημεία δεδομένων στο ιστόγραμμα είναι οργανωμένα σε bins και η ίδια η κατανομή ιστογράμματος είναι μια οπτική προσέγγιση της κατανομής συχνότητας των δεδομένων ή της συνάρτησης πυκνότητας πιθανότητας. Το σχήμα της διανομής μπορεί να αλλάξει με βάση τον αριθμό των κάδων.

Η ανάλυση κατανομής ιστογράμματος χρησιμοποιείται συχνά ως ποιοτικός έλεγχος για την κανονικότητα των δεδομένων. Παρόλο που υπάρχουν αναλυτικές μέθοδοι για τον προσδιορισμό της κανονικότητας, τα ιστογράμματα μπορούν να χρησιμοποιηθούν για να παρέχουν έναν γρήγορο έλεγχο κοινής λογικής για εξοικονόμηση χρόνου. Εάν τα δεδομένα ιστογράμματος εμφανίζονται χονδρικά ομοιόμορφα και κεντραρισμένα στη μέση τιμή, τα δεδομένα θεωρούνται κανονικά. Αν και γρήγορος και σχετικά εύκολος, αυτού του είδους ο ποιοτικός έλεγχος είναι υποκειμενικός και θα πρέπει να χρησιμοποιούνται αναλυτικές μέθοδοι εάν απαιτείται υψηλότερο επίπεδο ακρίβειας.

Ο προσδιορισμός του εάν ένα σύνολο δεδομένων παρουσιάζει λοξότητα είναι ένας άλλος τρόπος με τον οποίο μπορεί να χρησιμοποιηθεί η ανάλυση κατανομής ιστογράμματος. Η ασυμμετρία δεδομένων ορίζεται ως έντονη ασυμμετρία στα δεδομένα. Η αρνητική λοξή, ή η λοξή προς τα αριστερά, εμφανίζεται σε σύνολα δεδομένων με πολύ λίγες χαμηλές τιμές. Η θετική λοξή, ή λοξή προς τα δεξιά, εμφανίζεται σε σύνολα δεδομένων με λίγες υψηλές τιμές. Η παρατήρηση της κατανομής του ιστογράμματος μπορεί να αποκαλύψει ακραίες τιμές και λοξά δεδομένα.

Εκτός από την αποκάλυψη των χαρακτηριστικών των δεδομένων με έναν μόνο τρόπο λειτουργίας, το σχήμα ενός ιστογράμματος μπορεί επίσης να αποκαλύψει χαρακτηριστικά πολυτροπικών δεδομένων. Τα πολυτροπικά σύνολα δεδομένων περιέχουν περισσότερους από έναν τρόπους λειτουργίας και χαρακτηρίζονται από κατανομές συχνότητας που έχουν περισσότερες από μία κορυφές ή μέγιστα. Οι πολιτικές σχέσεις σε μια πόλη, οι δημοσκοπήσεις έγκρισης και τα μεγέθη του σώματος των μελισσών είναι παραδείγματα συνόλων δεδομένων που μπορεί να είναι πολυτροπικά. Η παρατήρηση του σχήματος του ιστογράμματος και η σημείωση των διαφόρων κορυφών στα πολυτροπικά δεδομένα μπορεί συχνά να παρέχει στον ερευνητή περισσότερη διορατικότητα από ό,τι οι απλοί μονομεταβλητοί στατιστικοί υπολογισμοί.

Η ανάλυση των ιστογραμμάτων και η κατανομή των δεδομένων εξαρτώνται σε μεγάλο βαθμό από τα επιλεγμένα μεγέθη κάδου. Στην πράξη, ο αριθμός των κάδων μπορεί να εκτιμηθεί λαμβάνοντας την τετραγωνική ρίζα του αριθμού των παρατηρήσεων, αν και μπορούν να χρησιμοποιηθούν άλλα μεγέθη κάδων. Για παράδειγμα, ένας δάσκαλος μπορεί να επιλέξει να αναλύσει τους βαθμούς των τεστ επιλέγοντας μεγέθη κάδων που αντικατοπτρίζουν τους βαθμούς γραμμάτων.