Τι είναι οι τάξεις ιστογράμματος;

Οι κλάσεις ιστογράμματος είναι εύρη τιμών που περιέχουν σημεία δεδομένων σε μια κατανομή συχνότητας ή πίνακα ακατέργαστων δεδομένων. Αναφέρονται επίσης ως διαστήματα, κάδοι ή πλάτη κάδου. Σε ένα ιστόγραμμα, έναν τύπο ραβδωτού γραφήματος, αυτές οι κλάσεις απεικονίζονται ως κάθετες στήλες όπου το ύψος της στήλης υποδεικνύει τον αριθμό των σημείων δεδομένων που περιέχονται στο εύρος της κλάσης. Συνήθως, η επιλογή της κλάσης ιστογράμματος γίνεται για να βελτιωθεί η οπτική αναπαράσταση στατιστικών δεδομένων ή τάσεων.

Όταν υπάρχει μεγάλος όγκος δεδομένων προς εμφάνιση, ένα ιστόγραμμα είναι ιδιαίτερα χρήσιμο για την απεικόνιση του σχήματος της κατανομής του. Ένα ολόκληρο εύρος δεδομένων αναλύεται σε διαστήματα και ο αριθμός των σημείων δεδομένων που εμπίπτουν σε καθένα μετράται για να δώσει τη συχνότητα κλάσης. Το εύρος ή το πλάτος του διαστήματος καθορίζει τον αριθμό των κλάσεων ιστογράμματος και επηρεάζει το σχήμα του γραφήματος.

Εάν το διάστημα είναι πολύ μεγάλο, οι σημαντικές πληροφορίες ενδέχεται να παραλειφθούν λόγω του ότι οι τάξεις είναι υπερβολικά περιεκτικές. Όταν η επιλογή του πλάτους του διαστήματος είναι πολύ στενή, η συχνότητα χαμηλής κατηγορίας μπορεί να δώσει αδικαιολόγητη σημασία σε αυτό που είναι στην πραγματικότητα μια τυχαία παραλλαγή. Υπάρχουν πολλές μέθοδοι για τον ορισμό κατάλληλου αριθμού κλάσεων ιστογράμματος για ένα σύνολο δεδομένων.

Σύμφωνα με τον κανόνα του Sturgis, ο αριθμός των κλάσεων πρέπει να είναι κοντά στο ημερολόγιο βάσης 2 του αριθμού των σημείων δεδομένων, συν ένα. Χρησιμοποιώντας τον κανόνα του Rice, ο αριθμός των κατηγοριών που ορίζονται πρέπει να είναι διπλάσιος της κυβικής ρίζας του αριθμού των σημείων δεδομένων. Όποια μέθοδος και αν χρησιμοποιείται για την επιλογή του αριθμού των κλάσεων ιστογράμματος, θα πρέπει να δοκιμαστούν πολλά διαφορετικά πλάτη για να ελεγχθεί η ευαισθησία του σχήματος του ιστογράμματος στο μέγεθος της κλάσης. Ο σωστός αριθμός κλάσεων είναι αυτός που απεικονίζει με μεγαλύτερη ακρίβεια την κατανομή των δεδομένων.

Με τον κατάλληλο αριθμό κλάσεων ιστογράμματος για μια σειρά δεδομένων, θα πρέπει να προκύψει μια ουσιαστική γραφική αναπαράσταση που να επιτρέπει σαφή ερμηνεία. Ένα ιστόγραμμα πρέπει να δείχνει το κέντρο και την εξάπλωση των δεδομένων, τυχόν λοξότητα ή ασυμμετρία δεδομένων και ακραίες τιμές ή σημεία δεδομένων που εμφανίζονται εκτός του αναμενόμενου εύρους τιμών. Ο τρόπος λειτουργίας, ή η τιμή που εμφανίζεται πιο συχνά, θα πρέπει να είναι εμφανής καθώς και οι ομαδοποιήσεις που μπορεί να υποδεικνύουν μια πολλαπλή τροπικότητα. Η ανάλυση ιστογράμματος μπορεί επίσης να υποδεικνύει σφάλματα στη διαδικασία συλλογής δεδομένων.

Τα ιστογράμματα που χρησιμοποιούνται εδώ και πολύ καιρό στα οικονομικά και στις κοινωνικές επιστήμες, γίνονται πιο οικεία στις γραφικές οθόνες των ηλεκτρονικών ειδών ευρείας κατανάλωσης. Η ψηφιακή φωτογραφία είναι ιδιαίτερα ανοιχτή στη χρήση τους, με πολλές φωτογραφικές μηχανές να ενσωματώνουν έγχρωμο ιστόγραμμα για να υποδείξουν την ισορροπία λευκού και την έκθεση. Ένα ιστόγραμμα ψηφιακής φωτογραφίας μπορεί επίσης να εμφανίζει pixel ως τάξεις ιστογράμματος που σχεδιάζονται σε αποχρώσεις του γκρι.