Τι είναι το Box Plot;

Ένα διάγραμμα πλαισίου ή διάγραμμα κουτιού-και-μουστάκι είναι μια μέθοδος για την οργάνωση αριθμητικών δεδομένων κατά μήκος μιας ενιαίας αριθμητικής γραμμής, η οποία μπορεί να είναι είτε οριζόντια είτε κάθετη. Το πραγματικό πλαίσιο, όταν η πλοκή είναι οριζόντια, βρίσκεται ελαφρώς πάνω από την αριθμητική γραμμή και αποτελείται από τρεις κάθετες γραμμές, που συνδέονται μεταξύ τους με οριζόντιες γραμμές. Τα οριζόντια όρια του πλαισίου αντιπροσωπεύουν το πρώτο και το τρίτο τεταρτημόριο (25ο και 75ο εκατοστημόριο), που χωρίζονται από τη μεσαία γραμμή, που είναι η διάμεσος ή το 50ο εκατοστημόριο των δεδομένων. Και στις δύο πλευρές του πλαισίου, από τη μέση των οριζόντιων γραμμών, εκτείνονται κάθετες γραμμές, που μερικές φορές ονομάζονται μουστάκια. Όταν αυτά φτάνουν τον ελάχιστο και τον μέγιστο αριθμό του συνόλου δεδομένων, καταλήγουν σε μικρότερες οριζόντιες γραμμές, αν και αυτό μπορεί να διαφέρει ελαφρώς ανάλογα με την κατανομή δεδομένων.

Υπάρχουν μερικά σημαντικά στοιχεία που συνθέτουν μια καλή πλοκή πλαισίου και ορισμένοι αριθμοί που πρέπει να γνωρίζουν οι άνθρωποι όταν δημιουργούν αυτά τα γραφήματα. Η πρώτη από αυτές ονομάζεται σύνοψη πέντε αριθμών, που συχνά συντομεύεται ως πέντε αριθμοί. άθροισμα. Αυτή είναι μια λίστα με το πρώτο και το τρίτο τεταρτημόριο, τον διάμεσο και τον ελάχιστο και μέγιστο αριθμό δεδομένων. Σε ορισμένες εφαρμογές, τα άτομα θα πρέπει να τα αναφέρουν κοντά στο οικόπεδο, αν και η ανάλυση ενός γραφήματος με καλή αριθμητική γραμμή μπορεί επίσης να εξαγάγει αυτούς τους αριθμούς κοιτάζοντας τις τρεις οριζόντιες γραμμές και τα τελικά μουστάκια. Δεν είναι ερώτηση κότας/αυγού για το άτομο που σχεδιάζει μια πλοκή επειδή τα πέντε αρ. άθροισμα. πρέπει να χρησιμοποιηθεί για τη δημιουργία της πλοκής.

Οι άνθρωποι πρέπει επίσης να γνωρίζουν έναν αριθμό που ονομάζεται interquartile range (IQR). Αφαιρώντας το πρώτο τεταρτημόριο από το τρίτο τεταρτημόριο προκύπτει το IQR και χρησιμοποιώντας διαφορετικό λογισμικό ή επιστημονικές αριθμομηχανές μπορείτε επίσης να λάβετε αυτόν τον αριθμό και την περίληψη των πέντε αριθμών εισάγοντας όλα τα δεδομένα. Το IQR είναι σημαντικό επειδή οι γραμμές που εκτείνονται από το κουτί συνήθως εκτείνονται μόνο σε 1.5 φορές το IQR. Τα δεδομένα πέρα ​​από αυτό το σημείο υποδεικνύονται με τελείες αντί για συνεχή γραμμή. Αυτές οι τελείες υποδηλώνουν συχνά ότι τα δεδομένα έχουν ακραίες τιμές.

Υπάρχει μια ποικιλία χρήσεων για το οικόπεδο κουτιού. Πολλά διαγράμματα μπορούν να σχεδιαστούν πάνω από μια αριθμητική γραμμή και θα μπορούσαν να συγκρίνουν παρόμοια σύνολα δεδομένων που διαφοροποιούνται από κάποιο σημαντικό παράγοντα. Για παράδειγμα, οι επιστήμονες ή οι στατιστικολόγοι μπορεί να καταγράψουν τον καρδιακό ρυθμό ανδρών και γυναικών και στη συνέχεια να κατασκευάσουν δύο στοιβαγμένα οικόπεδα κουτιών για να αναζητήσουν σημαντικές διαφορές στο εύρος και στα τεταρτημόρια.

Τα διαγράμματα πλαισίου δεν αφορούν τη συχνότητα δεδομένων. Η έλλειψη πρόσθετης κλίμακας (κάθετης ή οριζόντιας) παραλείπει πληροφορίες σχετικά με επαναλαμβανόμενους αριθμούς, το μέγεθος του συνόλου δεδομένων και τους περισσότερους μεμονωμένους αριθμούς. Το άτομο που κοιτάζει ένα διάγραμμα πλαισίου θα κατανοήσει περισσότερο την περίληψη πέντε αριθμών, το εύρος και αν τα δεδομένα έχουν ακραίες τιμές. Το μέγεθος του πλαισίου, η σχέση της μέσης με τα τεταρτημόρια και το μήκος των μουστών μπορεί να δείξει εάν τα δεδομένα είναι λοξά, αλλά δεν μπορούν να μιλήσουν για πράγματα όπως ο μέσος όρος, ο τρόπος λειτουργίας ή η τυπική απόκλιση. Άλλα γραφήματα όπως τα ιστογράμματα μπορεί να είναι πιο χρήσιμα όταν οι άνθρωποι θέλουν να αναπαραστήσουν πράγματα όπως η συχνότητα ή να αντλήσουν καλύτερα οπτικά στοιχεία σχετικά με τη διανομή δεδομένων.