Ce este un Box Plot?

Un diagramă cu casete sau o diagramă cu casetă și mustăți este o metodă de organizare a datelor numerice de-a lungul unei singure linii numerice, care poate fi orizontală sau verticală. Caseta reală, atunci când parcela este orizontală, se află puțin deasupra liniei numerice și este compusă din trei linii verticale, conectate între ele prin linii orizontale. Limitele orizontale ale casetei reprezintă prima și a treia quartile (percentilele 25 și 75), separate prin linia din mijloc, care este mediana datelor sau percentila 50. Pe ambele părți ale casetei de la mijlocul liniilor orizontale, se extind linii verticale, uneori numite mustăți. Când acestea ating numărul minim și maxim al setului de date, se termină în linii orizontale mai mici, deși acest lucru poate varia ușor în funcție de răspândirea datelor.

Există câteva elemente importante care alcătuiesc o diagramă de casetă bună și câteva numere pe care oamenii trebuie să le cunoască atunci când creează aceste diagrame. Primul dintre acestea se numește rezumatul cu cinci numere, adesea abreviat ca cinci num. sumă. Aceasta este o listă de prima și a treia quartile, mediana și numărul minim și maxim de date. În unele aplicații, oamenii vor trebui să le enumere în apropierea diagramei, deși analiza unui diagramă cu o linie numerică bună poate, de asemenea, obține aceste numere uitându-se la cele trei linii orizontale și mustații de sfârșit. Nu este o întrebare de pui/ou pentru persoana care desenează un complot, deoarece cele cinci num. sumă. trebuie folosit pentru a crea intriga.

De asemenea, oamenii trebuie să cunoască un număr numit interval interquartil (IQR). Scăderea primului cuartil din a treia cuartil derivă IQR-ul și, folosind diferite programe software sau calculatoare științifice, puteți obține, de asemenea, acest număr și rezumatul celor cinci numere introducând toate datele. IQR-ul este important deoarece liniile care se extind din cutie se extind de obicei doar la 1.5 ori IQR. Datele dincolo de acest punct sunt indicate prin puncte în loc de o linie continuă. Aceste puncte sugerează adesea că datele au valori aberante.

Există o varietate de utilizări pentru box plot. Mai multe diagrame pot fi desenate deasupra unei linii numerice și ar putea compara seturi similare de date diferențiate de un factor important. De exemplu, oamenii de știință sau statisticienii ar putea înregistra frecvența cardiacă a bărbaților și femeilor și apoi pot construi două diagrame de casete stivuite pentru a căuta diferențe semnificative în interval și quartile.

Diagramele cu casete nu abordează frecvența datelor. Lipsa unei scale suplimentare (verticală sau orizontală) omite informații despre numerele repetate, dimensiunea setului de date și majoritatea numerelor individuale. Persoana care se uită la un diagramă cu casete va înțelege cel mai mult rezumatul cu cinci numere, intervalul și dacă datele au valori aberante. Dimensiunea casetei, relația dintre mediană și quartile și lungimea mustaților pot arăta dacă datele sunt denaturate, dar nu pot vorbi despre lucruri precum medie, mod sau abatere standard. Alte diagrame, cum ar fi histogramele, pot fi mai utile atunci când oamenii doresc să reprezinte lucruri precum frecvența sau să obțină imagini mai bune despre distribuția datelor.