Τι είναι μια μη παραμετρική δοκιμή;

Μια μη παραμετρική δοκιμή είναι ένας τύπος δοκιμής στατιστικών υποθέσεων που δεν προϋποθέτει κανονική κατανομή. Για το λόγο αυτό, οι μη παραμετρικές δοκιμές αναφέρονται μερικές φορές ως χωρίς διανομή. Μια μη παραμετρική δοκιμή είναι πιο ισχυρή από μια τυπική δοκιμή, γενικά απαιτεί μικρότερα δείγματα, είναι λιγότερο πιθανό να επηρεαστεί από απομακρυσμένες παρατηρήσεις και μπορεί να εφαρμοστεί με λιγότερες υποθέσεις. Από την άλλη πλευρά, οι μη παραμετρικές δοκιμές μπορεί να είναι λιγότερο αποτελεσματικές από τις τυπικές αντίστοιχές τους, ιδιαίτερα εάν ο πληθυσμός είναι πραγματικά κανονικά κατανεμημένος. Ο μη παραμετρικός έλεγχος είναι ιδιαίτερα αποτελεσματικός για ερωτήσεις που αφορούν συχνότητες και αναλογίες.

Ο τυπικός έλεγχος υποθέσεων συγκρίνει ένα δείγμα από έναν πληθυσμό δοκιμής με ένα δείγμα από έναν πληθυσμό ελέγχου για να καθορίσει εάν ο πληθυσμός δοκιμής είναι στατιστικά συγκρίσιμος με τον πληθυσμό ελέγχου. Εάν η διαφορά μεταξύ της παραμέτρου ή των παραμέτρων του δείγματος – συνήθως ο μέσος όρος και/ή η διακύμανση – είναι αρκετά μεγάλη, τότε το δείγμα δοκιμής μπορεί να κριθεί ότι είναι διαφορετικό από τον πληθυσμό ελέγχου. Ένας τέτοιος παραμετρικός έλεγχος απαιτεί οι παράμετροι να προέρχονται από μια κανονική κατανομή.

Έχει αποδειχθεί μαθηματικά ότι ένα μέγεθος δείγματος 30 ή περισσότερο θα συμπεριφέρεται περίπου σαν μια κανονική κατανομή, επομένως αυτή η απαίτηση θεωρείται γενικά. Εάν η υπόθεση δεν δικαιολογείται, ωστόσο, τα αποτελέσματα της δοκιμής ενδέχεται να μην είναι έγκυρα. Η μη παραμετρική δοκιμή αποφεύγει αυτήν την υπόθεση.

Αντίθετα, ο μη παραμετρικός έλεγχος υποθέσεων εξετάζει συνήθως τα δεδομένα είτε κατηγοριοποιώντας τα είτε ταξινομώντας τα. Εάν το δείγμα και οι πληθυσμοί ελέγχου είναι οι ίδιοι και εάν τα δεδομένα συγκεντρώθηκαν σωστά, τυχόν διαφορές μεταξύ των κατηγοριών ή της κατάταξής τους είναι αυστηρά τυχαία αποτελέσματα. Εάν η πιθανότητα ότι αυτές οι διαφορές θα μπορούσαν να προκύψουν τυχαία, που ονομάζεται επίσης τιμή P, είναι μικρότερη από μια επιλεγμένη σημαντική πιθανότητα, συνήθως είτε 5 τοις εκατό είτε 1 τοις εκατό, τότε ο ελεγκτής απορρίπτει την υπόθεση ότι το δείγμα και οι πληθυσμοί ελέγχου είναι οι ίδια και καταλήγει στο συμπέρασμα ότι είναι διαφορετικά.

Μια κοινή μη παραμετρική δοκιμή είναι η δοκιμή Chi-square, που χρησιμοποιείται για τη σύγκριση παρατηρούμενων συχνοτήτων ή αναλογιών. Όταν εξετάζεται μόνο ένα σύνολο συχνοτήτων, αυτό ονομάζεται συχνά δοκιμή καλής προσαρμογής και χρησιμοποιείται για να προσδιοριστεί εάν οι παρατηρούμενες συχνότητες ταιριάζουν στο εύρος που θα αναμενόταν. Για παράδειγμα, ένα τεστ καλής προσαρμογής θα μπορούσε να χρησιμοποιηθεί για να προσδιοριστεί εάν ένα τραπέζι ρουλέτας είχε στηθεί συγκρίνοντας τα αποτελέσματα του τραπεζιού με τα αποτελέσματα που προβλέπει η θεωρία πιθανοτήτων ή για να καθοριστεί εάν ένα φάρμακο για τον πονοκέφαλο ήταν αποτελεσματικό συγκρίνοντας το ποσοστό των ατόμων που έχουν πονοκέφαλο βελτιώθηκε στο φάρμακο στο ποσοστό των ατόμων των οποίων ο πονοκέφαλος βελτιώθηκε όταν έλαβαν εικονικό φάρμακο. Εάν εξετάζονται δύο συχνότητες, τότε το μη παραμετρικό τεστ Χ-τετράγωνο μπορεί να χρησιμοποιηθεί για τον έλεγχο συσχέτισης ή ανεξαρτησίας μεταξύ παραγόντων. Οι πολιτικοί δημοσκόποι αναζητούν συχνά συσχετισμό μεταξύ κοινωνικών, οικονομικών ή δημογραφικών παραγόντων και πολιτικών πεποιθήσεων, όπως να βλέπουν εάν υπάρχει συσχέτιση μεταξύ της εκπαίδευσης ενός ατόμου και εάν αυτός ή αυτή εγκρίνει την απόδοση ενός εκλεγμένου αξιωματούχου.

Ένα άλλο μη παραμετρικό τεστ είναι το τεστ αθροίσματος κατάταξης Wilcoxon, το οποίο γενικά χρησιμοποιείται στις ίδιες καταστάσεις με τον τυπικό έλεγχο παραμετρικών υποθέσεων. Ωστόσο, αντί να εξετάζεται ο μέσος όρος κάθε δείγματος, η δοκιμή Wilcoxon εξετάζει την κατάταξη κάθε τιμής εάν τα δύο δείγματα ταξινομούνται από το ελάχιστο προς το μεγαλύτερο. Εάν τα δύο δείγματα είναι ίδια, κάθε ομάδα θα πρέπει να διασκορπιστεί ομοιόμορφα στην κατάταξη. Εάν μια ομάδα συγκεντρώνεται στο κάτω ή στο ανώτερο άκρο της κατάταξης, αυτό σημαίνει ότι οι δύο ομάδες είναι διαφορετικές.
Για παράδειγμα, ας υποθέσουμε ότι κάποιος ήθελε να προσδιορίσει εάν οι ταινίες κινουμένων σχεδίων είναι μεγαλύτερες ή μικρότερες από τις ταινίες χωρίς κινούμενα σχέδια. Για μια τυπική δοκιμή, θα καθόριζε τη μέση διάρκεια για ένα δείγμα ταινιών κινουμένων σχεδίων και για ένα δείγμα ταινιών ζωντανής δράσης και θα συνέκρινε τη διαφορά με τη διακύμανση των δειγμάτων. Για τη μη παραμετρική δοκιμή Wilcoxon, οι χρόνοι ταινιών ταξινομούνται με τη σειρά από το ελάχιστο προς το μεγαλύτερο και οι βαθμοί των χρόνων ταινιών κινουμένων σχεδίων αθροίζονται.

Το άτομο θα μπορούσε να υπολογίσει την πιθανότητα ότι το άθροισμα κατάταξης θα ήταν αυτό το μέγεθος ή μικρότερο, προσδιορίζοντας τον αριθμό των πιθανών παραγγελιών με ένα δεδομένο άθροισμα κατάταξης και τον συνολικό αριθμό πιθανών ταξινομήσεων, έναν υπολογισμό που είναι απλός δεδομένης της ισχύος υπολογισμού της ωμής δύναμης. Με δύο μικρά δείγματα έξι ταινιών το καθένα, υπάρχουν ήδη 924 πιθανές ρυθμίσεις κατάταξης, αριθμός που αυξάνεται γρήγορα όσο προστίθενται ταινίες. Εναλλακτικά, υπάρχουν δημοσιευμένοι πίνακες που δίνουν πιθανότητες που αντιστοιχούν σε δεδομένα αθροίσματα κατάταξης για δεδομένα μεγέθη δειγμάτων. Αυτά μπορούν να βρεθούν σε κείμενα στατιστικών ή διαδικτυακά.
Οι μη παραμετρικές δοκιμές είναι ένα αναπτυσσόμενο πεδίο. Μπορεί να εφαρμοστεί σε οποιονδήποτε τομέα στον οποίο έχουν χρησιμοποιηθεί και πιο συμβατικές στατιστικές. Οι εφαρμογές είναι ιδιαίτερα συχνές στις κοινωνικές επιστήμες και την ιατρική, ωστόσο, ιδιαίτερα όταν δεν μπορεί να εφαρμοστεί η κανονική κατανομή.