Τι είναι η Διωνυμική Κατανομή;

Μια διωνυμική κατανομή με παραμέτρους (n,p) δίνει τη διακριτή πιθανότητα να έχουμε x επιτυχίες από n δοκιμές, με πιθανότητα επιτυχίας p, υποθέτοντας ότι κάθε δοκιμή είναι ανεξάρτητη και το αποτέλεσμα μιας δοκιμής είναι είτε επιτυχία είτε αποτυχία. Ο μέσος αριθμός επιτυχιών από n δοκιμές είναι ο μέσος όρος np και η διακύμανση είναι np(1-p). Το διώνυμο ανήκει σε μια οικογένεια κατανομών που σχετίζονται με γεγονότα, συμπεριλαμβανομένου του αρνητικού διωνύμου και της κατανομής Bernoulli. Δεδομένου ότι η πιθανότητα διωνυμικής κατανομής υπολογίζεται χρησιμοποιώντας την παραγοντική συνάρτηση, η οποία γίνεται πολύ μεγάλη καθώς αυξάνεται ο αριθμός των δοκιμών, χρησιμοποιείται συνήθως η προσέγγιση διωνυμικής κατανομής μιας κανονικής ή μιας κατανομής Poisson.

Για παράδειγμα, ένα δίκαιο κέρμα αναποδογυρίζεται δύο φορές και η επιτυχία ορίζεται ως η απόκτηση κεφαλιών. Ο αριθμός των δοκιμών είναι n = 2 και η πιθανότητα ρίψης κεφαλής είναι p = ½. Τα αποτελέσματα μπορούν να συνοψιστούν σε έναν πίνακα διωνυμικής κατανομής: η πιθανότητα να μην υπάρχουν κεφαλές, P(x = 0) είναι 25%, η πιθανότητα μιας κεφαλής, P(x = 1) είναι 50% και η πιθανότητα δύο κεφαλών Το P(x = 2) είναι 25%. Ο αναμενόμενος αριθμός κεφαλιών που έχουν πεταχτεί είναι np = 2*1/2 = 1. Η διακύμανση είναι np(1-p) = ½.

Άλλες κατανομές περιγράφουν την πιθανότητα γεγονότων και ανήκουν στην ίδια οικογένεια με το διώνυμο. Μια κατανομή Bernoulli δίνει την πιθανότητα επιτυχίας ενός μεμονωμένου γεγονότος και είναι ισοδύναμη με ένα διώνυμο με n = 1. Η αρνητική διωνυμική κατανομή δίνει την πιθανότητα να έχουμε x αποτυχίες, ενώ όπως το κανονικό διώνυμο δίνει την πιθανότητα x επιτυχιών.

Συχνά χρησιμοποιείται η συνάρτηση αθροιστικής πυκνότητας της διωνυμικής κατανομής, η οποία δίνει την πιθανότητα να έχουμε x ή λιγότερες επιτυχίες σε n δοκιμές. Ο υπολογισμός αυτής της πιθανότητας είναι απλός για ένα μικρό n, αλλά γίνεται κουραστικός καθώς το n μεγαλώνει, λόγω του διωνυμικού συντελεστή. Ο διωνυμικός συντελεστής διαβάζεται “n επιλέξτε x” και αναφέρεται στον αριθμό των συνδυασμών που μπορούν να επιλεγούν x αποτελέσματα από n πιθανότητες. Υπολογίζεται χρησιμοποιώντας την παραγοντική συνάρτηση. Καθώς ο αριθμός των δοκιμών (n) γίνεται μεγαλύτερος από 70, το n παραγοντικό γίνεται τεράστιο και δεν μπορεί πλέον να υπολογιστεί σε μια τυπική αριθμομηχανή.

Η προσέγγιση της διωνυμικής κατανομής όταν το n γίνεται μεγάλο μπορεί να είναι διακριτή ή συνεχής. Εάν το n είναι πολύ μεγάλο και το p είναι πολύ μικρό, τότε η διωνυμική κατανομή γίνεται μια διακριτή κατανομή Poisson. Εάν το n είναι αρκετά μεγάλο χωρίς κανένα περιορισμό στο p, τότε μπορεί να χρησιμοποιηθεί η προσέγγιση της διωνυμικής κανονικής κατανομής. Ο διωνυμικός μέσος όρος και η τυπική απόκλιση γίνονται οι παράμετροι της κανονικής κατανομής και εφαρμόζεται μια διόρθωση για τη συνέχεια κατά τον υπολογισμό της συνάρτησης αθροιστικής πυκνότητας.