Ce este distribuția hipergeometrică?

Distribuția hipergeometrică descrie probabilitatea anumitor evenimente atunci când o secvență de articole este extrasă dintr-un set fix, cum ar fi alegerea cărților de joc dintr-un pachet. Caracteristica cheie a evenimentelor care urmează distribuția de probabilitate hipergeometrică este că elementele nu sunt înlocuite între extrageri. După ce un anumit obiect a fost ales, acesta nu poate fi ales din nou. Această caracteristică este cea mai semnificativă atunci când lucrați cu populații mici.

Auditorii de evaluare a calității folosesc distribuția hipergeometrică atunci când analizează numărul de produse defecte dintr-un grup dat. Produsele sunt puse deoparte după ce au fost testate, deoarece nu există niciun motiv pentru a testa același produs de două ori. Astfel, selecția se face fără înlocuire.

Probabilitățile de poker sunt calculate folosind distribuția hipergeometrică deoarece cărțile nu sunt amestecate înapoi în pachet într-o mână dată. Inițial, de exemplu, un sfert din cărțile dintr-un pachet standard sunt pică, dar probabilitatea de a primi două cărți și de a găsi că ambele sunt pică nu este 1/4 * 1/4 = 1/16. După ce ați primit prima pică, mai sunt mai puține pică în punte, așa că probabilitatea de a primi o altă pică este de doar 12/51. Prin urmare, probabilitatea de a primi două cărți și de a găsi că ambele sunt pică este 1/4 * 12/51 = 1/17.

Obiectele nu sunt înlocuite între extrageri, astfel încât probabilitatea scenariilor extreme este redusă pentru o distribuție hipergeometrică. Se pot compara cărțile roșii sau negre ale unui pachet standard cu aruncarea unei monede. O monedă corectă va ateriza pe „capete” jumătate din timp, iar jumătate din cărțile dintr-un pachet standard sunt negre. Cu toate acestea, probabilitatea de a obține cinci capete consecutive atunci când aruncați o monedă este mai mare decât probabilitatea de a primi o mână de cinci cărți și de a găsi că toate sunt cărți negre. Probabilitatea apariției a cinci capete consecutive este 1/2 * 1/2 * 1/2 * 1/2 * 1/2 = 1/32, sau aproximativ 3 procente, iar probabilitatea apariției a cinci cărți negre este 26/52 * 25/ 51 * 24/50 * 23/49 * 22/48 = 253/9996, sau aproximativ 2.5 la sută.

Eșantionarea fără înlocuire reduce probabilitatea cazurilor extreme, dar nu afectează media aritmetică a distribuției. Numărul mediu de cărți așteptate atunci când cineva aruncă o monedă de cinci ori este de 2.5, iar acesta este egal cu numărul mediu de cărți negre așteptate într-o mână de cinci cărți. Așa cum este foarte puțin probabil ca toate cele cinci cărți să fie negre, este, de asemenea, puțin probabil ca niciuna dintre ele să nu fie. Acest lucru este descris în limbaj matematic prin a spune că înlocuirea scade varianța fără a afecta valoarea așteptată a unei distribuții.