Oamenii de știință caută să stabilească teorii sau să descopere legi care explică observațiile sau rezultatele experimentelor. Primul pas este de a construi o ipoteză sau o încercare de explicație pentru un set de fapte și apoi de a o testa. De obicei, se folosesc metode statistice: se examinează un eșantion de date pentru a vedea dacă susține explicația propusă. În mod obișnuit, se va construi o ipoteză nulă, care contrazice explicația – aceasta este în mod normal notă cu H0 – în timp ce explicația în sine se numește ipoteză alternativă, notată cu HA. Inițial se presupune că H0 este adevărat, iar sarcina cercetătorului este să arate că datele nu susțin această concluzie.
Testarea ipotezei
De obicei, H0 și HA sunt două afirmații care se exclud reciproc – nu pot fi ambele adevărate. Ele ar trebui să fie, de asemenea, exhaustive; adică ar trebui să acopere toate rezultatele posibile ale investigației experimentale. Se obține un eșantion de date, față de care se va testa ipoteza nulă. Eșantionul trebuie să aibă o dimensiune suficientă pentru a permite tragerea unor concluzii valide și trebuie să fie lipsit de orice prejudecăți care ar putea afecta rezultatul.
Cercetătorii trebuie apoi să stabilească o valoare, sau unul sau mai multe seturi de valori, care nu ar suporta H0. Dacă se constată că datele sunt în acord cu aceste valori, ipoteza nulă va fi respinsă, iar ipoteza alternativă se poate spune că este probabil adevărată. Datele de testare pot fi adesea reprezentate ca un grafic, cu un vârf în mijloc și o „coadă” de ambele părți. În mod obișnuit, cele mai multe dintre valorile pentru lucrul testat se vor grupa în jurul mijlocului intervalului, înclinându-se spre extremele joase și înalte. De exemplu, un set de măsurători ale înălțimii unui eșantion mare de oameni va arăta majoritatea în jurul mijlocului intervalului și numere mai mici către extremitățile foarte scurte și foarte înalte.
Există trei tipuri de teste care pot fi aplicate unui set de date. Într-un test cu coada dreaptă, s-a determinat că datele care sunt peste o anumită valoare, cunoscută sub numele de valoare critică, nu susțin ipoteza nulă; într-un test cu coada stângă, aceste date se află sub valoarea critică; într-un test cu două cozi, datele care nu acceptă H0 se află deasupra și sub o anumită valoare sau interval de valori. Nu este posibilă infirmarea completă a ipotezei nule; în schimb, cercetătorii trebuie să cadă de acord asupra unei interpretări a datelor bazate pe cât de probabil este ca H0 să fie respins atunci când este de fapt adevărat. Această probabilitate este cunoscută sub numele de nivelul de semnificație. De exemplu, dacă o anumită proporție a datelor este peste valoarea critică într-un test cu coada dreaptă, acest lucru ar putea indica că există doar o șansă de 1% ca H0 să fie adevărat.
Exemplu
O companie farmaceutică poate testa rezultatele unui nou tratament pentru a reduce colesterolul. În acest caz, ipoteza nulă ar fi că nivelurile de colesterol nu sunt reduse după administrarea medicamentului, în timp ce ipoteza alternativă ar fi că nivelurile scad. Se presupune că H0 este adevărat, iar cercetătorii ar aduna apoi date pentru a fi analizate în încercarea de a-l respinge.
Datele ar putea consta în măsurători ale colesterolului la un eșantion de persoane înainte și după administrarea medicamentului, în comparație cu un eșantion similar care nu l-a luat, în aceeași perioadă. Cercetătorii ar putea fi apoi de acord cu privire la cât de mult o reducere și în ce proporție din eșantionul care a luat medicamentul poate fi considerată semnificativă. Aceste informații pot fi folosite pentru a seta o valoare critică, cum ar fi o reducere de 10% la 80% dintre cei care au luat medicamentul. Dacă datele cad peste aceste valori, ipoteza nulă este respinsă, iar ipoteza alternativă este acceptată.