Ce sunt statisticile inferenţiale?

Statisticile inferențiale sunt date care sunt utilizate pentru a face generalizări despre o populație pe baza unui eșantion. Ei se bazează pe utilizarea unei tehnici de eșantionare aleatorie concepută pentru a se asigura că un eșantion este reprezentativ. Un exemplu simplu de statistici inferențiale poate fi găsit probabil pe prima pagină a aproape oricărui ziar, cu orice articol care susține că „X% din populația Y gândește/face/simte/crede pe Z”. O afirmație precum „33% dintre tinerii cu vârsta de 24-30 de ani preferă prăjitura plăcintei” se bazează pe statistici inferențiale. Ar fi imposibil să se întrebe fiecare tânăr de 24-30 de ani cu privire la preferințele sale de desert, așa că, în schimb, un eșantion reprezentativ al populației a fost chestionat cu scopul de a face o inferență despre populația în ansamblu.

Statistica inferenţială şi descriptivă
Un alt mod de utilizare a datelor sondajului ia forma statisticilor descriptive. În acest caz, se fac declarații care descriu pur și simplu datele colectate. Este posibil ca același set de date să fie utilizat într-un mod descriptiv sau inferențial. De exemplu, în perioada premergătoare alegerilor din SUA, 1,000 de oameni dintr-un oraș ar putea fi chestionați cu privire la intențiile lor de vot, cu rezultatul că 430 au spus că vor vota democrat, 410 au spus că vor vota republican, iar 160 sunt indeciși sau nu vor să spună. . Un exemplu de utilizare a acestor date într-un mod descriptiv ar fi să afirmăm pur și simplu că 43% din 1,000 de persoane intervievate în acest oraș intenționează să voteze democrat. O afirmație inferențială ar fi „Democrații dețin 2% avans” – dintr-un eșantion a fost extrasă o inferență despre intențiile de vot în general.

Metode
Înainte de a trage concluzii generale dintr-un eșantion, este important să folosiți metodele corecte, altfel aceste concluzii pot să nu fie valide. Sursele comune de eroare se află în modul în care este alcătuit eșantionul și o serie de factori pot influența validitatea populației eșantionului. Dimensiunea este critică, deoarece cu cât dimensiunea este mai mică, cu atât este mai mare riscul ca eșantionul să nu fie reprezentativ pentru populația în ansamblu. De asemenea, trebuie avut grijă să eliminăm sursele de părtinire. În exemplul de mai sus, factori precum vârsta, sexul și venitul pot avea o influență considerabilă asupra intențiilor de vot, așa că dacă eșantionul nu a fost compus în așa fel încât să reflecte populația generală, concluzia poate să nu fie validă.

Metodele de eșantionare trebuie alese cu grijă; de exemplu, dacă cineva a luat un eșantion de confort care a inclus fiecare al 10-lea nume din agenda telefonică sau fiecare al 10-lea trecător într-un mall, acest eșantion ar putea să nu fie valid. Prejudecățile eșantionului este, de asemenea, o considerație. De exemplu, este posibil ca tinerii cu vârsta între 24 și 30 de ani care participă la o convenție a iubitorilor de plăcintă să aibă mai multe șanse să se bucure de plăcintă decât de prăjitură, ceea ce ar însemna că un sondaj privind preferințele de desert care i-a folosit ca eșantion pe participanții la conferință nu ar fi foarte reprezentativ.

Utilizeaza
Folosirea statisticii inferenţiale este o piatră de temelie a cercetării asupra populaţiilor şi evenimentelor, deoarece este de obicei dificil, şi adesea imposibil, să cercetezi fiecare membru al unei populaţii sau să observi fiecare eveniment. În schimb, cercetătorii încearcă să obțină un eșantion reprezentativ și îl folosesc ca bază pentru concluzii mai generale. De exemplu, nu ar fi fost posibil să se verifice dosarele medicale ale fiecărui fumător pentru a stabili o legătură între fumat și cancerul pulmonar, dar numeroase eșantioane aleatorii care compară fumătorii cu nefumătorii și elimină alți factori de risc s-au stabilit ferm. acest link.

Cercetătorii care lucrează cu statistici inferenţiale încearcă să-şi păstreze metodele şi practicile transparente, şi cât mai riguroase posibil, pentru a asigura integritatea rezultatelor lor. Declarațiile bazate pe sondaje informale și sondaje rapide pot să nu fie foarte utile, dar în domenii precum cercetarea medicală și studiile clinice standardele sunt mult mai stricte, iar statisticile inferențiale au furnizat cantități mari de informații valoroase. În alte domenii, ele sunt folosite în fiecare zi pentru a face generalizări cuprinzătoare despre populațiile care pot modela politicile publice, designul produselor, marketingul și campaniile politice.