Ce este heteroskedasticitatea?

Heteroschedasticitatea este un termen statistic folosit pentru a descrie comportamentul varianței și abaterii standard a unui eșantion. Dacă calitatea este prezentă, atunci varianța și abaterea standard a variabilei nu sunt constante pe întregul grafic al datelor eșantionului. Dacă aceste măsuri sunt constante, atunci se spune că datele sunt homoschedastice.

Varianta unei variabile este o măsură a cât de departe sunt împrăștiate valorile observate față de valoarea medie sau medie. Abaterea standard este rădăcina pătrată a varianței și este adesea folosită pentru a descrie distribuțiile. Conform relației descrise de teorema lui Cebyshev, un anumit procent de date trebuie să se încadreze în fiecare abatere standard de la valoarea medie. De exemplu, cel puțin 75 la sută din punctele de date dintr-un eșantion trebuie să fie în două abateri standard de la medie. Astfel, abaterea standard a unui eșantion oferă informații aproximative despre poziția relativă a fiecărui punct de date.

Există două varietăți de heteroschedasticitate: condiționată și necondiționată. Dacă datele sunt heteroschedastice condiționat, analiștii nu pot prezice când datele vor fi mai împrăștiate și când vor fi mai puțin împrăștiate. Acesta este cazul prețurilor produselor financiare, inclusiv a stocurilor.

Heteroschedasticitatea necondiționată este previzibilă. Variabilele care sunt ciclice prin natură prezintă de obicei această proprietate. Variabilele a căror varianță se modifică cu nivelul lor sunt, de asemenea, necondiționat hetroschedastic. De exemplu, poți prezice că, dacă poți ține ceva în mână, îi poți măsura greutatea destul de precis; s-ar putea să aveți, cel mult, câteva kilograme sau câteva kilograme. Dacă vi se cere să estimați greutatea unei clădiri, totuși, s-ar putea să fiți greșit cu mii de lire sterline sau kilograme – variația ipotezei dvs. crește, în mod previzibil, odată cu greutatea obiectului.

Prezența sau nu a heteroschedasticității are o influență asupra interpretării corecte a analizei statistice a datelor. Calitatea nu afectează regresia; aceasta înseamnă că metodele de plasare a graficelor cele mai potrivite vor funcționa la fel de bine atât cu datele heteroschedastice, cât și cu cele homoschedastice. Aceste grafice sunt create prin găsirea coeficienților de date, care măsoară cât de mult afectează o anumită variabilă un rezultat. Heteroschedasticitatea deformează valorile varianței coeficienților pe care le returnează modelele.

Există o varietate de teste matematice care pot determina dacă există heteroscedasticitate prezentă pe un eșantion al unei variabile. Multe dintre aceste teste sunt disponibile în software-ul de analiză statistică. Un observator poate detecta, de asemenea, unele cazuri de heteroschedasticitate, uitându-se la un grafic al eșantionului. Căutați zone ale graficului care sunt împrăștiate mai mult sau mai puțin; este important să se facă distincția, totuși, între variațiile adevărate ale cantității de împrăștiere și clusterele care sunt așteptate în distribuțiile care au un element de aleatorie.