Coeficientul de determinare este un calcul matematic al pătratului unui coeficient de corelație. Coeficientul de corelație este un calcul al acurateței unui model. Acești termeni sunt folosiți în analiza statistică pentru a explica calcule destul de logice.
În statistică, sarcina unui analist este să se uite la datele colectate dintr-un anumit scenariu sau eveniment și să creeze un model matematic care explică datele. Pentru a crea acest model, există anumite fapte care trebuie luate în considerare.
Există o posibilitate de eroare în fiecare calcul și colectare de date. Deoarece aceasta este consecventă, rata de eroare trebuie încorporată în model. Luând în considerare această eroare, aceasta încetează să fie relevantă pentru a determina dacă modelul propus oferă o explicație solidă pentru date.
Calculul real al coeficientului de determinare este
R2 = Suma erorilor pătrate
Suma erorilor pătrate + Suma de regresie a pătratelor
Acesta este un calcul al acurateței modelului în explicarea datelor.
Folosită în analiza statistică, această valoare oferă o perspectivă asupra „bunătății de potrivire” a modelului statistic la date. Valoarea coeficientului este între 0 și 1. O potrivire perfectă a modelului pentru a explica variația este 1 și 0 este valoarea când modelul nu explică deloc variația.
Coeficientul de determinare ia în considerare erorile cu datele, sau valorile aberante, și suma de regresie a pătratelor. Nu există nicio unitate pentru această valoare, deoarece este în esență un raport și nu are nicio legătură cu dimensiunea eșantionului. Cu cât valoarea este mai mare, apropiindu-se de 1, cu atât mai bună explicație a variației este oferită de model.
O modalitate simplă de a vizualiza acest concept este de a crea un grafic al tuturor datelor din jurul unui anumit eveniment. Pune trei tăvi cu fursecuri într-o sală de prânz, ciocolată, migdale și alune. Observați când oamenii intră în sala de prânz și notați câte prăjituri iau, ce fel și în ce ordine. Reprezentați aceste date pe un grafic.
Creați o formulă în jurul comportamentului prezis. Un exemplu ar fi să prezicem că fiecare persoană care a luat 1 prăjitură de ciocolată, a luat și 2 migdale, dar nicio alune. O ecuație liniară simplă poate fi scrisă pe baza acestei ipoteze și reprezentată grafic.
Trasează linia care reprezintă ecuația liniară a acelei predicții. Comparați linia cu colectarea reală a datelor din observația dvs. Calculați coeficientul de determinare pentru a oferi o măsură a acurateței comportamentului prezis în comparație cu datele reale.
Coeficientul de determinare indică cantitatea de răspândire a datelor în jurul liniei. Arată cât de bună sau rea a fost predicția, în comparație cu valorile reale. Coeficientul de determinare permite utilizatorilor să aplice o „verificare a realității” datelor propuse într-un model statistic. Există două valori, valorile observate sau reale și valorile modelate sau prezise.
Acest tip de analiză statistică este foarte comună în știință și în afaceri. Multe decizii de afaceri se bazează pe predicții privind comportamentul viitor. Este important să analizați rezultatele reale și să le comparați cu previziunile. Acest proces îmbunătățește următorul model și, prin urmare, acuratețea predicțiilor.