Współczynnik determinacji to matematyczne obliczenie kwadratu współczynnika korelacji. Współczynnik korelacji to obliczenie dokładności modelu. Terminy te są używane w analizie statystycznej w celu wyjaśnienia dość logicznych obliczeń.
W statystyce zadaniem analityka jest przyjrzenie się danym zebranym z konkretnego scenariusza lub zdarzenia i stworzenie modelu matematycznego wyjaśniającego dane. Aby stworzyć ten model, należy wziąć pod uwagę pewne fakty.
Istnieje możliwość pomyłki w każdym obliczeniu i gromadzeniu danych. Ponieważ jest to spójne, w modelu należy uwzględnić poziom błędu. Uwzględniając ten błąd, przestaje mieć znaczenie dla ustalenia, czy proponowany model zapewnia solidne wyjaśnienie danych.
Rzeczywisty współczynnik obliczania determinacji wynosi
R2 = Suma kwadratów błędów
Suma kwadratów błędów + suma kwadratów regresji
Jest to obliczenie dokładności modelu w wyjaśnianiu danych.
Stosowana w analizie statystycznej wartość ta zapewnia wgląd w „dobrość dopasowania” modelu statystycznego do danych. Wartość współczynnika wynosi od 0 do 1. Idealne dopasowanie modelu do wyjaśnienia zmienności wynosi 1, a 0 to wartość, gdy model w ogóle nie wyjaśnia zmienności.
Współczynnik determinacji uwzględnia błędy danych lub wartości odstające oraz sumę kwadratów regresji. W tej wartości nie ma jednostki, ponieważ jest to w istocie stosunek i nie ma żadnego związku z wielkością próby. Im wyższa wartość, zbliżająca się do 1, tym model lepiej wyjaśnia zmienność.
Prostym sposobem wizualizacji tej koncepcji jest utworzenie wykresu wszystkich danych dotyczących konkretnego zdarzenia. W jadalni rozłóż trzy tace ciastek, czekolady, migdałów i orzeszków ziemnych. Obserwuj, jak ludzie wchodzą do jadalni i zapisuj, ile ciastek biorą, jakiego rodzaju i w jakiej kolejności. Wykreśl te dane na wykresie.
Utwórz formułę wokół przewidywanego zachowania. Przykładem może być przewidzenie, że każda osoba, która wzięła 1 czekoladowe ciastko, wzięła również 2 migdały, ale bez orzeszków ziemnych. W oparciu o to założenie można napisać proste równanie liniowe i przedstawić je na wykresie.
Wykreśl linię reprezentującą równanie liniowe tej prognozy. Porównaj linię z faktycznym zbiorem danych w swojej obserwacji. Oblicz współczynnik determinacji, aby zapewnić miarę dokładności przewidywanego zachowania w porównaniu z rzeczywistymi danymi.
Współczynnik determinacji wskazuje wielkość rozproszenia danych wokół linii. Pokazuje, jak dobra lub zła była prognoza w porównaniu z rzeczywistymi wartościami. Współczynnik determinacji pozwala użytkownikom zastosować „sprawdzenie rzeczywistości” do danych proponowanych w modelu statystycznym. Istnieją dwie wartości, wartości obserwowane lub rzeczywiste oraz wartości modelowane lub przewidywane.
Ten rodzaj analizy statystycznej jest bardzo powszechny w nauce iw biznesie. Wiele decyzji biznesowych opiera się na przewidywaniach przyszłych zachowań. Ważne jest, aby przeanalizować rzeczywiste wyniki i porównać je z przewidywaniami. Proces ten poprawia następny model, a tym samym dokładność prognoz.