Co to jest termin błędu?

W statystyce składnik błędu jest sumą odchyleń każdej rzeczywistej obserwacji od linii regresji modelu. Analiza regresji służy do ustalenia stopnia korelacji między dwiema zmiennymi, jedną niezależną i jedną zależną, czego wynikiem jest linia, która najlepiej „pasuje” do faktycznie obserwowanych wartości wartości zależnej w stosunku do zmiennej lub zmiennych niezależnych. Innymi słowy, składnik błędu jest składnikiem równania regresji modelu, które uwzględnia niewyjaśnioną różnicę między faktycznie obserwowanymi wartościami zmiennej niezależnej a wynikami przewidywanymi przez model. Stąd składnik błędu jest miarą tego, jak dokładnie model regresji odzwierciedla rzeczywisty związek między zmienną lub zmiennymi niezależną i zależną. Termin błędu może wskazywać, że model można ulepszyć, na przykład przez dodanie innej zmiennej niezależnej, która wyjaśnia część lub całość różnicy, albo przez losowość, co oznacza, że ​​zmienna lub zmienne zależne i niezależne nie są skorelowane w większym stopniu .

Zgodnie z konwencją matematyczną, znany również jako składnik rezydualny lub składnik zakłócający, składnik błędu jest ostatnim składnikiem w równaniu regresji modelu i jest reprezentowany przez grecką literę epsilon (e). Ekonomiści i specjaliści z branży finansowej regularnie korzystają z modeli regresji, a przynajmniej ich wyników, aby lepiej zrozumieć i przewidzieć szeroki zakres zależności, takich jak związek zmian podaży pieniądza z inflacją, związek cen giełdowych z bezrobociem stawki lub jak zmiany cen towarów wpływają na konkretne firmy w sektorze gospodarczym. Dlatego termin błędu jest ważną zmienną, o której należy pamiętać i śledzić, ponieważ mierzy stopień, w jakim dany model nie odzwierciedla lub nie uwzględnia rzeczywistego związku między zmiennymi zależnymi i niezależnymi.

W rzeczywistości w analizie regresji powszechnie stosuje się dwa rodzaje terminów błędu: błąd bezwzględny i błąd względny. Błąd bezwzględny to zdefiniowany wcześniej termin błędu, różnica między faktycznie obserwowanymi wartościami zmiennej niezależnej a wynikami przewidywanymi przez model. Wyprowadzony z tego błąd względny definiuje się jako błąd bezwzględny podzielony przez dokładną wartość przewidywaną przez model. Wyrażony w procentach błąd względny jest znany jako błąd procentowy, co jest przydatne, ponieważ pozwala spojrzeć na składnik błędu z szerszej perspektywy. Na przykład składnik błędu 1, gdy przewidywana wartość wynosi 10, jest znacznie gorszy niż składnik błędu 1, gdy przewidywana wartość wynosi 1 milion, gdy próbuje się wymyślić model regresji, który pokazuje, jak dobrze są skorelowane dwie lub więcej zmiennych.