Ce este un termen de eroare?

În statistică, un termen de eroare este suma abaterilor fiecărei observații reale de la o linie de regresie a modelului. Analiza de regresie este utilizată pentru a stabili gradul de corelație dintre două variabile, una independentă și una dependentă, al cărei rezultat este o linie care „se potrivește” cel mai bine cu valorile efectiv observate ale valorii dependente în raport cu variabila sau variabilele independente. Cu alte cuvinte, un termen de eroare este termenul dintr-o ecuație de regresie a modelului care se calculează și ține cont de diferența inexplicabilă dintre valorile observate efectiv ale variabilei independente și rezultatele prezise de model. Prin urmare, termenul de eroare este o măsură a cât de exact modelul de regresie reflectă relația reală dintre variabila sau variabilele independente și dependente. Termenul de eroare poate indica fie că modelul poate fi îmbunătățit, cum ar fi prin adăugarea unei alte variabile independente care explică o parte sau toată diferența, fie prin aleatorie, ceea ce înseamnă că variabila sau variabilele dependente și independente nu sunt corelate într-o măsură mai mare. .

Cunoscut și ca termen rezidual sau termen de perturbare, conform convenției matematice, termenul de eroare este ultimul termen dintr-o ecuație de regresie model și este reprezentat de litera greacă epsilon (e). Economiștii și profesioniștii din industria financiară folosesc în mod regulat modelele de regresie, sau cel puțin rezultatele acestora, pentru a înțelege și prognoza mai bine o gamă largă de relații, cum ar fi modul în care modificările masei monetare sunt legate de inflație, cum prețurile bursiere sunt legate de șomaj. ratele sau modul în care modificările prețurilor mărfurilor afectează anumite companii dintr-un sector economic. Prin urmare, termenul de eroare este o variabilă importantă de care trebuie să țineți cont și de care trebuie să urmăriți, deoarece măsoară gradul în care orice model dat nu reflectă sau nu ține seama de relația reală dintre variabilele dependente și independente.

Există de fapt două tipuri de termeni de eroare utilizați în mod obișnuit în analiza regresiei: eroare absolută și eroare relativă. Eroarea absolută este termenul de eroare așa cum a fost definit anterior, diferența dintre valorile observate efectiv ale variabilei independente și rezultatele prezise de model. Derivată din aceasta, eroarea relativă este definită ca eroarea absolută împărțită la valoarea exactă prezisă de model. Exprimată în termeni procentuali, eroarea relativă este cunoscută sub numele de eroare procentuală, ceea ce este util deoarece pune termenul de eroare într-o perspectivă mai mare. De exemplu, un termen de eroare de 1 când valoarea prezisă este 10 este mult mai rău decât un termen de eroare de 1 când valoarea prezisă este de 1 milion atunci când se încearcă să vină cu un model de regresie care arată cât de bine sunt corelate două sau mai multe variabile.