Τι είναι η απλή γραμμική παλινδρόμηση;

Η απλή γραμμική παλινδρόμηση ισχύει για τα στατιστικά στοιχεία και βοηθά στην περιγραφή (x, y) δεδομένων που φαίνεται να έχουν γραμμική σχέση, επιτρέποντας κάποια πρόβλεψη του y εάν ​​το x είναι γνωστό. Αυτά τα δεδομένα απεικονίζονται συχνά σε scatterplots και ο τύπος γραμμικής παλινδρόμησης δημιουργεί μια γραμμή που ταιριάζει καλύτερα σε όλα τα σημεία, υπό την προϋπόθεση ότι έχουν πραγματικά μια γραμμική συσχέτιση. Δεν θα ταιριάζει ακριβώς σε όλα τα σημεία, αλλά θα πρέπει να είναι μια γραμμή όπου το άθροισμα των τετραγώνων της διαφοράς μεταξύ των πραγματικών δεδομένων και των αναμενόμενων δεδομένων (υπολειμματικά) δημιουργεί τον χαμηλότερο αριθμό, ο οποίος συχνά ονομάζεται γραμμή ή γραμμή με τα λιγότερα τετράγωνα ταιριάζει καλύτερα. Η εξίσωση της γραμμής για δείγματα δεδομένων και δεδομένα πληθυσμού είναι η ακόλουθη: y = b0 + b1x και Y = B0 + B1x.

Όποιος είναι εξοικειωμένος με την άλγεβρα μπορεί να σημειώσει την ομοιότητα αυτής της γραμμής με y = mx + b, και στην πραγματικότητα οι δύο είναι σχετικά πανομοιότυπες, εκτός αν οι δύο όροι στη δεξιά πλευρά της εξίσωσης αλλάζουν, έτσι ώστε το Β1 να ισούται με κλίση ή m. Ο λόγος για αυτήν την αναδιάταξη είναι ότι γίνεται κομψά εύκολο να προσθέσετε επιπλέον όρους με χαρακτηριστικά όπως εκθέτες που μπορεί να περιγράφουν διαφορετικές μη γραμμικές μορφές σχέσης.

Οι τύποι για την απόκτηση μιας απλής γραμμικής γραμμής παλινδρόμησης είναι σχετικά πολύπλοκοι και δυσκίνητοι, και οι περισσότεροι άνθρωποι δεν αφιερώνουν πολύ χρόνο για να τους γράψουν γιατί χρειάζονται πολύ χρόνο για να ολοκληρωθούν. Αντ ‘αυτού, διάφορα προγράμματα, όπως για το Excel ή για πολλούς τύπους επιστημονικών υπολογιστών, μπορούν εύκολα να υπολογίσουν μια γραμμή τουλάχιστον τετραγώνων. Η γραμμή είναι κατάλληλη μόνο για πρόβλεψη εάν υπάρχουν σαφείς ενδείξεις ισχυρής συσχέτισης μεταξύ των συνόλων δεδομένων (x, y). Ένας υπολογιστής θα δημιουργήσει μια γραμμή, ανεξάρτητα από το αν έχει νόημα η χρήση της.

Ταυτόχρονα δημιουργείται μια απλή γραμμική εξίσωση γραμμής παλινδρόμησης, οι άνθρωποι πρέπει να εξετάσουν το επίπεδο συσχέτισης. Αυτό σημαίνει την εκτίμηση του r, του συντελεστή συσχέτισης, έναντι ενός πίνακα τιμών για να προσδιοριστεί εάν υπάρχει γραμμικός συσχετισμός. Επιπλέον, η αξιολόγηση των δεδομένων σχεδιάζοντάς τα ως scatterplot είναι ένας καλός τρόπος για να αποκτήσετε μια αίσθηση εάν τα δεδομένα έχουν μια γραμμική σχέση.

Αυτό που μπορεί στη συνέχεια να γίνει με μια απλή γραμμική παλινδρόμηση, με την προϋπόθεση ότι έχει γραμμική συσχέτιση, είναι ότι οι τιμές μπορούν να αντικατασταθούν στο x, για να πάρουμε μια προβλεπόμενη τιμή για το y. Αυτή η πρόβλεψη έχει τα όριά της. Τα υπάρχοντα δεδομένα, ιδίως αν πρόκειται μόνο για δείγμα, μπορεί να έχουν γραμμική συσχέτιση τώρα, αλλά ίσως όχι αργότερα με πρόσθετο δείγμα.

Εναλλακτικά, ένα ολόκληρο δείγμα μπορεί να μοιράζεται μια συσχέτιση ενώ ένας ολόκληρος πληθυσμός όχι. Συνεπώς, η πρόβλεψη είναι περιορισμένη και η υπέρβαση των διαθέσιμων τιμών δεδομένων ονομάζεται παρέκταση και δεν ενθαρρύνεται. Επιπλέον, θα πρέπει να γνωρίζουν οι άνθρωποι ότι εάν δεν υπάρχει γραμμική συσχέτιση, η καλύτερη εκτίμηση του x είναι ο μέσος όρος όλων των δεδομένων y.

Ουσιαστικά, η απλή γραμμική παλινδρόμηση είναι ένα χρήσιμο στατιστικό εργαλείο που μπορεί, με διακριτικότητα, να χρησιμοποιηθεί για την πρόβλεψη των τιμών y με βάση την τιμή ax. Διδάσκεται σχεδόν πάντα με την ιδέα της γραμμικής συσχέτισης αφού ο προσδιορισμός της χρησιμότητας μιας γραμμής παλινδρόμησης απαιτεί ανάλυση του r. Ευτυχώς με πολλά σύγχρονα τεχνικά προγράμματα, οι άνθρωποι μπορούν να γράψουν γραφικά scatterplots, να προσθέσουν γραμμές παλινδρόμησης και να καθορίσουν τον συντελεστή συσχέτισης r με μερικές καταχωρήσεις.

SmartAsset.