Ο συντελεστής προσδιορισμού είναι ένας μαθηματικός υπολογισμός του τετραγώνου ενός συντελεστή συσχέτισης. Ο συντελεστής συσχέτισης είναι ένας υπολογισμός της ακρίβειας ενός μοντέλου. Αυτοί οι όροι χρησιμοποιούνται στη στατιστική ανάλυση για να εξηγήσουν αρκετά λογικούς υπολογισμούς.
Στα στατιστικά, η δουλειά ενός αναλυτή είναι να κοιτάξει τα δεδομένα που συλλέγονται από ένα συγκεκριμένο σενάριο ή γεγονός και να δημιουργήσει ένα μαθηματικό μοντέλο που εξηγεί τα δεδομένα. Για να δημιουργηθεί αυτό το μοντέλο, υπάρχουν ορισμένα δεδομένα που πρέπει να ληφθούν υπόψη.
Υπάρχει πιθανότητα λάθους σε κάθε υπολογισμό και συλλογή δεδομένων. Εφόσον αυτό είναι συνεπές, το ποσοστό σφάλματος πρέπει να ενσωματωθεί στο μοντέλο. Λαμβάνοντας υπόψη αυτό το σφάλμα, παύει να είναι σημαντικό για τον προσδιορισμό του εάν το προτεινόμενο μοντέλο παρέχει μια σταθερή εξήγηση για τα δεδομένα.
Ο πραγματικός συντελεστής υπολογισμού είναι
R2 = Άθροισμα των τετράγωνων σφαλμάτων
Άθροισμα των τετραγώνων σφαλμάτων + άθροισμα παλινδρόμησης τετραγώνων
Αυτός είναι ένας υπολογισμός της ακρίβειας του μοντέλου στην εξήγηση των δεδομένων.
Χρησιμοποιούμενη στη στατιστική ανάλυση, αυτή η τιμή παρέχει μια εικόνα για την «καλή προσαρμογή» του στατιστικού μοντέλου στα δεδομένα. Η τιμή του συντελεστή είναι μεταξύ 0 και 1. Μια τέλεια προσαρμογή του μοντέλου για να εξηγήσει τη διακύμανση είναι 1 και 0 είναι η τιμή όταν το μοντέλο δεν εξηγεί καθόλου τη διακύμανση.
Ο συντελεστής προσδιορισμού λαμβάνει υπόψη σφάλματα με τα δεδομένα, ή ακραίες τιμές, και το άθροισμα της παλινδρόμησης των τετραγώνων. Δεν υπάρχει μονάδα σε αυτήν την τιμή, καθώς είναι ουσιαστικά μια αναλογία και είναι εντελώς άσχετη με το μέγεθος του δείγματος. Όσο μεγαλύτερη είναι η τιμή, πλησιάζοντας το 1, τόσο καλύτερη εξήγηση της παραλλαγής παρέχεται από το μοντέλο.
Ένας απλός τρόπος για να οπτικοποιήσετε αυτήν την έννοια είναι να δημιουργήσετε ένα γράφημα με όλα τα δεδομένα που περιβάλλουν ένα συγκεκριμένο γεγονός. Τοποθετήστε τρεις δίσκους με μπισκότα σε μια αίθουσα μεσημεριανού γεύματος, σοκολάτα, αμύγδαλο και φιστίκι. Παρατηρήστε καθώς οι άνθρωποι έρχονται στο μεσημεριανό δωμάτιο και γράψτε πόσα μπισκότα παίρνουν, τι είδους και με ποια σειρά. Σχεδιάστε αυτά τα δεδομένα σε ένα γράφημα.
Δημιουργήστε έναν τύπο γύρω από την προβλεπόμενη συμπεριφορά. Ένα παράδειγμα θα ήταν να προβλέψουμε ότι κάθε άτομο που πήρε 1 μπισκότο σοκολάτας, έπαιρνε επίσης 2 αμύγδαλα, αλλά όχι φυστίκι. Μια απλή γραμμική εξίσωση μπορεί να γραφτεί με βάση αυτή την υπόθεση και να γραφτεί.
Σχεδιάστε τη γραμμή που αντιπροσωπεύει τη γραμμική εξίσωση αυτής της πρόβλεψης. Συγκρίνετε τη γραμμή με την πραγματική συλλογή δεδομένων στην παρατήρησή σας. Υπολογίστε τον συντελεστή προσδιορισμού για να δώσετε ένα μέτρο της ακρίβειας της προβλεπόμενης συμπεριφοράς σε σύγκριση με τα πραγματικά δεδομένα.
Ο συντελεστής προσδιορισμού υποδεικνύει το μέγεθος της εξάπλωσης των δεδομένων γύρω από τη γραμμή. Δείχνει πόσο καλή ή κακή ήταν η πρόβλεψη, σε σύγκριση με τις πραγματικές τιμές. Ο συντελεστής προσδιορισμού επιτρέπει στους χρήστες να εφαρμόζουν έναν «έλεγχο πραγματικότητας» στα δεδομένα που προτείνονται σε ένα στατιστικό μοντέλο. Υπάρχουν δύο τιμές, οι παρατηρούμενες ή πραγματικές τιμές και οι μοντελοποιημένες ή προβλεπόμενες τιμές.
Αυτός ο τύπος στατιστικής ανάλυσης είναι πολύ κοινός στην επιστήμη και στις επιχειρήσεις. Πολλές επιχειρηματικές αποφάσεις βασίζονται σε προβλέψεις μελλοντικής συμπεριφοράς. Είναι σημαντικό να αναλύσετε τα πραγματικά αποτελέσματα και να τα συγκρίνετε με τις προβλέψεις. Αυτή η διαδικασία βελτιώνει το επόμενο μοντέλο και συνεπώς την ακρίβεια των προβλέψεων.