Η όραση υπολογιστή (CV) είναι, πολύ απλά, μια μέθοδος αναγνώρισης και ερμηνείας εικόνων χρησιμοποιώντας κάμερες και υπολογιστές. Η τεχνολογία Computer vision χρησιμοποιείται σε διάφορους τομείς και αποτελείται από έναν αριθμό εξειδικευμένων εφαρμογών υλικού και λογισμικού. Ορισμένοι τύποι τεχνολογίας υπολογιστικής όρασης περιλαμβάνουν κάμερες υψηλής ανάλυσης, συστήματα υπολογιστών μεμονωμένα σχεδιασμένα και ειδικούς αισθητήρες ή φίλτρα τόσο για την κάμερα όσο και για τον υπολογιστή.
Οι κάμερες φορτισμένων συζευγμένων συσκευών (CCD) παρέχουν συνήθως την έξοδο εικόνας για την τεχνολογία όρασης υπολογιστή. Οι κάμερες CCD μπορεί να είναι πανκατευθυντικές, παντός κλίσης με ζουμ ή ευθεία όραση. Οι κάμερες που αναπτύχθηκαν από το Πανεπιστήμιο Carnegie Mellon γνωστές ως CMUcams είναι ένας τύπος τεχνολογίας όρασης υπολογιστή που συνδυάζει μια βιντεοκάμερα με έναν μικροελεγκτή. Αυτό επιτρέπει την ενσωματωμένη υποστήριξη απλής επεξεργασίας εικόνας. Η ρομποτική χρησιμοποιεί συχνά στερεοφωνική όραση, συνδυάζοντας δύο κάμερες που έχουν βαθμονομηθεί για να τραβήξουν μια εικόνα με ακρίβεια σύγκλισης.
Οι υπολογιστές που χρησιμοποιούνται για σκοπούς τεχνολογίας υπολογιστικής όρασης απαιτούν ειδικά εξαρτήματα όπως θυγατρικές πλακέτες, γνωστές επίσης ως θυγατρικές κάρτες, και πλακέτες επεξεργαστών που έχουν σχεδιαστεί για να επιταχύνουν τη διαδικασία σχεδιασμού. Περιλαμβάνονται αισθητήρες όπως η ενσωμάτωση πολύ μεγάλης κλίμακας (VLSI) και οι αισθητήρες υπερύθρων (IR) για τη διευκόλυνση διαφόρων εργασιών, όπως η νυχτερινή όραση. Οι θερμικοί αισθητήρες χειρίζονται την αναγνώριση θερμότητας.
Οι μηχανισμοί λήψης καρέ έχουν εφαρμοστεί για τη λήψη μιας αναλογικής εικόνας που αποστέλλεται στον υπολογιστή από την κάμερα CCD ή άλλη συσκευή λήψης εικόνων και τη μετατροπή της σε ψηφιακή εικόνα σε κλίμακα του γκρι ή έγχρωμη. Περιλαμβάνονται επίσης δισδιάστατοι (2D) ή τρισδιάστατοι (3D) σαρωτές γραμμής, οι οποίοι βοηθούν στην ανίχνευση κηλίδων, στην ανίχνευση κίνησης και στην ανίχνευση άκρων. Σε ορισμένες εφαρμογές, όπως σκληρά περιβάλλοντα, μπορεί να χρησιμοποιηθούν ειδικά περιβλήματα για την προστασία του υλικού.
Η ρομποτική και η βιομηχανία ασφάλειας και επιτήρησης είναι δύο από τους κύριους τομείς που χρησιμοποιούν την τεχνολογία υπολογιστικής όρασης. Η ιατρική βιομηχανία και οι αστρονόμοι παίζουν επίσης μεγάλο ρόλο. Οι κάμερες CCD ή παρόμοια παρέχουν τη βασική εικόνα για την επεξεργασία του υπολογιστή, όπως ζητείται από τον προγραμματιστή. Οι εικόνες μπορούν να υποβληθούν σε επεξεργασία γενικά, παρέχοντας απλή ανίχνευση άκρων σε 2D, που επιτρέπει την εκτίμηση της κίνησης, ή σε 3D, η οποία στη συνέχεια επιτρέπει την εξαγωγή σχήματος.
Όλα τα διαφορετικά στυλ και οι διαμορφώσεις της τεχνολογίας υπολογιστικής όρασης χρησιμοποιούν αλγόριθμους που έχουν αναπτυχθεί ειδικά για σκοπούς βιογραφικού. Αυτοί οι αλγόριθμοι βοηθούν σε εργασίες όπως η βελτίωση των εικόνων και η εύρεση γραμμών για την αντιστοίχιση τους με μοντέλα. Η χρήση αλγορίθμων περιορίζει την ποσότητα των προς επεξεργασία δεδομένων στο ελάχιστο, εξάγοντας μόνο τις απαραίτητες πληροφορίες για μια ειδική εργασία.
Ενώ η όραση υπολογιστή εξελίσσεται συνεχώς παράλληλα με την τεχνολογία, παίζει ήδη σημαντικό ρόλο στους τομείς που αναφέρονται εδώ και σε πολλούς άλλους. Η ανίχνευση σημαδιών και η αναγνώριση προσώπου είναι σημαντικά στις εφαρμογές ασφαλείας. Η ρομποτική βασίζεται στην τεχνολογία υπολογιστικής όρασης για τον επιτυχή ελιγμό μη επανδρωμένων ή αυτόνομων οχημάτων. Οι τρέχουσες εφαρμογές της τεχνολογίας μπορεί να είναι μόνο η αρχή των πραγμάτων που μπορούν να γίνουν με αυτό το αναδυόμενο πεδίο όρασης υπολογιστή.