Η «ανάλυση βιοπληροφορικής» είναι ένας όρος που χρησιμοποιείται για να περιγράψει ένα σύνολο τεχνικών που χρησιμοποιούν ηλεκτρονικά συστήματα για τη συλλογή και ανάλυση μεγάλων σωμάτων βιολογικών δεδομένων. Η βιοπληροφορική είναι μια διεπιστημονική προσέγγιση των βιολογικών προβλημάτων και συχνά περιλαμβάνει εκτεταμένη χρήση της επιστήμης των υπολογιστών και των μαθηματικών εκτός από τις παραδοσιακές προσεγγίσεις βιολογίας και χημείας που χρησιμοποιούνται συνήθως για την αντιμετώπιση βιολογικών προβλημάτων. Πολλές από τις κεντρικές τεχνικές στη βιοπληροφορική ανάλυση βασίζονται σε στατιστικές. Περιλαμβάνουν τη συλλογή μεγάλου όγκου δεδομένων, γενικά από πολλά πειράματα και μερικές φορές από πολλά διαφορετικά εργαστήρια, και την αναζήτηση στατιστικών τάσεων και σημαντικών συσχετίσεων. Οι εφαρμογές της ανάλυσης βιοπληροφορικής περιλαμβάνουν ανάλυση αλληλουχίας DNA, ανάλυση γονιδιακής έκφρασης και ρύθμισης και συγκρίσεις γονιδιωμάτων διαφορετικών οργανισμών.
Πολλές διαφορετικές τεχνικές χρησιμοποιούνται στην ανάλυση βιοπληροφορικής με βάση τα συγκεκριμένα βιολογικά προβλήματα που πρέπει να επιλυθούν. Σε ορισμένες περιπτώσεις, η βιοπληροφορική περιλαμβάνει απλώς τη συγκέντρωση μεγάλων σωμάτων πληροφοριών σε μια ενιαία βάση δεδομένων και τη διεξαγωγή βασικών στατιστικών αναλύσεων για τα δεδομένα που συλλέγονται. Άλλα περιλαμβάνουν πολύ πιο λεπτή χειραγώγηση των συλλεγόμενων πληροφοριών και μπορεί να περιλαμβάνουν πολύπλοκα, μαθηματικά εμπλεκόμενα προγράμματα υπολογιστή. Το μόνο κοινό πράγμα που έχουν οι περισσότερες μέθοδοι στη βιοπληροφορική είναι ότι περιλαμβάνουν τη συλλογή, τον χειρισμό και την ανάλυση μεγάλων σωμάτων πληροφοριών που συλλέγονται κατά τη διάρκεια πειραμάτων.
Μία από τις πιο σημαντικές χρήσεις της ανάλυσης βιοπληροφορικής είναι η ανάλυση αλληλουχιών κλώνων δεοξυριβονουκλεϊκού οξέος (DNA). Τα μόρια DNA περιέχουν τον γενετικό κώδικα που κατευθύνει τη δομή και τη λειτουργία όλων των οργανισμών. Ενώ χρησιμοποιήθηκαν οι πρώιμες μη αυτόματες μέθοδοι αλληλουχίας, ήταν πολύ αργές και εντελώς απίθανες για έργα αλληλουχίας μεγάλης κλίμακας. Η τεχνολογία ανάλυσης βιοπληροφορικής επιτρέπει την πολύ γρήγορη αλληλουχία που είναι πολλές φορές ταχύτερη από τη χειροκίνητη αλληλουχία και είναι κατάλληλη για έργα μεγάλης κλίμακας. Η αλληλουχία DNA, καθώς και η αλληλουχία ριβονουκλεϊκού οξέος (RNA) και η αλληλουχία πρωτεϊνών, μπορούν να χρησιμοποιηθούν για τη σύνδεση διαφόρων δομών και λειτουργιών με τους γενετικούς τους κώδικες, για τον εντοπισμό μεταλλάξεων και για τη σύγκριση των γονιδιωμάτων διαφορετικών οργανισμών.
Ο αυτοματισμός είναι ένας από τους κύριους στόχους της ανάλυσης βιοπληροφορικής. Υπάρχουν πολλές διαφορετικές καταστάσεις στη βιολογική και βιοϊατρική έρευνα που περιλαμβάνουν την ανάλυση μεγάλου όγκου πληροφοριών. Αν και είναι συνήθως δυνατό να αναλυθούν αυτές οι πληροφορίες με μη αυτόματο τρόπο, υπάρχουν συχνά τόσες πολλές πληροφορίες που ένα μεμονωμένο εργαστήριο θα μπορούσε να λειτουργήσει για εβδομάδες ή περισσότερο για να κατανοήσει σχετικά μικρά σώματα πληροφοριών. Η ανάλυση βιοπληροφορικής μπορεί να χρησιμοποιηθεί για την ανάλυση των πληροφοριών, έτσι ώστε οι ερευνητές να μπορούν να αφιερώσουν το χρόνο τους δημιουργώντας περισσότερα δεδομένα. Η ικανότητα ανάλυσης περισσότερων δεδομένων μπορεί να οδηγήσει σε πιο ακριβείς, συναρπαστικές και σημαντικές πληροφορίες.