Το γονιδίωμα είναι μια συλλογή όλου του γενετικού υλικού που υπάρχει σε έναν οργανισμό. Καθώς η αλληλουχία και η δομή αυτού του γενετικού υλικού καθοδηγεί όλη τη βιολογική ζωή, οι επιστήμονες ενδιαφέρονται πολύ να μάθουν για ποιο σκοπό είναι όλα αυτά. Μια βάση δεδομένων γονιδιώματος είναι μια συλλογή πληροφοριών με διασταυρούμενη αναφορά για έναν ή περισσότερους οργανισμούς, έτσι ώστε ένας επιστήμονας να μπορεί να εξετάσει όλες τις διαθέσιμες γενετικές πληροφορίες για να τον βοηθήσει στην έρευνα.
Τα γονιδιώματα είναι εξαιρετικά πολύπλοκα και περιέχουν δισεκατομμύρια βάσεις στην αλληλουχία των πληροφοριών. Οι ηλεκτρονικές βάσεις δεδομένων, επομένως, είναι ο μόνος πρακτικός τρόπος οργάνωσης των λεπτομερειών σε ένα μέρος. Γενικά, αυτές είναι διαθέσιμες ως διαδικτυακές βάσεις δεδομένων για επιστημονική έρευνα. Ένα σχετικά νέο πεδίο επιστήμης, που ονομάζεται βιοπληροφορική, έχει αναδυθεί για να τελειοποιήσει τον τρόπο με τον οποίο τα βιολογικά δεδομένα μπορούν να ερμηνευτούν μέσω συστημάτων υπολογιστών.
Οι βάσεις δεδομένων των γονιδιωμάτων περιέχουν την αλληλουχία των γονιδίων ενός οργανισμού εάν είναι γνωστή ολόκληρη η αλληλουχία. Διαφορετικά, μπορεί να περιέχει μερικές ακολουθίες. Το γονιδίωμα του ανθρώπου, του ποντικού και της μύγας Drosophila έχει προσδιοριστεί, για παράδειγμα, αλληλουχία. Όταν είναι γνωστή η αλληλουχία ενός γονιδιώματος, οι γενετιστές μπορούν να αναγνωρίσουν συγκεκριμένα γονίδια στο γονιδίωμα. Κάθε γονίδιο είναι το φύλλο οδηγιών για ένα συγκεκριμένο κυτταρικό προϊόν.
Εάν ένα γονίδιο έχει μετάλλαξη, έχει διαφορετική αλληλουχία από το φυσιολογικό, λειτουργικό γονίδιο. Οι μεταλλάξεις μπορεί να είναι ευεργετικές και να παράγουν ένα χρήσιμο χαρακτηριστικό στον μεταλλαγμένο οργανισμό. Μπορεί επίσης να μην έχουν καμία διαφορά στο προϊόν ή μπορεί να είναι επιζήμιες για την κανονική λειτουργία του οργανισμού. Πολλές ιατρικές καταστάσεις, για παράδειγμα, οφείλονται σε μεταλλάξεις σε ένα συγκεκριμένο γονίδιο.
Οι μεταλλάξεις μπορούν επίσης να χρησιμοποιηθούν για τον υπολογισμό της στενής σχέσης ενός συγκεκριμένου είδους με ένα άλλο, καθώς με την πάροδο του χρόνου συσσωρεύονται περισσότερες μεταλλάξεις. Τα άτομα μπορεί επίσης να διαφέρουν ως προς την αλληλουχία του γονιδιώματος, ειδικά καθώς μεγάλα τμήματα του γονιδιώματος δεν είναι γονίδια και δεν κωδικοποιούν κανένα βασικό κυτταρικό προϊόν. Μια βάση δεδομένων γονιδιώματος περιέχει μια ακολουθία από έναν οργανισμό που έχει οριστεί ως πρότυπο, αλλά θα υπάρχουν πολλές μικρές διαφορές μεταξύ του αυθαίρετα επιλεγμένου προτύπου και των άλλων ατόμων σε ένα είδος.
Παρά την παρουσία πολλών διαφορών, τα γονίδια είναι αναγνωρίσιμα μέσω αλληλουχιών. Εάν οι γενετιστές γνωρίζουν τι κάνει ένα συγκεκριμένο γονίδιο σε έναν οργανισμό, τότε πιθανότατα την ίδια λειτουργία εκτελεί ένα γονίδιο με παρόμοια αλληλουχία σε άλλο ζώο. Οι γενετιστές μπορούν να χρησιμοποιήσουν μια βάση δεδομένων γονιδιώματος είτε για να αναγνωρίσουν ένα γονίδιο που μελετούν είτε για να ανακαλύψουν τι κάνει το γονίδιο.
Κάθε βάση δεδομένων γονιδιώματος μπορεί να αναζητηθεί. Συνήθως, οι επιστήμονες μπορούν να αναζητήσουν μια βάση δεδομένων με πολλούς διαφορετικούς τρόπους. Συνήθως, αυτός ή αυτή μπορεί να εισάγει την αλληλουχία ενός γονιδίου που έχει καθορίσει την αλληλουχία του. Στη συνέχεια, η βάση δεδομένων βρίσκει μία ή περισσότερες παρόμοιες ακολουθίες για σύγκριση.
Ένας απλούστερος τρόπος αναζήτησης στη βάση δεδομένων περιλαμβάνει την αναζήτηση μιας λέξης κλειδιού γονιδίου, όπως το όνομα του γονιδίου. Αρχές όπως η Εθνική Αρχή Πληροφοριών Βιοτεχνολογίας των ΗΠΑ (NCBI) μπορούν να δώσουν στις αλληλουχίες διαφορετικούς αριθμούς αναφοράς και ένας γενετιστής μπορεί επίσης να αναζητήσει μια βάση δεδομένων γονιδιώματος χρησιμοποιώντας ένα από αυτά τα αναγνωριστικά. Μπορεί επίσης να περιορίσει τα αποτελέσματα χρησιμοποιώντας περισσότερες παραμέτρους αναζήτησης. Οι πληροφορίες διασταύρωσης είναι χαρακτηριστικό των περισσότερων βάσεων δεδομένων γονιδιώματος και ένα αποτέλεσμα μεμονωμένης ακολουθίας θα παρέχει επίσης στο χρήστη της βάσης δεδομένων χρήσιμους συνδέσμους για περισσότερες γενετικές πληροφορίες. Εκτός από πληροφορίες για μια συγκεκριμένη ακολουθία, πολλές βάσεις δεδομένων παρέχουν μια οπτική αναπαράσταση της ακολουθίας και των αξιοσημείωτων χαρακτηριστικών αυτής της περιοχής.
Διαφορετικοί οργανισμοί μπορούν να έχουν συγκεκριμένες βάσεις δεδομένων γονιδιώματος, αλλά ορισμένες μεγαλύτερες βάσεις δεδομένων περιέχουν περισσότερα από ένα είδη. Διάφορες αρχές ελέγχουν τις διαφορετικές διαθέσιμες βάσεις δεδομένων, έτσι ώστε όλες οι βάσεις δεδομένων να μπορούν να χρησιμοποιούν ξεχωριστές μορφές και δυνατότητες αναζήτησης. Μερικά παραδείγματα αυτών των αρχών περιλαμβάνουν το NCBI, το Ευρωπαϊκό Ινστιτούτο Βιοπληροφορικής ή ακόμη και μεμονωμένα πανεπιστήμια.