O secvență consens este un set de proteine sau nucleotide din acidul dezoxiribonucleic (ADN), care apare în mod regulat. ADN-ul este compus din nucleotide și fiecare nucleotidă este compusă dintr-un fosfat, un zahăr și o bază azotată. Bazele azotate pot fi adenina (A), timina (T), guanina (G) și citozina (C). Secvența acestor baze chimice determină codul genetic al unui organism. Codul genetic este ca o instrucțiune pe baza căreia este construit și întreținut un organism. Biologii moleculari folosesc adesea statisticile pentru a prezice locația secvențelor sau pentru a înțelege unde tind să se lege anumite molecule. Formulele pot fi utilizate pentru a reprezenta locații în care secvențele de aminoacizi rămân aceleași și locații în care acestea variază. În cazul unei secvenţe de promotor consens, de exemplu, un anumit tip de enzimă se poate lega la situsuri ale proteinelor secvenţiate similar.
Geneticienii, ca și cercetătorii din multe discipline științifice, folosesc adesea substituții pentru a simplifica sistemele complexe. Există atât de multe baze de aminoacizi și gene în organism încât oamenii de știință nu le pot număra decât dacă există un sistem general pentru a face acest lucru. O secvență consens poate apărea în multe locații din ADN, precum și în diferite viețuitoare. Asemănările și diferențele care tind să apară pot fi indicate printr-o formulă.
Statistic, oamenii de știință pot clasifica secvențele genetice pentru a căuta modele. Modelele repetate, numite motive de secvență, sunt în general folosite pentru a reprezenta zone genetice care controlează procese biologice specifice. Secvențele de consens pot oferi, de asemenea, o perspectivă asupra modului în care proteinele sunt sintetizate sau cum sunt ghidate moleculele într-o celulă.
În notarea unei secvențe consens, locația unor nucleotide poate arăta că acestea sunt întotdeauna în locația reprezentată. De asemenea, se poate indica faptul că o nucleotidă sau alta poate fi acolo. În acest caz, cât de des apare un aminoacid în locul altuia, în general, nu este menționat. Un model grafic este uneori folosit pentru a indica această frecvență, prin creșterea sau micșorarea dimensiunii simbolurilor. Unele programe software pot genera automat logo-uri de secvențe.
Adesea, o secvență consens se potrivește cu un situs recunoscut de legare a proteinei. Pentru a descrie cu acuratețe secvențele de pe genom, se folosesc adesea formule matematice. Acestea includ formule statistice precum logaritmii și valorile numerice, care pot fi pozitive sau negative, pentru a reprezenta locația informațiilor genetice. Procesele din genom pentru funcțiile biologice normale, precum și cele legate de boli, pot fi analizate în acest fel.
Reprezentările matematice ale unei secvențe consens oferă în general un model de modele de ADN și aminoacizi. De obicei, nu este furnizată o imagine exactă. Secvențele, totuși, pot ajuta oamenii de știință să relaționeze aspectele funcționale ale diferitelor părți ale genomului cu modelele evolutive ale organismelor.