Asamblarea genomului se referă la procesul de preluare a multor bucăți mici de secvență genetică și de îmbinare a acestora într-un întreg coerent care reprezintă întregul genom al unui organism. Acesta este un obiectiv major al domeniului bioinformaticii și există o varietate de proiecte genomice în acest scop. Ansamblul genomului a fost folosit pentru a începe analiza genomului multor specii, inclusiv oameni, plante, animale și bacterii.
Analiza genelor unui organism este un proces lung, iar asamblarea genomului este unul dintre primii pași. Multe alte metode de analiză sunt construite pe asamblarea de succes, iar identificarea genelor nu poate progresa fără aceasta. Chiar înainte ca genele să fie găsite, un ansamblu de genom de succes poate genera o mulțime de informații utile pentru analize ulterioare, inclusiv dimensiunea genomului, structura și compoziția sa generală.
Procesul de asamblare a genomului este ca și cum ați pune un puzzle împreună fără a avea ca ghid o imagine sau forme utile. Când te confrunți cu primele bucăți de genom, numite citiri brute, rareori există indicii unde merge o anumită bucată sau chiar cum este orientată. Fiecare piesă este codificată în mod similar cu cele patru baze ADN, prescurtate A, C, G și T. Genomul poate fi compactat într-un singur cromozom mare sau împărțit în mai multe. De asemenea, nu există nicio garanție că unele dintre citirile brute nu sunt duplicate ale aceleiași zone ale genomului, ceea ce ar însemna că există mai puține informații unice decât pare la prima vedere.
Cunoștințele generale despre structura genomului sunt de neprețuit atunci când începe procesul de asamblare. Deși genomurile dintre specii sunt semnificativ diferite, există anumite reguli pe care le urmează anumite tipuri de genom și acestea pot fi aplicate atunci când puneți împreună un alt genom de același tip. De exemplu, dacă un anumit tip de organism are întotdeauna un anumit model în apropierea locului unde se găsesc genele, s-ar putea presupune în mod rezonabil, atunci când se adună un alt organism similar cu acesta, că găsirea unui astfel de model ar semnala o genă în apropiere. La o scară mai mare, mulți genomi bacterieni au un cromozom circular, așa că ar fi rezonabil să anticipăm că toate citirile brute ale unei bacterii noi s-ar potrivi într-un fel pe un singur cromozom. Aplicarea cunoștințelor genetice generale în acest fel poate permite unui cercetător să înceapă să înțeleagă potențial sute de mii de date.
Există multe alte metode care pot fi utilizate în asamblarea genomului, inclusiv predicții computaționale și comparații manuale. Indiferent de metodă, asamblarea genomului este o sarcină mare, care este adesea consumatoare de timp și dificilă. Deoarece este baza pentru multe analize genetice viitoare asupra unui organism, există puțin loc pentru erori.