Se estimează că corpul uman poate conține peste două milioane de proteine, codificate de doar 20,000 – 25,000 de gene. Numărul total găsit în organismele biologice terestre este probabil să depășească zece milioane, dar nimeni nu știe sigur. Sunt disponibile date pentru puțin peste un milion dintre ele, luate în principal din informațiile găsite în cele peste 100 de genomi care au fost secvențiați complet.
Domeniul care analizează proteinele în general și își propune să le caracterizeze exhaustiv pe toate cele din corpul uman se numește proteomică. Mulți văd că următorul pas logic după finalizarea Proiectului Genomului Uman este inițierea unui Proiect Proteom uman. Organizația Human Proteome a fost fondată pentru a urmări acest obiectiv.
Proteinele sunt lanțuri moleculare lungi formate din cele 20 de blocuri de bază ale vieții, aminoacizi. Cel mai lung cunoscut, titina, cunoscută și sub denumirea de connectină, conține 26,926 de aminoacizi. Titinul se găsește în mușchi și contribuie la rigiditatea sa pasivă. Deoarece cei 20 de aminoacizi pot fi conectați în secvențe arbitrare, spațiul total al proteinelor posibile este exponențial, cu o valoare de aproximativ 2050,000 – un număr extraordinar. În acest spațiu pot exista tratamente pentru fiecare boală sau afecțiune, dar localizarea lor într-un număr atât de mare este o provocare profundă de calcul și teoretic.
Cuvântul proteină provine din grecescul prota, care înseamnă „de importanță primordială”. Acesta este un nume potrivit, deoarece importanța lor centrală în corpul uman nu poate fi supraestimată. Toate organismele biologice pot fi văzute fundamental ca structuri proteice umplute cu apă și uneori susținute de țesuturi mineralizate numite os. Pentru aproape fiecare, există altul care o poate descompune. Ele se unesc uneori în unități care cooperează reciproc, numite complexe, care îndeplinesc funcții biologice utile. Fiecare secțiune de informații genetice utile, găsită în ADN și în unele ARN, codifică o proteină corespunzătoare care continuă să îndeplinească un rol biologic util.