Sumele de control sunt blocuri fixe de informații, sau date, utilizate pentru a verifica și menține integritatea datelor atunci când se stochează și se transmit informații computerizate. Folosind funcții matematice, un algoritm de sumă de control calculează numărul de biți dintr-un anumit bloc de informații și generează un număr care reprezintă date precise. Când datele sunt duplicate prin orice mijloace, duplicatul este apoi verificat cu numărul inițial, prin valoarea calculată. Dacă numerele se potrivesc, datele sunt considerate complete și exacte.
Majoritatea protocoalelor de transfer de fișiere (FTP) valide necesită un fel de verificare a datelor, iar multe funcții sunt capabile nu numai să detecteze, ci și să repare probleme minore cu integritatea datelor. Unele tipuri de sume de control, cunoscute și sub denumirea de sume hash, includ md5 și verificări de redundanță ciclică (CRC). CRC-urile sunt un tip de sumă de control cunoscută sub numele de sumă de control de cod polinomial, capabilă să identifice modificări accidentale ale formatului de date original.
Deși sunt utile pentru detectarea erorilor în fișierele descărcate pe web sau prin rețele peer-to-peer (P2P), sumele de verificare sunt utilizate și în orice funcție în care datele pot fi corupte atunci când sunt transferate printr-o rețea sau într-un mediu de stocare. Erorile de date sunt adesea cauzate de biți lipsă, duplicați sau incorecți. Deoarece valoarea unei sume de control este calculată pe baza fiecărui bit dintr-un bloc de date, chiar și un bit lipsă poate provoca o eroare a sumei de control.
Majoritatea fișierelor codifică sumele de verificare direct în datele lor, de obicei atașate la sfârșitul fișierului. Când fișierul este transferat către un alt sistem sau dispozitiv, receptorul citește suma de control și își folosește algoritmul pentru a verifica dacă întregul fișier a fost primit fără eroare. Este posibil ca fișierele cu biți lipsă, corupti sau repeți să nu funcționeze corect sau să nu funcționeze deloc. Alții pot părea că funcționează corect, în ciuda faptului că nu reușesc suma de control. Datele incomplete sau corupte pot continua să se degradeze în timp, până când devin inutilizabile sau provoacă erori.
Datorită naturii lor, sumele de control de bază sunt în general utile doar în verificarea și repararea blocurilor mici de date. Pe măsură ce cantitatea de informații crește, la fel crește și probabilitatea unei erori, suma de control nu o poate detecta sau corecta. Acest lucru poate face ca datele corupte să treacă în mod repetat suma de control, să genereze mai multe erori și chiar să corupă datele sumei de control.
Verificările de redundanță ciclică, din cauza complexității crescute a algoritmilor lor, au o rată de eroare mult mai mică decât o sumă de control standard și pot fi aplicate la blocuri mai mari de date. Deși CRC-urile nu sunt sigure, ele oferă totuși o mai mare fiabilitate atunci când verifică și păstrează integritatea datelor. Unele software oferă, de asemenea, capacitatea de sumă de control și repararea erorilor bazate pe funcții personalizate.