O funcție hash este o metodă de verificare a erorilor computerului și de organizare a datelor. O cantitate mare de date este manipulată cu un algoritm matematic până când rămâne un număr mic. Acest număr este folosit ca parte a catalogului, care permite unui computer să găsească ulterior acea informație specifică. O funcție hash bună ar trebui să dea un rezultat suficient de mic, astfel încât să fie ușor de utilizat, dar să ofere un rezultat unic pentru fiecare set de date. O funcție hash oferă, de asemenea, o verificare minimă a erorilor, deoarece o bucată de date coruptă și bună ar trebui să producă rezultate diferite atunci când este analizată.
Într-o bază de date computerizată, este de obicei mai ușor să salvați locațiile cu cifre, mai degrabă decât cu litere. Cifrele au un număr mult mai mare de metode de organizare și sortare decât literele. Ca rezultat, numerele sunt adesea atribuite locațiilor care conțin informații variabile în baza de date a unui computer. Aceste numere pot fi arbitrare sau reprezentative pentru informații.
Numerele arbitrare sunt atribuite pur și simplu în funcție de poziția din memoria computerului sau de ordinea în care au fost salvate datele. Salvarea informațiilor în acest fel este obișnuită în bazele de date mai mici sau în locurile în care datele nu se schimbă foarte des. Când este folosită în alte zone, reindexarea bazei de date începe să dureze din ce în ce mai mult timp până când nu mai este eficientă.
Informația reprezentativă este locul unde intervine funcția hash. Informația, indiferent de ceea ce conține, este tradusă în numere. Aceste numere sunt introduse într-un construct matematic care produce un număr mic, de obicei un întreg. Dacă funcția hash funcționează corect, fiecare locație din acea parte a bazei de date va avea propriul rezultat unic. Dacă două sau mai multe locații au același rezultat, programele ar putea afișa informații greșite pe baza hash-ului duplicat.
Este posibil să utilizați o funcție hash și pentru alte lucruri. Cantități mari de date foarte repetitive pot fi împărțite în valori mai mici. Acest lucru este deosebit de plăcut când căutați secvențe repetate în seturi mari de date. De exemplu, acidul dezoxiribonucleic (ADN) este format dintr-un număr foarte mic de componente diferite. Când defalc aceste componente folosind valori hash, locurile în care două șiruri de ADN sunt identice și diferite devin foarte clare, pur și simplu din compararea a două coloane mici de numere.
Ultimul domeniu în care funcțiile hash sunt utile este verificarea erorilor. Când informațiile sunt hashing inițial, valoarea este înregistrată ca parte a indexului locației. Dacă aceste informații sunt necesare mai târziu, informațiile sunt preluate împreună cu acea valoare. Dacă programul rehash informațiile și rezultatul este diferit, atunci a avut loc o corupție la un moment dat. Această corupție este de obicei cu datele, deoarece o corupție hash ar fi împiedicat în primul rând recuperarea datelor.