Ce sunt datele brute?

Datele brute, cunoscute și ca date sursă sau date atomice, sunt informații care nu au fost procesate pentru a fi afișate sub nicio formă prezentabilă. Forma brută poate părea foarte de nerecunoscut și aproape lipsită de sens fără procesare, dar poate fi și într-o formă pe care unii o pot interpreta, în funcție de situație. Aceste date pot fi prelucrate manual sau de către o mașină.

În unele cazuri, datele brute pot fi nimic mai mult decât o serie de numere. Cu toate acestea, felul în care aceste numere sunt secvențiate și, uneori, chiar și modul în care sunt distanțate, pot fi informații foarte importante. Un computer poate interpreta aceste informații și poate oferi o citire care apoi poate avea sens pentru cititor.

Codul binar este un bun exemplu de date brute. Luat de la sine ca o imprimare, un cod binar face foarte puțin pentru utilizatorul de computer – cel puțin marea majoritate a utilizatorilor. Când este procesat printr-un computer, pe de altă parte, oferă informații mai ușor de înțeles. De fapt, codul binar este de obicei codul sursă pentru tot ceea ce vede un utilizator de computer.

În unele cazuri, este posibil ca acest tip de date să nu fie văzute niciodată în forma sa finală, în special de către cei care lucrează în aplicațiile de introducere a datelor. În aceste situații, utilizatorul este responsabil doar pentru introducerea informațiilor și, uneori, persoana care introduce datele poate nici măcar să nu știe exact ce introduce sau de ce. Acest lucru este util în special atunci când securitatea sau confidențialitatea este importantă, deoarece ajută la asigurarea că niciun lucrător nu introduce informații părtinitoare sau false în mod intenționat în scopul de a răni sau de a beneficia pe cineva.

De exemplu, în unele aplicații medicale, pot exista reglementări foarte stricte cu privire la confidențialitatea pacientului, dar este posibil ca datele să fie încă introduse într-o bază de date. Pentru a preveni cât mai multe persoane să identifice pacienții, fiecăruia i se poate atribui un număr. Condițiile lor pot fi, de asemenea, atribuite un număr, precum și opțiunile lor de tratament. Fără cunoașterea a ceea ce înseamnă acele numere, nu există nicio modalitate de a identifica pacientul sau starea. Aceste informații de identificare pot fi disponibile doar pentru o mână de oameni.

Acest exemplu este de fapt destul de neobișnuit, deoarece informațiile sunt rareori convertite într-o formă considerată brută. În schimb, datele brute sunt de obicei procesate pentru a le face mai rafinate. Există, totuși, multe aplicații diferite în care apar date neprocesate, iar regulile cu privire la ce să faci cu acestea depind de situație.