„Proliferarea datelor” este un termen umbrelă care se referă la numărul mare de fișiere și cantitatea de date stocate de entități precum guverne și companii. Cantitatea masivă de date care vin zilnic înseamnă că aceste entități au nevoie de mai mult spațiu și hardware, dar proliferarea datelor se mișcă mai rapid decât progresele computerelor din 2011. Nu contează ce tip de informații sunt stocate – dacă sunt structurate sau nestructurate; tot ce contează este că memoria computerului este ocupată. Stocarea tuturor acestor date poate fi dificilă, ceea ce duce la costuri suplimentare. O altă problemă cu proliferarea datelor este că rețeaua în care sunt stocate datele și toate programele asociate tind să încetinească.
Problema proliferării datelor nu este una care să preocupe cu ușurință consumatorii și utilizatorii medii de computere. În timp ce utilizatorii medii de computere au avut nevoie de mai multă memorie de-a lungul timpului, computerele au reușit să avanseze într-un ritm care să satisfacă aceste nevoi. Când vine vorba de întreprinderi, guverne și alte entități care colectează zilnic date masive, însă, problema proliferării datelor se poate manifesta.
Dacă un utilizator obișnuit de computer are nevoie de mai multă memorie de computer, de obicei primește un hard disk mai mare. Când o entitate mare are nevoie de mai multă memorie, de obicei trebuie să obțină mai multe servere. La un ritm normal, acest lucru nu ar trebui să prezinte probleme, dar multe entități mari în 2011 stochează cantități tot mai mari de date la rate care depășesc tehnologia și poate fi necesar un număr masiv de servere pentru a păstra tot ce trebuie să stocheze entitatea. Acest lucru se datorează faptului că tehnologia informatică nu este încă capabilă să facă un dispozitiv capabil să dețină toate informațiile, ceea ce înseamnă că o entitate mare trebuie să continue să cumpere și să utilizeze tot mai mult hardware.
Unii termeni sau probleme de date se referă doar la un tip de informații. Când vine vorba de proliferarea datelor, totuși, nu contează ce tip de date sunt implicate. Atâta timp cât memoria computerului este ocupată într-un ritm rapid, atunci proliferarea datelor devine o problemă.
Una dintre numeroasele probleme legate de proliferarea datelor este costul. Pe lângă costul hardware-ului de stocare suplimentar, există și costuri de stocare fizică și resurse umane. Serverele trebuie amplasate undeva și oamenii trebuie să fie angajați pentru a rula serverele, rezultând costuri care, teoretic, ar putea deveni prea mari pentru ca o entitate să le susțină și să conducă la profituri foarte scăzute. O altă problemă se referă la viteza rețelei, deoarece înfundarea datelor poate duce programele să se miște mult mai lent, ceea ce înseamnă că angajații pot lucra mai puțin în timpul unei zile de lucru.