Destinată ca o soluție pentru situațiile în care aplicațiile critice, cum ar fi bazele de date, serverele web și platformele de partajare de fișiere, trebuie să fie disponibile în orice moment, o rețea de echilibrare a sarcinii are capacitatea de a scala performanța în funcție de utilizarea sistemului. Face acest lucru prin distribuirea traficului într-un număr de clustere de servere care alcătuiesc sistemul general, cunoscut sub numele de gazdă. De obicei, caracteristicile la nivel de întreprindere, cum ar fi accesul la Internet, proxy-urile, rețeaua privată virtuală, streaming media și aplicațiile specializate sunt acceptate de o rețea de echilibrare a încărcăturii. Utilizatorii care implementează aplicații de comerț electronic pot găsi valoare într-o rețea de echilibrare a sarcinii, având în vedere capacitatea acesteia de a-și apropia dinamic resursele în raport cu cererea.
Teoria din spatele unei rețele de echilibrare a încărcăturii este de a îmbunătăți performanța prin distribuirea cererilor utilizatorilor între un număr de servere, reducând sarcina pe orice server la un moment dat. În plus, o rețea de echilibrare a încărcăturii are de obicei capacitatea de a monitoriza și compensa defecțiunile dispozitivului, minimizând sau eliminând timpul de nefuncționare potențial în cazul în care un singur server sau chiar mai multe servere se defectează. Echilibrarea încărcăturii utilizează mai multe copii ale aceleiași aplicații TCP/IP (Transmission Control Protocol/Internet Protocol), de exemplu un server web sau o aplicație de comerț electronic, și le leagă de un singur IP primar folosind un număr de adrese IP virtuale. Efectul pentru un utilizator final este integrarea perfectă și aspectul că aplicația funcționează de pe un singur server. Pentru toate scopurile, aplicația funcționează ca și cum s-ar afla și pe un singur server.
Când funcționează corect, o rețea de echilibrare a sarcinii este capabilă să interpreteze datele primite și să proceseze simultan cererile discrete. Aceasta înseamnă că diferite elemente ale aceluiași site web pot fi alimentate din grupuri diferite, de exemplu. Folosind rapoarte prestabilite sau distribuție statistică, o rețea de echilibrare a sarcinii urmărește utilizarea clientului și răspunde prin direcționarea dinamică a cererilor către diferite clustere de servere. Prin ping-uri repetitive, serverele de cluster comunică între ele și sunt capabile să compenseze într-o perioadă scurtă de timp în urma oricărei defecțiuni sau deconectare a unui anumit cluster de la întreg. De obicei, în astfel de cazuri, software-ul clientului va reîncerca automat conectarea, iar întârzierea este practic imperceptibilă.
Gestionarea unei rețele de echilibrare a încărcăturii este similară în practică cu gestionarea oricărui alt server. Un administrator se poate conecta de la distanță la diferite clustere din orice punct din rețea. Este posibil să se exercite control granular asupra serverelor individuale dintr-un cluster, deși algoritmul de echilibrare a încărcăturii poate gestiona și controlul deplin. Actualizările de sistem și chiar de hardware sunt în general posibile „din mers”, ceea ce poate fi benefic în aplicațiile în care timpul de funcționare este esențial.