Un caracter larg este un caracter de computer care are o dimensiune care depășește măsurarea standard de 8 biți. Caracterele dintr-un set de computer, cum ar fi Setul de caractere universal (USC) ilustrează un exemplu excelent de caractere largi, deoarece USC poate fi codificat în formate de 16 biți sau 32 de biți. Aceasta diferă de seturile de caractere mai vechi, standardizate, cum ar fi Codul standard american pentru schimbul de informații (ASCII), care utilizează caractere de cel mult 7 biți. Avantajul codificării seturi de caractere în caractere largi este că permite mai mult spațiu de respirație atunci când vine timpul să adăugați simboluri suplimentare și complexe la set, oferind designerilor de caractere o gamă mai largă de libertate. Dezavantajele vin sub forma unui consum suplimentar de memorie, deoarece seturile largi de caractere folosesc mai multă memorie de sistem în timp ce sunt active pe computer.
Seturile de caractere trebuie personalizate pentru a funcționa cu sisteme de operare specifice, iar caracterele largi nu sunt diferite. Pentru sistemele de operare Windows® – ambele versiuni pe 32 și 64 de biți – seturile de caractere late trebuie să fie adaptate pentru a se potrivi într-un cadru de 16 biți, oferind o capacitate de stocare de două ori mai mare pentru fiecare caracter în comparație cu un set „standard” de 8 biți. Unix®, pe de altă parte, necesită caractere largi pentru a se potrivi într-un cadru de 32 de biți, oferind de patru ori capacitatea unui set de caractere de bază.
Cel mai mare avantaj al seturilor largi de caractere este că permit simboluri non-standard și o mai mare versatilitate în includerea diferitelor limbi în interfețele lor. De exemplu, seturile largi de caractere pot include alfabetul standard englez, împreună cu limbi precum chirilica și greacă în același timp. Aceasta înseamnă că un singur set de caractere largi se poate aplica persoanelor care acoperă mai multe țări, spre deosebire de necesitatea unui set unic de caractere non-larg pentru fiecare regiune lingvistică individuală.
Deși este util pentru a ajuta la standardizarea versiunilor de software în diferite regiuni lingvistice, seturile de caractere largi au un preț. Acest preț este un cost suplimentar pentru supraîncărcarea memoriei. În timp ce un set de caractere pe 16 biți oferă o capacitate dublă față de un set standard de 8 biți, consumă, de asemenea, de două ori mai multă memorie. Același lucru este valabil și pentru seturile de caractere pe 32 de biți, care înghită o memorie semnificativă de patru ori mai multă decât seturile de caractere convenționale.
Din punct de vedere informatic și statistic, acesta este un „cost” semnificativ pentru memorie. Cu toate acestea, în aplicarea practică, costul nu este atât de mare pe cât ar părea. Calculatoarele moderne conțin adesea patru sau mai mulți gigaocteți de memorie de sistem, făcând stocarea chiar și a unui set mare de caractere de 32 de biți destul de neglijabilă în practică. Doar cele mai suprasolicitate – sau cu putere redusă – computere vor observa o performanță semnificativă în urma utilizării seturilor de caractere largi.