Un editor de text Unicode este un software de calculator care poate fi folosit pentru a crea, edita sau vizualiza text într-o varietate de alfabete. Stochează informații în Unicode, un standard internațional în evoluție pentru reprezentarea limbilor umane. Un editor de text Unicode este deosebit de util cu alfabetele non-latine, inclusiv cele care sunt citite de la dreapta la stânga. Editorii Unicode sunt folosiți în întreaga lume pentru a crea documente, conținut de pagini web și text pentru aplicații software în multe limbi.
Standardul Unicode a fost propus pentru prima dată la sfârșitul anilor 1980 de primii membri ai Consorțiului Unicode; această organizație non-profit coordonează dezvoltarea standardului la nivel mondial. Versiunile timpurii ale Unicode au fost concepute pentru a găzdui majoritatea limbilor utilizate în acel moment. În 1996, capacitatea sa a crescut la peste un milion de caractere distincte, permițând chiar și hieroglifele egiptene antice să fie introduse și afișate cu un editor de text Unicode. Standardul Unicode definește în mod specific mai mult de 107,000 de caractere. Chiar și litere și simboluri mai complexe pot fi create folosind aceste blocuri predefinite.
Unicode este acceptat într-o oarecare măsură în majoritatea browserelor web, aplicațiilor software și sistemelor de operare moderne. Înainte de Unicode, existau multe metode diferite de reprezentare a alfabetelor non-latine, cele mai multe dintre ele incompatibile între ele. Acest lucru a făcut foarte dificilă introducerea sau afișarea textului în mai multe limbi simultan. Un editor de text Unicode reprezintă și stochează un astfel de conținut într-un mod coerent și bine definit — textul creat poate fi partajat cu ușurință cu alte aplicații și pagini web compatibile cu Unicode din întreaga lume.
Un editor de text Unicode cu funcții complete permite, în general, introducerea informațiilor de la tastatură într-un mod care este natural pentru o anumită limbă. De exemplu, ebraică, arabă și alte limbi care sunt scrise de la dreapta la stânga pot fi introduse și afișate în acea direcție cu un editor Unicode. În același document pot fi incluse mai multe limbi, chiar dacă sunt scrise în direcții diferite. Nu toate caracterele pot fi introduse cu ușurință folosind o tastatură localizată – de obicei sunt furnizate metode de introducere alternative, inclusiv alegerea dintr-o listă de pe ecran și codificarea numerică.
Un editor de text Unicode poate importa fișiere într-o varietate de formate, cum ar fi Unified Hangul Code sau Thai. În timpul încărcării, orice caractere Unicode codate numeric pot fi convertite automat în simboluri Unicode reale. Fișierele text pot fi salvate de obicei în Unicode sau American Standard Code for Information Interchange (ASCII) cu caractere non-latine reprezentate numeric. Conținutul poate fi stocat frecvent în format HyperText Markup Language (HTML) cu codificare Unicode UTF-8, permițând afișarea corectă în browserele web moderne.
Editorii de text Unicode permit adesea selectarea diferitelor fonturi și culori pentru limbi individuale, facilitând lucrul cu un amestec de conținut. „Combinarea caracterelor”, cerută de unele limbi pentru a conecta simboluri individuale, poate fi de obicei ascunsă sau afișată. În timpul editării, blocurile de text pot fi reordonate. Ele pot fi adesea convertite dintr-un caz în altul sau din entități HTML în caractere Unicode. Mulți editori includ, de asemenea, funcții care simplifică introducerea și editarea limbilor asiatice, conversia textului între chineza simplificată și chineza tradițională sau între transliterații și reprezentări Unicode, de exemplu.
Multe editoare de text Unicode sunt disponibile comercial sau prin intermediul comunității open source. Majoritatea procesoarelor de text moderne și open source pot acționa și ca editori Unicode. Mai multe instrumente de proiectare a paginilor web și editori de e-mail fac, de asemenea, acest lucru. Editorii de text Unicode sunt în general disponibile pentru toate sistemele de operare majore și există, de asemenea, câteva instrumente bazate pe web.