Ce este un fișier text?

Un fișier text este un fișier de computer care stochează un document tastat ca o serie de caractere alfanumerice, de obicei fără informații de formatare vizuală. Conținutul poate fi o notă sau o listă personală, un jurnal sau un articol de ziar, o carte sau orice alt text care poate fi redat cu acuratețe sub formă dactilografică. Fișierele text sunt similare fișierelor de procesare a textului, prin aceea că conținutul ambelor este în primul rând textual; ele diferă prin faptul că fișierele text de obicei nu înregistrează informații precum stilul și dimensiunea caracterelor, paginarea sau alte detalii care ar specifica aspectul unui document finit. Unele sisteme de operare pentru computer fac o distincție de bază între un fișier text, care este destinat să fie tradus direct în text care poate fi citit de om și un fișier binar, care este interpretat direct de computer.

În majoritatea schemelor utilizate pentru codificarea textului, fiecărui caracter i se atribuie o valoare numerică, textul fiind apoi scris ca un șir de numere binare. O familie de scheme de codare, numită Codul standard american pentru schimbul de informații (ASCII), a devenit un standard utilizat pe scară largă la începutul istoriei calculului, în ciuda suportului slab al acestuia pentru alte limbi decât engleza. Familia de coduri ISO 8859 a oferit un suport mult mai bun pentru limbile bazate pe alfabetul latin și alfabete similare, dar nu a reușit să codifice caracterele din limbile din Asia de Est precum japoneză, ceea ce duce la o proliferare de standarde incompatibile.

Mai recent, Consorțiul Unicode® a dezvoltat un sistem de codificare numit Unicode® care are scopul de a atribui un număr unic fiecărui caracter folosit în fiecare limbă de pe pământ. Acest lucru va permite utilizarea unui singur cod pentru fiecare limbă și va permite textelor din mai multe limbi să apară într-un singur fișier. Prima porțiune a Unicode este bazată pe ISO 8859, care este el însuși bazat pe ASCII. Utilizarea Unicode® poate avea avantaje chiar și în țările vorbitoare de limbă engleză, deoarece textul codificat folosind scheme mai vechi poate afișa inconsecvențe minore atunci când este mutat de la sistem la sistem.

Avantajele fișierelor text includ dimensiunea mică și versatilitatea. Kilobytes sau megabytes mai mici decât aceleași date stocate în alte formate, acestea pot fi schimbate rapid și masiv prin e-mail sau disc. Cele mai multe pot fi deschise pe computere care rulează diverse sisteme de operare, folosind software-ul de bază. Dezavantajul principal este lipsa formatării. Un fișier text poate fi o alegere proastă pentru a reprezenta un document care conține imagini sau care se bazează pe elemente de design pentru a-și comunica sensul – un fișier care conține date tabelare, formule matematice sau poezie concretă, de exemplu.

În general, fișierele text sunt destinate să fie citite și editate de oameni, dar nu toate conțin conținut destinat în principal consumului uman. Majoritatea codului de programare este stocat într-un fișier text înainte de a fi compilat – adică tradus într-un fișier binar care poate fi citit de mașină. Fișierele pot conține, de asemenea, etichete textuale care pot fi citite de mașină, care oferă informații de formatare în plus față de textul simplu. De exemplu, un fișier HTML (Hypertext Markup Language) poate fi deschis ca fișier text simplu într-un editor de text sau poate fi afișat ca pagină web formatată după ce a fost interpretat de un browser web. Schemele similare includ LaTeX, folosit pentru aranjarea lucrărilor științifice și Extensible Markup Language (XML), folosit pentru structurarea datelor.