Co to jest szeroka postać?

Znak szeroki to znak komputerowy, którego rozmiar przekracza standardowy pomiar 8-bitowy. Znaki w zestawie komputerowym, takim jak Universal Character Set (USC) ilustrują doskonały przykład znaków szerokich, ponieważ USC może być zakodowany w formatach 16-bitowych lub 32-bitowych. Różni się to od starszych, ustandaryzowanych zestawów znaków, takich jak American Standard Code for Information Interchange (ASCII), który wykorzystuje znaki nie dłuższe niż 7-bitowe. Zaletą kodowania zestawów znaków w szerokich znakach jest to, że daje więcej swobody, gdy przychodzi czas na dodawanie dodatkowych i złożonych symboli do zestawu, co daje projektantom postaci szerszy zakres swobody. Wady mają postać dodatkowego zużycia pamięci, ponieważ szerokie zestawy znaków zużywają więcej pamięci systemowej, gdy są aktywne na komputerze.

Zestawy znaków muszą być dostosowane do pracy z określonymi systemami operacyjnymi, a znaki szerokie nie różnią się od siebie. W przypadku systemów operacyjnych Windows® — zarówno w wersji 32-, jak i 64-bitowej — zestawy znaków muszą być dostosowane do 16-bitowej struktury, oferując dwukrotnie większą pojemność dla każdego znaku w porównaniu ze „standardowym” zestawem 8-bitowym. Z drugiej strony Unix® wymaga szerokich znaków, aby pasowały do ​​32-bitowej struktury, oferując czterokrotnie większą pojemność niż podstawowy zestaw znaków.

Największą zaletą szerokich zestawów znaków jest to, że pozwalają na niestandardowe symbole i większą wszechstronność w włączaniu różnych języków do swoich interfejsów. Na przykład szerokie zestawy znaków mogą zawierać standardowy alfabet angielski, a także języki takie jak cyrylica i grecki jednocześnie. Oznacza to, że pojedynczy zestaw szerokich znaków może dotyczyć osób z wielu krajów, w przeciwieństwie do wymagania unikalnego nieszerokiego zestawu znaków dla każdego regionu językowego.

Chociaż przydatne do ujednolicenia wersji oprogramowania w różnych regionach językowych, zestawy szerokich znaków mają swoją cenę. Ta cena to dodatkowy koszt narzutu pamięci. Chociaż 16-bitowy zestaw znaków oferuje dwukrotnie większą pojemność niż standardowy zestaw 8-bitowy, zużywa również dwukrotnie więcej pamięci. To samo dotyczy 32-bitowych zestawów znaków, które pochłaniają cztery razy więcej pamięci niż konwencjonalne zestawy znaków.

Z komputerowego i statystycznego punktu widzenia jest to znaczący „koszt” pamięci. W praktyce jednak koszt nie jest tak duży, jak mogłoby się wydawać. Współczesne komputery często zawierają cztery lub więcej gigabajtów pamięci systemowej, co sprawia, że ​​przechowywanie nawet dużego 32-bitowego zestawu znaków jest w praktyce praktycznie nieistotne. Tylko najbardziej przepracowane — lub niedostatecznie wydajne — komputery zauważą znaczny spadek wydajności wynikający z używania zestawów szerokich znaków.