Co to jest kompresja plików?

Kompresja plików to metoda stosowana przez komputery w celu zmniejszenia rozmiaru pliku elektronicznego lub grupy plików do najmniejszego możliwego rozmiaru. Pliki ZIP są typowym przykładem kompresji plików. Istnieje wiele technik używanych przez programy komputerowe do kompresji plików, ale najczęstszą metodą jest zastępowanie powtarzających się sekwencji mniejszymi sekwencjami. Komputery robią to, katalogując pierwszą instancję i odwołując się do niej w kolejnych instancjach. Na przykład w poprzednich zdaniach litery „kompresować” pojawiły się trzykrotnie. Komputer może je skompresować, skatalogując pierwszą instancję i zrównując wszystkie kolejne instancje z „&cmp” — zmniejszając w ten sposób liczbę wymaganych liter lub znaków i zmniejszając rozmiar pliku. W przypadku dużego pliku taka wymiana może zaoszczędzić dużo miejsca. Należy jednak zauważyć, że użytkownik tego nie widzi — komputer wykonuje całą pracę w tle.

Aby śledzić skrócone zamienniki, programy komputerowe tworzą również słownik dla skompresowanego pliku. W świecie kompresji plików słownik to lista oryginalnych fraz i ich zamienników. Słownik ten jest jednak uwzględniony w rozmiarze pliku, więc zajmie również miejsce, zmniejszając ilość miejsca zaoszczędzonego przez kompresję. Z tego powodu kompresja pojedynczego małego pliku jest zwykle mniej wydajna niż dużego pliku lub grupy.

Programy wykonujące kompresję plików działają w nieco inny sposób. Różnice te wynikają głównie z czegoś, co nazywa się algorytmem. Algorytm to konstrukcja matematyczna, która przeszukuje pliki w poszukiwaniu powtórzeń i umieszcza w nich proste odnośniki. Programiści tworzą algorytmy kompresji i definiują wzorce oraz zamienniki, które mają być użyte do kompresji. Wariancje mogą wpływać na wydajność kompresji. Na przykład w wyrażeniu „było to najlepsze czasy, to były najgorsze czasy” powtarzają się sekwencje „to był” i „st of times”. Programista może zdecydować się na zastąpienie każdej całej frazy lub może zamienić „to” indywidualnie i „czasów” pojedynczo. Te niewielkie różnice w algorytmach powodują, że niektóre programy do kompresji plików działają lepiej na niektórych typach plików niż na innych.

Niektóre typy skompresowanych plików rozpakowują się samoczynnie, co oznacza, że ​​otwierają się automatycznie, gdy użytkownik je kliknie — do ich zdekompresowania nie są wymagane żadne zewnętrzne programy. Aby utworzyć te pliki, oryginalny program do kompresji musi dodać dodatkowy kod do skompresowanego pliku. Z tego powodu samorozpakowujący się plik skompresowany jest często większy niż ten sam plik, jeśli został skompresowany normalnie. Jest to zazwyczaj uważane za dobry kompromis dla firm, które wydają programy do zainstalowania na komputerach domowych. Dzięki temu, że plik sam się rozpakowuje, użytkownik domowy może pominąć krok i zwiększyć prawdopodobieństwo, że oprogramowanie zostanie zainstalowane. Aby zdekompresować pliki, które nie są samorozpakowujące się, w Internecie można pobrać wiele programów innych firm.