Jak przekonwertować MHTML na HTML?

Chociaż plik zakodowany w MHTML zawiera fragmenty, które są czystym kodem HTML, podczas próby konwersji MHTML na HTML mogą wystąpić komplikacje. Kilka programów może odczytywać pliki i formaty pochodne MHTML — lub MIME — HyperText Markup Language — pliki i formaty pochodne, ale do konwersji i zapisania zawartości pliku do formatu HTML wymagany jest specjalny typ programu. Mogą wystąpić problemy, ponieważ dane cyfrowe ze strony internetowej są zakodowane w pliku, a rekonstrukcja strony internetowej z poprawnymi linkami do wszystkich informacji lokalnie może być trudnym zadaniem. Istnieją programy dla większości systemów operacyjnych, które umożliwiają konwersję MHTML do HTML, chociaż użytkownik może wymagać dodatkowej pracy.

Podstawowym problemem przy konwertowaniu plików z MHTML na HTML są dane binarne zapisane w pliku. Dane są zapisywane w sposób, który pozwala na odczytanie i wyświetlenie pliku MHTML przez przeglądarkę internetową, ale nie ułatwia konwersji tego samego pliku. MHTML jest przechowywany jako rodzaj osadzonego kodu, który wykorzystuje różne zmienne do porządkowania lokalizacji plików cyfrowych. Informacje binarne, takie jak obraz, który jest online, są przechowywane na oryginalnej stronie internetowej wraz z linkami do lokalizacji online. Informacje te są usuwane i tłumaczone na zmienne lokalne za pomocą plików MHTML, co utrudnia faktyczne dopasowanie nośnika binarnego do jego właściwej lokalizacji i formatowania w dokumencie HTML.

Dostępnych jest niewiele programów, które mogą konwertować MHTML na HTML. Istnieją wtyczki i inne dodatki, które umożliwiają programowi ładowanie, edytowanie, a następnie ponowne zapisywanie pliku z powrotem w MHTML, ale istnieje tylko kilka samodzielnych programów, które będą próbowały przekonwertować go na HTML. Często programy te wymagają od użytkownika spojrzenia na kod w celu ustalenia, gdzie w kodzie powinny być umieszczone pliki binarne, co pozwala na zrekonstruowanie strony z archiwum.

Nie wszystkie strony internetowe można dokładnie zapisać jako plik MHTML. Różnorodne złożone formaty, które można osadzić jako multimedia na stronie internetowej, nie zostaną poprawnie zapisane, jeśli w ogóle. Obejmuje to aplety Java®, media strumieniowe i wiele skryptów, które opierają się na innych plikach na serwerze, do których przeglądający komputer nie ma dostępu.

Najskuteczniejszym sposobem konwersji MHTML na HTML jest znalezienie samodzielnych programów i wtyczek, które będą stopniowo konwertować pliki z jednego formatu na inny, a na koniec, być może, na HTML. Niektóre systemy operacyjne nie obsługują nawet plików MHTML we własnych przeglądarkach. Jeśli wszystko inne zawiedzie, możliwe jest ręczne odkodowanie binarnych informacji MIME w pliku za pomocą dekodera 64-bitowego, wyodrębnienie tylko kodu HTML i próba ręcznego zrekonstruowania strony internetowej przechowywanej w archiwum, ale ten proces byłby bardzo pracochłonny.