Co to jest jednolity lokalizator zasobów?

Uniform Resource Locator, znany również pod akronimowym adresem URL, umożliwia określenie lokalizacji i metody dostępu do obiektu w Internecie. Zawiera nazwę schematu lub protokołu opisującą sposób uzyskania dostępu do obiektu. Zawiera również lokalizację sieciową wraz z opcjonalnymi zapytaniami i identyfikatorami fragmentów. Bardzo powszechnym zastosowaniem adresu URL jest skierowanie przeglądarki na stronę internetową.

Pierwotna koncepcja jednolitego lokalizatora zasobów ewoluowała na początku lat 1990. XX wieku. Request For Comments (RFC) 1630 był pierwszym standardem adresów URL, wydanym przez Internet Engineering Task Force (IETF) w 1994 roku. Nazwa bez powiązanej lokalizacji lub metody dostępu stała się znana jako Uniform Resource Name (URN). Z połączenia tych dwóch koncepcji powstał termin Uniform Resource Identifier (URI). Identyfikator URI może być tożsamością URN, adresem URL lub jednym i drugim. Może nawet odnosić się do obiektu, który w ogóle nie jest oparty na sieci.

W kręgach technicznych termin Uniform Resource Locator jest już rzadko używany — preferowany jest identyfikator URI. Adres URL pozostaje jednak popularną nazwą wśród opinii publicznej i prasy. Najnowsza specyfikacja URI, opublikowana w 2009 r. jako RFC 3986, wyjaśnia koncepcje adresów URL, URN i URI.

Jednolity lokalizator zasobów składa się z dwóch części. Pierwsza to nazwa schematu URI, po której następuje dwukropek. Schemat definiuje protokół lub inną metodę używaną do uzyskania dostępu do zasobu. Internet Assigned Numbers Authority (IANA) zarządza długą listą zarejestrowanych schematów URI. Najpopularniejsze są: Hypertext Transport Protocol (HTTP), Secure HTTP (HTTPS) i File Transport Protocol (FTP). Stosuje się również wiele niezarejestrowanych schematów.

Druga część Uniform Resource Locator jest specyficzna dla schematu i może zawierać kilka komponentów. Ta część adresu URL HTTP często zaczyna się od www. po którym następuje nazwa domeny. Numeryczny adres protokołu internetowego (IP) może zostać użyty zamiast nazwy domeny. Po nazwie może następować ścieżka do określonego obiektu. Ciąg zapytania, nazwa nagłówka fragmentu w obiekcie lub oba te elementy również mogą być obecne.

Podczas wpisywania adresu URL strony internetowej w przeglądarce schemat i część nazwy domeny są często opcjonalne. Jeśli pominiesz, „http://” lub „http://www”. zwykle zakłada przeglądarka internetowa. Ścieżka, zapytanie lub fragment mogą również zawierać ograniczone znaki specjalne w postaci szesnastkowej. Spacja —%20 — jest najczęściej używana. Internationalized Resource Identifier (IRI) umożliwia również stosowanie znaków Unicode.
Więcej niż jeden unikalny Uniform Resource Locator może opisywać ścieżkę do tego samego obiektu. Wyszukiwarki mogą używać procesu zwanego normalizacją adresów URL, aby określić, czy wiele adresów URL faktycznie odnosi się do tej samej rzeczy. Robią to również przeglądarki internetowe i roboty. Adres URL może również wskazywać na obiekt, którego nie można znaleźć — został przeniesiony lub nigdy nie istniał.