O etichetă canonică este o mică bucată de cod încorporată într-o pagină web care poate ajuta motoarele de căutare să se ocupe de mai multe versiuni ale aceleiași pagini. Este susținut de trei dintre cele mai populare motoare de căutare și permite webmasterilor să specifice o adresă preferată pentru conținutul care ar putea fi duplicat. Motoarele de căutare onorează de obicei această solicitare și folosesc adresa preferată atunci când indexează paginile, dar o pot ignora în anumite circumstanțe. Etichetele canonice, care sunt de fapt un element al tag, poate fi folosit atât cu căi relative, cât și absolute, dar în general nu pot trece peste domenii.
La începutul lui 2009, trei motoare de căutare majore au convenit să folosească eticheta canonică pentru a ajuta la tratarea conținutului duplicat de pe web. Paginile web similare sau identice pot fi adesea accesate de la mai multe adrese web sau de la URL-uri (Uniform Resource Locators), cum ar fi http://example.com, http://www.example.com și http://www.example. com/index.php. Sistemele de gestionare a conținutului, platformele de comerț electronic și software-ul wiki pot genera pagini în mod dinamic, cu adrese URL ușor diferite fiind utilizate pentru a modifica ordinea de sortare a unei categorii, a urmări linkurile afiliate sau pentru a accesa versiunile anterioare ale unui articol sau unei pagini.
Paginile duplicate cu adrese ușor diferite pot funcționa împotriva algoritmilor motoarelor de căutare care folosesc popularitatea linkurilor pentru a determina locul în care o pagină se află în rezultatele căutării. O pagină web cu 300 de link-uri care indică către două adrese URL diferite poate apărea la software-ul de indexare al unui motor de căutare ca o singură pagină cu doar 150 de link-uri. Motoarele de căutare s-au confruntat istoric cu problema oferind setări URL preferate în instrumentele lor pentru webmasteri, dezvoltând proprii algoritmi interni pentru a ghici adresa cea mai potrivită și respectând redirecționările 301, un cod de stare generat de server care redirecționează cererile către o nouă adresă URL.
Eticheta canonică este o modalitate prin care dezvoltatorii web pot marca o anumită adresă URL ca versiunea preferată a unei pagini. Este un mic fragment de cod care trebuie inserat în toate paginile web cu conținut similar sau duplicat, dar nu necesită modificări ale setărilor unui server web. Majoritatea motoarelor de căutare îl tratează mai degrabă ca pe un „indiciu puternic” decât ca o comandă, ceea ce înseamnă că o etichetă canonică care a fost implementată prost sau indică o pagină complet diferită ar putea fi ignorată. Codul are sens doar pentru motoarele de căutare; browserele web ignoră etichetele canonice.
În ciuda numelui său, o etichetă canonică nu este o adevărată „etichetă”, ci un element care poate fi aplicat la cele utilizate pe scară largă. etichetă. O pagină marcată cu codul ar spune unui motor de căutare că adresa URL preferată sau canonică pentru conținut este http://www.example.com/about.html. Porțiunea „rel=canonical” a codului spune unui motor de căutare că adresa URL din „href=” este un link canonic. Spre deosebire de o redirecționare 301, o etichetă canonică poate fi utilizată atât cu căi absolute, cât și cu căi relative, deși unele motoare de căutare recomandă utilizarea căilor absolute. Cu toate acestea, redirecționările 301 pot indica un alt domeniu, în timp ce majoritatea motoarelor de căutare acceptă numai linkuri canonice pe același domeniu.