Witryna zbierająca to witryna, która pobiera treści z innych źródeł i ponownie je publikuje, zwykle bez przypisywania. Takie witryny są utrzymywane z różnych powodów i są bardzo niepokojące dla wielu legalnych producentów treści w Internecie, ponieważ stwarzają szereg problemów. Większość stron typu scraper narusza prawa autorskie, przedrukowując treść bez zgody i nie przypisując autora, a także sieją spustoszenie w wynikach wyszukiwania i rankingach witryn, co może utrudnić internautom znalezienie stron, które faktycznie chcą zobaczyć.
Kluczową cechą witryny skrobaków jest to, że wykorzystuje ona zautomatyzowane środki do zbierania treści z innych witryn. Praktyka zbierania treści jest znana jako „scraping” i może być realizowana na wiele sposobów, od pobierania całych witryn po wyciąganie treści z kanałów RSS, XML i Atom z korzyścią dla czytelników, którzy chcą subskrybować do witryny, zamiast odwiedzać ją stale w celu sprawdzenia nowych materiałów. Po zeskrobaniu zawartość jest dosłownie wyciągana i instalowana w nowej witrynie.
Większość stron typu scraper jest utrzymywana w celu generowania przychodów reklamowych za pośrednictwem reklam powiązanych z witryną. Ludzie mogą niewinnie czegoś szukać, wylądować na stronie skrobaka, a następnie kliknąć reklamy, aby uniknąć zamieszania. Witryny typu „scraper” są również wykorzystywane w farmingu linków, praktyce, która polega na utrzymywaniu kilku witryn, które łączą się ze sobą, co powoduje zawyżanie rankingów w wyszukiwarkach.
Kradzież treści denerwuje pierwotnego twórcę zarówno z powodu naruszenia praw autorskich, jak i dlatego, że witryna zbierająca może pozbawić pierwotnego właściciela treści dochodów. Wielu webmasterów używa różnych technik w celu pokonania stron zbierających informacje, a niektórzy wzywają do działania wyszukiwarki i firmy reklamowe, prosząc ich o usunięcie tych stron lub uczynienie ich mniej dochodowymi, aby praktyka była mniej atrakcyjna.
W przypadkach, gdy witryna zbierająca informacje przypisuje twórcy, może to również zaszkodzić twórcy, sprawiając wrażenie, jakby jego witryna znajdowała się w „złym sąsiedztwie”, z dużą liczbą spamerskich linków, a nie linków z szanowanych witryn. W rezultacie rankingi w wyszukiwarkach mogą spaść, a właściciel witryny może nie być w stanie nic z tym zrobić, ponieważ właściciele witryn nie mogą kontrolować, kto prowadzi do nich linki.
Uzyskanie witryny skrobaka w celu usunięcia treści chronionych prawem autorskim może być niezwykle trudne, ponieważ wiele takich witryn wykorzystuje warstwy podstępów, aby ukryć swoich właścicieli. Niektórzy sfrustrowani webmasterzy zwracają się bezpośrednio do firmy, która obsługuje tę witrynę, powołując się na naruszenia praw autorskich i prosząc o natychmiastowe usunięcie kwestionowanych treści.
Technicznie rzecz biorąc, wyszukiwarki i witryny agregujące wiadomości można również uznać za strony typu scraper. Jednakże, ponieważ strony te są utrzymywane dla dobra publicznego i ponieważ ich wykorzystanie podlega wytycznym dotyczącym dozwolonego użytku, strony te generalnie nie są umieszczane w jednym worku ze szkodliwymi stronami zbierającymi.