Ce este un Scraper Site?

Un site scraper este un site web care extrage conținut din alte surse și îl republică, de obicei fără atribuire. Astfel de site-uri sunt întreținute dintr-o varietate de motive și sunt de mare îngrijorare pentru mulți producători legitimi de conținut de pe Internet, deoarece pun o serie de probleme. Majoritatea site-urilor scraper încalcă legea dreptului de autor prin retipărirea conținutului fără consimțământ și necreditând autorul și, de asemenea, provoacă ravagii în rezultatele motoarelor de căutare și în clasamentul site-urilor, ceea ce poate îngreuna utilizatorilor de internet să găsească site-urile pe care doresc să le vadă de fapt.

Caracteristica cheie a unui site scraper este că folosește mijloace automate pentru a recolta conținut de pe alte site-uri. Practica de recoltare a conținutului este cunoscută sub denumirea de „scraping” și poate fi realizată în mai multe moduri, de la descărcarea de site-uri întregi până la extragerea conținutului din fluxurile generate în RSS, XML și Atom, în beneficiul cititorilor care doresc să se aboneze. la un site, mai degrabă decât să îl vizitați în mod constant pentru a verifica dacă există materiale noi. Odată răzuit, conținutul este ridicat literal și instalat pe un site nou.

Majoritatea site-urilor scraper sunt întreținute în scopul de a genera venituri din publicitate prin reclame legate de site. Oamenii pot căuta în mod nevinovat ceva, pot ajunge pe site-ul scraper și apoi pot face clic pe reclame din confuzie. Site-urile Scraper sunt, de asemenea, folosite în link farming, o practică care implică întreținerea mai multor site-uri care se leagă între ele, umflând astfel clasamentul motoarelor de căutare.

Atunci când conținutul este furat, îl frustrează pe creatorul original atât pentru că încalcă legea drepturilor de autor, cât și pentru că site-ul scraper îl poate priva de venituri pe proprietarul inițial al conținutului. Mulți webmasteri folosesc o varietate de tehnici în încercarea de a învinge site-urile scraper, iar unii au cerut acțiuni din partea motoarelor de căutare și companiilor de publicitate, cerându-le să elimine site-urile scraper sau să le facă mai puțin profitabile, astfel încât practica să fie mai puțin atrăgătoare.

În cazurile în care un site scraper îl creditează pe creator, acest lucru îl poate dăuna și pe creator, făcându-l să pară ca și cum site-ul său se află într-o „cartieră proastă”, cu un număr mare de link-uri spam, mai degrabă decât link-uri de la site-uri respectate. Ca rezultat, clasamentele în motoarele de căutare pot scădea, iar proprietarul site-ului poate fi neputincios să facă ceva în privința asta, deoarece proprietarii site-ului nu pot controla cine face link-uri către ele.

Obținerea unui site scraper pentru a elimina conținutul protejat prin drepturi de autor poate fi extrem de dificilă, deoarece multe astfel de site-uri folosesc straturi de subterfugiu pentru a-și ascunde proprietarii. Unii webmasteri frustrați merg direct la compania care găzduiește site-ul scraper, invocând încălcări ale drepturilor de autor și solicitând eliminarea imediată a conținutului în litigiu.
Din punct de vedere tehnic, motoarele de căutare și site-urile de agregare de știri ar putea fi, de asemenea, considerate site-uri scraper. Cu toate acestea, deoarece aceste site-uri sunt întreținute pentru binele public și deoarece utilizarea lor a materialului intră sub incidența ghidurilor de utilizare corectă, aceste site-uri nu sunt, în general, aglomerate cu locuri de raclere dăunătoare.