Che cos'è un sito raschietto? - La risposta Semalt

Un sito di scraper è il sito Web che copia il contenuto da altri blog e siti Web utilizzando alcune tecniche di web scraping. Questo contenuto è rispecchiato con l'obiettivo di generare entrate, tramite la pubblicità o vendendo i dati dell'utente. Vari siti di scraper si differenziano per forme e tipi, che vanno dai siti Web con contenuti di spam all'aggregazione dei prezzi e ai negozi su Internet.

Diversi motori di ricerca, in particolare Google, possono essere considerati siti di scraper. Raccolgono contenuti da più siti Web, li salvano in un database, indicizzano e presentano agli utenti il contenuto estratto o raschiato su Internet. In effetti, la maggior parte dei contenuti scartati o estratti dai motori di ricerca è stata protetta da copyright.

Fatto per la pubblicità:

Alcuni dei siti di scraper sono creati per fare soldi online utilizzando diversi programmi pubblicitari. In tali circostanze, vengono denominati come siti Web Made for AdSense o MFA. Il termine di deroga si riferisce ai siti che non hanno alcun valore di riscatto che si aspettano di attrarre, attirare e coinvolgere i visitatori dei siti Web specificati per ottenere clic sugli annunci pubblicitari. I siti Web e i blog Made for AdSense sono considerati come il potente spam dei motori di ricerca. Diluiscono i risultati della ricerca con risultati non soddisfacenti. Alcuni siti di scraper sono noti per collegarsi ad altri siti Web e mirano a migliorare il ranking dei motori di ricerca tramite le reti di blog privati. Prima che Google aggiornasse i suoi algoritmi di ricerca, diversi tipi di siti di scraper erano famosi tra gli esperti e gli esperti di marketing di black hat. Hanno usato queste informazioni per lo spamdex e hanno svolto una varietà di funzioni.

Legalità:

I siti di scraper sono noti per violare le leggi sul copyright. Anche prelevare il contenuto dai siti open source è una violazione del copyright, se effettuata nel modo che non rispetta alcuna licenza. Ad esempio, la licenza GNU Free Documentation e Creative Commons ShareAlike sono state utilizzate su Wikipedia e hanno richiesto che il re-editore di Wikipedia dovesse informare i lettori che il contenuto era stato copiato dall'enciclopedia.

tecniche:

Le tecniche o i metodi su cui sono indirizzati i siti Web di scraper variano da una fonte all'altra. Ad esempio, i siti Web con una grande quantità di dati o contenuti come l'elettronica di consumo, le compagnie aeree e i negozi dipartimentali possono essere sistematicamente presi di mira dai concorrenti. I loro concorrenti vogliono essere informati sui prezzi attuali e sui valori di mercato di un marchio. Un altro tipo di raschietto estrae frammenti e il testo dai siti che si posizionano in alto per parole chiave specifiche. Tendono a migliorare il loro posizionamento nella pagina dei risultati dei motori di ricerca (SERP) e le spalle ai ranghi della pagina Web originale. I feed RSS sono anche vulnerabili ai raschiatori. I raschiatori sono normalmente associati alle farm di link e vengono percepiti quando un sito di scraper si collega allo stesso sito Web più e più volte.

Dirottamento del dominio:

I programmatori che hanno creato siti di scraper possono acquistare i domini scaduti per riutilizzarli per scopi SEO. Tale pratica consente agli esperti SEO di utilizzare tutti i backlink di quel nome di dominio. Alcuni degli spammer cercano di abbinare gli argomenti dei siti scaduti e / o copiare l'intero contenuto dal suo archivio Internet, mantenendo l'autenticità e la visibilità di quel sito. I servizi di hosting spesso forniscono la possibilità di trovare i nomi di un dominio scaduto e gli hacker o gli spammer utilizzano queste informazioni per sviluppare i propri siti Web.