Wat is een scraper-site? - Het Semalt-antwoord

Een scraper-site is de website die de inhoud van andere blogs en websites kopieert met behulp van enkele webscraping-technieken. Deze inhoud wordt weerspiegeld met het doel inkomsten te genereren, hetzij via advertenties, hetzij door de gebruikersgegevens te verkopen. Diverse scraper websites verschillen vormen en soorten, variërend van spam content websites om de prijs aggregatie en winkels op het internet.
Verschillende zoekmachines, met name Google, kunnen worden beschouwd als de schrapersites. Ze verzamelen inhoud van meerdere websites, slaan deze op in een database, indexeren en presenteren de geëxtraheerde of geschrapte inhoud aan de gebruikers op internet. Op de meeste inhoud die door de zoekmachines is geschrapt of geëxtraheerd, rust zelfs copyright.
Gemaakt voor reclame:
Sommige van de schrapersites zijn gemaakt om online geld te verdienen met verschillende advertentieprogramma's. In dergelijke omstandigheden worden ze genoemd als Made for AdSense-websites of MFA. De denigrerende term verwijst naar de sites die geen enkele verlossende waarde hebben die de bezoekers naar de gespecificeerde websites zullen aantrekken, lokken en betrekken om klikken op advertenties te krijgen. De Made for AdSense-websites en -blogs worden beschouwd als de krachtige zoekmachine-spam. Ze verdunnen de zoekresultaten met de minder dan bevredigende resultaten. Van sommige schrapersites is bekend dat ze linken naar andere websites en gericht zijn op het verbeteren van de positie van zoekmachines via de privéblognetwerken. Voordat Google zijn zoekalgoritmen bijwerkte, waren verschillende soorten schrapersites beroemd onder black hat SEO-experts en marketeers. Ze gebruikten deze informatie voor spamdexing en voerden verschillende functies uit.

Wettigheid:
Het is bekend dat de schrapersites de auteursrechtwetten overtreden. Zelfs het nemen van de inhoud van de open source-sites is een schending van het auteursrecht, indien gedaan op een manier die geen enkele licentie respecteert. Zo werden de GNU-licentie voor gratis documentatie en Creative Commons ShareAlike-licenties gebruikt op Wikipedia en moesten de heruitgever van Wikipedia de lezers informeren dat de inhoud uit de encyclopedie was gekopieerd.
Technieken:
Technieken of methoden waarop de schraperwebsites worden getarget, verschillen van bron tot bron. Zo kunnen websites met de grote hoeveelheid gegevens of inhoud, zoals consumentenelektronica, luchtvaartmaatschappijen en warenhuizen, routinematig worden getarget door de concurrenten. Hun concurrenten willen op de hoogte blijven van de huidige prijzen en marktwaarden van een merk. Een ander type schraper haalt fragmenten en de tekst van sites die hoog scoren voor specifieke zoekwoorden. Ze hebben de neiging om hun positie op de resultatenpagina van de zoekmachine (SERP) te verbeteren en op de ranglijst van de oorspronkelijke webpagina te meeliften. RSS-feeds zijn ook kwetsbaar voor de schrapers. De scrapers worden normaal gesproken geassocieerd met de link-farms en worden waargenomen wanneer een scraper-site keer op keer naar dezelfde website linkt.
Domeinkaping:
De programmeurs die scraper-sites hebben gemaakt, kunnen de verlopen domeinen kopen om ze opnieuw te gebruiken voor SEO-doeleinden. Door deze praktijk kunnen SEO-experts alle backlinks van die domeinnaam gebruiken. Sommige spammers proberen de onderwerpen van de verlopen sites te matchen en / of kopiëren de volledige inhoud van het internetarchief, met behoud van de authenticiteit en zichtbaarheid van die site. De hostingservices bieden vaak de mogelijkheid om de namen van een verlopen domein te vinden en de hackers of spammers gebruiken deze informatie om hun eigen websites te ontwikkelen.