Nybörjarhandbok för att förebygga blogginnehållsskrapning i WordPress

Nybörjarhandbok för att förebygga blogginnehållsskrapning i WordPress / Nybörjarhandbok

Om du skriver original innehållsdag in och dag ut är du redan medveten om att dina inlägg hamnar på en massa SPAM-webbplatser inom några dagar ibland även några minuter. Vissa användare noterade även att webbplatsen med stulit innehåll överträffade det ursprungliga inlägget. Det är mycket frustrerande som en webbplatsägare att se att någon stjäl ditt innehåll utan tillstånd, tjäna pengar på det, överträffa dig i SERP och stjäla din publik. Innehållsskrapning är idag ett stort problem med tanke på att det är så enkelt för någon att stjäla ditt innehåll. I den här artikeln kommer vi att täcka vad som skriker blogginnehåll, hur man tar fram innehållsskrapor, hur man hanterar innehållsskrapor, hur man kan minska och förhindra skrapning av innehåll, hur man utnyttjar skrapning av innehåll, hur man tjänar pengar från skrapor , och är innehållskrapning någonsin bra?

Vad är innehållet i skriptet?

Skrap av blogginnehåll är en handling som vanligtvis utförs med skript som extraherar innehåll från många källor och drar den till en webbplats. Det är så enkelt nu att alla kan installera en WordPress-webbplats, lägga ett gratis eller kommersiellt tema och installera några plugins som ska gå och skrapa innehåll från utvalda bloggar, så det kan publiceras på deras webbplats.

Varför stjäl jag mitt innehåll?

Några av våra användare har frågat oss varför stjäl jag mitt innehåll? Det enkla svaret är att du är AWESOME. Sanningen är att dessa innehållsskrapor har bakomliggande motiv. Nedan är några skäl till varför någon skulle skrapa ditt innehåll:

  • Affiliate Commission - Det finns några smutsiga affiliate marknadsförare där ute som bara vill utnyttja systemet för att få några extra pengar. De kommer att använda ditt innehåll och andras innehåll för att få trafik till sin webbplats via sökmotorn. Dessa webbplatser är vanligtvis riktade mot en viss nisch, så de har relaterade produkter som de marknadsför.
  • Lead Generation - Ofta ser vi advokater och fastighetsmäklare som gör detta. De vill verka som branschledare i sina små samhällen. De har inte bandbredd för att producera kvalitetsinnehåll, så de går ut och skrapar innehåll från andra källor. Ibland är de inte ens medvetna om det här eftersom de betalar lite scumbag $ 30 / month för att lägga till innehåll och hjälpa dem att få bättre SEO. Vi har stött på några av dessa tidigare.
  • Reklaminkomster - Vissa människor vill bara skapa en "nav" av kunskap. En one-stop-shop för användare i en viss nisch. Om jag hade ett öre för varje gång någon har gjort det med vårt innehåll, så skulle vi ha några hundra pennies. Ofta märker vi att vårt innehåll på webbplatsen skrotas. Skrapan svarar alltid, jag gjorde detta för gemenskapens bästa. Om inte platsen är plasterad med annonser.

Det här är bara några anledningar till varför någon skulle stjäla ditt innehåll.

Så här hämtar du innehållsskrapor?

Fångande innehållsskrapor är en tråkig uppgift och kan ta upp mycket tid. Det är några sätt du kan använda för att fånga innehållsskrapor.

Sök Google med dina posttitel

Yup som är lika smärtsamt som det låter. Denna metod är förmodligen inte värt det, särskilt om du skriver om ett mycket populärt ämne.

trackbacks

Om du lägger till interna länkar i dina inlägg kommer du att märka en trackback om en webbplats stjäl ditt innehåll. På så sätt är det ganska mycket skrapan som säger att de skrapar ditt innehåll. Om du använder Akismet kommer många av dessa trackbacks att visas i SPAM-mappen. Återigen fungerar det bara om du har interna länkar i dina inlägg.

Verktyg för webbansvariga

Om du använder Google Webmaster Tools, är du säkert medveten om länken till din webbplats. Om du tittar under "Traffic" kommer du att se en sida som säger Länkar till din webbplats. Chanserna är att dina skrapor kommer att vara bland de bästa där. De kommer att ha hundratals om inte tusentals länkar till dina sidor (med tanke på att du har interna länkar).

FeedBurner Mindre vanliga

Om du har setup Feedburner för din WordPress-blogg kan du se några ovanliga användningsområden. I fliken Analys under matningsstatistik ser du "Mindre vanliga". Där ser du en lista över webbplatser.

Hur man hanterar innehållsskrapor

Det finns få tillvägagångssätt som människor tar när de hanterar innehållsskrapor. Do not Approach, Döda dem alla metoder, dra fördel av dem.

Det gör inget tillvägagångssätt

Detta är överlägset det enklaste tillvägagångssättet du kan ta. Vanligtvis rekommenderar de mest populära bloggarna detta eftersom det tar mycket tid att kämpa mot skraporna. Detta tillvägagångssätt rekommenderar helt enkelt att "istället för att bekämpa dem, spendera din tid att producera ännu mer kvalitetsinnehåll och ha kul". Nu uppenbarligen om det är en välkänd blogg som Smashing Magazine, CSS-Tricks, Problogger eller andra, behöver de inte oroa sig för det. De är auktoritetswebbplatser i Googles ögon.

Under Panda Update vet vi dock att några bra webbplatser har flaggats som skrapor eftersom Google trodde att skraporna var originalinnehåll. Så detta tillvägagångssätt är inte alltid det bästa enligt vår åsikt.

Döda dem alla

Det exakta motsatsen till "Gör ingenting". I detta tillvägagångssätt kontaktar du helt enkelt skrapan och ber dem att ta ner innehållet. Om de vägrar att göra det eller helt enkelt inte svarar på dina önskemål, så lägger du in en DMCA (Digital Millennium Copyright Act) med sin värd. Enligt vår erfarenhet har flertalet skrapwebbplatser inte en kontaktform tillgänglig. Om de gör det, använd sedan det. Om de inte har kontaktformuläret behöver du göra en Whois Lookup.

Du kan se kontaktinformationen på den administrativa kontakten. Vanligtvis är administrativ och teknisk kontakt densamma. Whois visar också domänregistratorn. Mest kända webbhotellföretag och domänregistratorer har DMCA-formulär eller e-postmeddelanden. Du kan se att denna specifika person är med Hostgator på grund av deras namnbehandlare. HostGator har en blankett för DMCA-klagomål. Om nameserver är något som ns1.theirdomain.com, måste du gräva djupare genom att göra omvänd IP-sökning och söka efter IP-adresser.

Du kan också använda en tredje parts tjänst för DMCA.com för nedtagningar.

Jeff Starr i sin artikel föreslår att du borde blockera den dåliga killarens IP-adresser. Öppna dina loggar för deras IP-adress och blockera sedan den med något liknande i din root .htaccess-fil:

Neka från 123.456.789

Du kan också omdirigera dem till en dummymatning genom att göra något så här:

RewriteCond% REMOTE_ADDR 123 \ .456 \ .789 \. RewriteRule. * Http://dummyfeed.com/feed [R, L]

Du kan bli riktigt kreativ här som Jeff föreslår. Skicka dem till riktigt stora textflöden fulla med Lorem Ipsum. Du kan skicka dem några äckliga bilder av dåliga saker. Du kan också skicka dem direkt tillbaka till sin egen server och orsaka en oändlig loop som kommer att krascha sin webbplats.

Det sista tillvägagångssättet vi tar är att dra fördel av dem.

Hur man tar fördel av innehållsskrapor

Det här är vårt sätt att hantera innehållsskrapor, och det visar sig ganska bra. Det hjälper vår SEO samt hjälper oss att göra extra pengar. Majoriteten av skraporna använder ditt RSS-flöde för att stjäla ditt innehåll. Så här är några av de saker du kan göra:

  • Intern länkning - Du måste koppla samman CRAP ur dina inlägg. Med den inbyggda länkfunktionen i WordPress 3.1 är det nu enklare än någonsin. När du har interna länkar i din artikel hjälper det dig att öka sidvisningar och minska avvisningsfrekvensen på din egen webbplats. För det andra får du backlinks från de personer som stjäl ditt innehåll. Slutligen kan du stjäla sin publik. Om du är en begåvad bloggare, förstår du konsten att internt länka. Du måste placera dina länkar på intressanta sökord. Gör det frestande för användaren att klicka på den. Om du gör det så kommer skraparens publik också att klicka på den. Precis som det tog du en besökare från deras webbplats och förde dem tillbaka till var de borde ha varit i första hand.
  • Auto Länk Nyckelord med Affiliate Länkar - Det finns få plugins som Ninja Affiliate och SEO Smart Links som automatiskt ersätter tilldelade sökord med affiliate länkar. Till exempel: HostGator, StudioPress, MaxCDN, Gravity Forms << These all will be auto-replaced with affiliate links when this post goes live.
  • Få kreativitet med RSS Footer - Du kan antingen använda RSS Footer eller WordPress SEO genom Yoast Plugin för att lägga till anpassade objekt till din RSS Footer. Du kan lägga till nästan allt du vill ha här. Vi känner till några personer som gillar att marknadsföra sina egna produkter till sina RSS-läsare. Så de kommer att lägga till banderoller. Gissa vad, nu kommer dessa banderoller att visas på dessa scraper hemsida också. I vårt fall lägger vi alltid till en liten ansvarsfriskrivning längst ner i våra inlägg i våra RSS-flöden. Det läser helt enkelt som "Hur man sätter din WordPress-webbplats i lässkyddad status för Site Migrations and Maintenance är ett inlägg från: WPBeginner som inte får kopieras på andra webbplatser." Genom att göra detta får vi en backlänk till den ursprungliga artikeln från scraper s webbplats som låter google och andra sökmotorer vet att vi är auktoritet. Det låter också sina användare veta att webbplatsen stjäl vårt innehåll. Om du är bra med koder kan du helt få nötter. Såsom att lägga till relaterade inlägg bara för dina RSS-läsare och en massa andra saker. Kolla in vår guide för att fullständigt manipulera ditt WordPress RSS-flöde.

Hur du kan minska innehållet i blogginnehåll och eventuellt förhindra det

Med tanke på om du tar vårt tillvägagångssätt med massor av intern länkning, lägger du till affiliate länkar, rss-banners och sådana chanser att du kommer att minska innehållet skrapa till bra mått. Om du tar Jeff Starrs förslag om att omdirigera innehållsskrapor, kommer det också att stoppa dessa skrapor. Bortsett från vad vi har delat ovan, finns det några andra knep som du kan använda.

Fullständig vs Sammanfattning RSS-flöde

Det har skett en debatt i bloggen om du vill ha fullt RSS-flöde eller sammanfattande RSS-flöde. Vi kommer inte att gå in på mycket detaljer om den debatten, men en av PROS för att ha en sammanfattning bara RSS-flöde är att du förhindrar innehållsskrapning. Du kan ändra inställningarna genom att gå till din WordPress admin panel och gå under Inställningar »Läsning. Ändra sedan inställningen För varje artikel i ett flödesprogram: Sammanfattning.

Obs! Vi har fullt flöde eftersom vi bryr oss mer om våra RSS-läsare än spammarna.

Trackback SPAM

Trackbacks och Pingbacks hade definitivt stora användningsområden men de ständigt missbrukas nu. Ofta visar teman trackbacks och pingbacks under eller bland kommentarerna. Detta ger spammaren ett incitament att skrapa din webbplats och skicka trackbacks. Om du felaktigt godkänner det, får de en backlänk och omnämns från din webbplats. Så här kan du inaktivera Trackbacks på alla framtida inlägg. Här är en artikel som visar hur du inaktiverar trackbacks och pings på befintliga WordPress-inlägg också.

Är innehållsskrapning någonsin bra?

Det kan vara. Om du ser att du tjänar pengar på skraparens webbplats, så var säker på att det kan vara. Om du ser mycket trafik från en skrapers webbplats kan det vara. I de flesta fall är det dock inte. Du bör alltid försöka få ditt innehåll avtaget. Men du kommer att inse att din blogg blir större, det är nästan omöjligt att hålla reda på alla innehållsskrapor. Vi skickar fortfarande ut DMCA-klagomål, men vi vet att det finns massor av andra webbplatser som stjäl vårt innehåll som vi inte bara kan följa med.

Vad är dina tankar? Använder du någon annan mekanik för att förhindra skrapning av innehåll? Skulle älska att höra dina tankar.