Of je nou leukt vindt of niet, spam is een groot onderdeel van het internet.

Sommige soorten spam willen zo liefst mogelijk je serverruimte gebruiken om verzoeken te versturen, terwijl andere misbruik maken van mensen door het sturen van malware en virussen.

Een type spam heet ook wel referrer spam en vooral WordPress sites die hier niet op zijn voorbereid, zijn hier het slachtoffer van. Bovendien kan het je Google Analytics systeem binnendringen, je rankings in de war schoppen en ervoor zorgen dat de zoekmachines zich tegen je keren.

Het zal nooit helemaal verdwijnen, maar dat betekent niet dat je niet kan terugvechten tegen referrer spam.

De beste tactiek is het blokkeren van referrer spam in Google Analytics en WordPress. Maar hoe doe je dit?

Dat zullen we je uitleggen, maar laten we eerst een beter idee krijgen van wat referrer spam precies is en waarom het zo funest kan zijn voor je website.

Wat is referrer (of referral) spam?

Referrer spam, of referral spam, is de techniek waarbij herhaaldelijk websiteverzoeken worden gedaan met behulp van een neppe verwijzende URL, vaak naar een site die spammers willen promoten.

Binnen Google Analytics ziet het er als volgt uit:

Hoe referrer spam eruitziet in Google Analytics
Hoe referrer spam eruitziet in Google Analytics

Referrer spam heeft maar één doel: het targeten van zoekmachines.

Kort samengevat werkt het als volgt:

  • Een spammer heeft een website waarvan hij de positie binnen zoekmachines wil verbeteren.
  • De spammer verstuurt meerdere verzoeken met nep URL’s die terugverwijzen naar de website waarvoor hij wil adverteren.

Ze willen dus verbeteren hoe zoekmachines hun site zien, zonder dat ze waardevolle content bieden voor gebruikers. Het is mogelijk dat je site per ongeluk een aantal van die toegangslogboeken en statistieken publiceert en dus onbedoeld terugverwijst naar de site die de spammer wil promoten.

Dit betekent dat jouw site nu wordt gelinkt aan een site van lage kwaliteit, wat de positie van die spamsite op de volgende manieren kan verbeteren:

Nog meer spamsites in Google Analytics
Nog meer spamsites in Google Analytics

Als Google echter ziet dat je naar een spamsite linkt, kan je positie in zoekmachines in de toekomst afnemen.

Deze bots bezoeken je site nooit echt. In plaats daarvan rommelen ze wat aan met je javascript-trackingcode en verdraaien ze je analyticsdata, zoals het bouncepercentage en andere nuttige engagement-statistieken.

Een diagram dat laat zien hoe ghost en referral spam werkt
Een diagram dat laat zien hoe ghost en referral spam werkt (bron: magistrateinc.com)

Hoewel Google en andere zoekmachines aardig hun best doen om dergelijke spamsites eruit te filteren, is het nog altijd een goed idee om zelf te voorkomen dat ze schade aanrichten.

Immers, als je naar tientallen spamsites linkt, dan kunnen de zoekmachines denken dat je dit met opzet hebt gedaan.

Waarom wordt het referral spam genoemd?

Het is ook goed om te weten dat dit type spam zijn naam te danken heeft aan de manier waarop het omgaat met Google Analytics. Deze spammers profiteren van het feit dat website-eigenaren normaal gesproken graag zien dat andere sites verkeer naar hun platform doorverwijzen.

Je hebt zelfs een aqcuisitierapport in Google Analytics om te zien waar het meeste verkeer vandaan komt.

Helaas kan het voorkomen dat je gebruikers/klanten deze acquisitierapporten in je toegangslogboeken willen bekijken en het is mogelijk dat ze vervolgens op een van deze schadelijke links klikken wanneer ze door de lijst met verwijzigingen bladeren van Google Analytics.

Het maakt niet uit wie erop klikt, er komt nooit iets goeds van.

Wat zijn de voordelen van het blokkeren van botverkeer?

Sommige mensen denken dat botverkeer en referrer spam niet een groot probleem is. Maar als je kijkt naar de hoeveelheid botverkeer die er is, dan schrik je waarschijnlijk:

Goede bots vs slechte bots vs mensen (bron: voluum.com)
Goede bots vs slechte bots vs mensen (bron: voluum.com)

Bijna 56% van het botverkeer wordt gebruikt voor slechte doeleinden. Niet alleen vertekent dit je analytische gegevens, maar het kan ook:

  • Bijdragen aan DDoS aanvallen
  • De reputatie en SEO van je website schaden
  • Je accounts hacken
  • Je geld kosten

Hoewel het van zichzelf weinig doet, heb je nog steeds de kans om per ongeluk naar die spamsites te linken en je positie in zoekmachines te verlagen.

Bovendien wil je als legitieme website-eigenaar natuurlijk content van hoge kwaliteit maken, dus is het je plicht om als verantwoordelijke webmaster te voorkomen dat spammers het internet volstoppen met slechte links.

Als internetgebruiker maken ze het je alleen maar moeilijker bij het zoeken. Ten slotte bestaat de kans dat jij, of een van je sitebezoekers, op een van de referrer spamlinks klikt, waardoor je naar een website wordt geleid die schadelijk materiaal kan bevatten.

Zo blokkeer je referral spamverkeer in Google Analytics

Hier zijn een paar opties die je kan proberen om spam in Google Analytics te blokkeren:

Laten we al deze methodes eens bekijken:

1. Bekende bots en spiders uitsluiten in de instellingen van Google Analytics

Voordat we overgaan tot meer geavanceerde manieren om Google Analytics spam te blokkeren, zorg dat je in elk geval gebruikmaakt van de ingebouwde botfilter-functie die je vindt onder Admin > View Settings > Bot Filtering:

Filteren van bots in Analytics
Filteren van bots in Analytics

Zorg ervoor dat je het selectievakje aanvinkt en klik op Save onderaan de pagina.

2. Spambots filteren uit je Google Analytics resultaten

Wanneer je technische wijzigingen aanbrengt, wil je altijd een back-up hebben waarnaar je kan herstellen als er iets fout gaat.

Dit is niet anders in Google Analytics. Je wil een ongefilterde weergave behouden, zodat je de gegevens hebt die je kan vergelijken met de gefilterde resultaten zodat je weet of het allemaal goed werkt. Ook geeft het je een weergave waarnaar je kan terugkeren als een van je filters toch niet helemaal goed blijkt te werken.

Een ongefilterde weergave instellen voor Google Analytics

Ga naar het Admin gedeelte en klik op View Settings in de derde kolom.

Een ongefilterde weergave instellen in Google Analytics
Een ongefilterde weergave instellen in Google Analytics

Klik vervolgens op Copy View en noem je weergave Unfiltered.

Je nieuwe weergave kopiëren en benoemen in GA
Je nieuwe weergave kopiëren en benoemen in GA

Ga naar de hoofdpagina van Google Analytics en klik in het gedeelte View op Filters.

Let op: dit is een andere sectie dan de All Filters onder Account.

Een filter maken in Google Analytics
Een filter maken in Google Analytics

Klik op de rode + Add filter knop:

Een nieuwe filter toevoegen aan GA (en een beschrijvende naam geven)
Een nieuwe filter toevoegen aan GA (en een beschrijvende naam geven)

Vanuit hier kan je een aantal verschillende spamfilters instellen om Google Analytics spam te blokkeren.

Neem voor elke filter die je maakt een paar minuten de tijd om het te testen om ervoor te zorgen dat deze naar behoren functioneert. Als je hierover tevreden bent, klik je op Save.

Laten we eens kijken naar de soorten spamfilters die je in Google Analytics kan instellen:

De spamtypes waarop je moet letten (en hoe je ze kan verwijderen)

Er zijn drie veelvoorkomende soorten spam. Hier is een kort overzicht van wat elke is en hoe je ze kan blokkeren:

Ghost Spam

Ghost spam (ook wel aangeduid als ghost traffic of phantom traffic) is nepverkeer en nepdata die door hackers in je Google Analytics account terechtkomen in een poging om je ertoe te zetten hun websites te bezoeken.

Om ghost spam in jouw Google Analytics te vinden, ga je naar:

Audience > Technology > Network > Hostname

Hiermee krijg je een lijst met hostnames te zien die communiceren met je website. Hier zou je alleen jouw domein, subdomeinen en andere diensten moeten zien die jij aan je Google Analytics account hebt gelinkt.

Als je iets zie dat je niet herkent, dan kan dit ghost spam zijn.

Om ghost spam te verwijderen, moet je een aangepaste filter maken die Google Analytics laat weten welke hostnames in je account thuishoren en welke niet.

Zo verwijder je Ghost Spam in Google Analytics:
  1. Maak in regular expression een lijst met geldige hostnames.
  2. Scheid elke hostname met een pipe-teken | en voet een backlash \ toe voor alle punten en koppeltekens. (Voorbeeld: kinsta\.com\youtube\.com)
  3. Open nu je Google Analytics account en ga naar “Admin” en selecteer de juiste weergave.
  4. Ga naar “Filters” en klik op “Add Filter”.
  5. Geef je filter een naam, kies “Custom” als Filter Type en selecter “Include” bij “Hostname”.
  6. Voer je expression in en gebruik de knop “Verify” om te checken of de nieuwe filter werkt.
  7. Klik nu op “Save” om de ghost spamfilter te voltooien.

Om de filter nog verder aan te scherpen, is er nog iets anders dat je kan doen om ghost spam tegen te gaan.

Open Google Analytics en ga naar Audience > Technology > Network.

Scorl omlaag en selecteer Hostname als je Primary Dimension en zorg ervoor dat de resultaten per maand worden weergegeven.

Selecteer hostname als je primary dimension in GA
Selecteer hostname als je primary dimension in GA

Bekijk de volledige lijst met hostnames. Zoek de legitieme en schrijf ze op.

Het belangrijkste is dat je een lijst hebt met geldige hostnames. Ga vervolgens helemaal bovenaan naar het tabblad Admin en klik op Filters.

Maak een lijst met geldige hostnames aan in Google Analytics
Maak een lijst met geldige hostnames aan in Google Analytics

Klik Add Filter > Custom Filter Type > Include. In dit veld word je gevraagd om een lijst met geldige hostnames in te voeren. Hierbij moet je zorgen dat je een ^ teken vóór elke hostname plaatst, samen met een $ teken ná elke hostname.

Gebruik een | teken om de hostnames te scheiden.

Een aangepast filter toevoegen in Google Analytics
Een aangepast filter toevoegen in Google Analytics

Klik op de Save knop om het proces te voltooien. Het duurt ongeveer 24 uur om wijzigingen in het Google Analytics dashboard te zien. Ook kan je deze lange lijst eens bekijken met spam/ghost referrer sites.

Je zou deze allemaal moeten uitsluiten in je Google Analytics.

Crawler spam

Crawler spam is een type spam dat wordt gegenereerd door bots die door websites bladeren en informatie vastleggen door geautomatiseerde taken op websites uit te voeren. Deze bots crawlen je pagina’s en negeren regels die je bijvoorbeeld hebt opgesteld in robots.txt.

Zo verwijder je crawler spam in Google Analytics:

Je moet een aangepaste filter maken in Google Analytics met de volgende expressions, die zijn gemaakt om crawlerspam uit te sluiten die de afgelopen jaren is gedetecteerd.

Expression #1:

(best|dollar|success|top1)\-seo|anticrawler|^scripted\.|semalt|forum69|7makemon|sharebutton|ranksonic|sitevaluation|dailyrank|vitaly|profit\.xyz|rankings\-|dbutton|uptime(bot|check|\.com)

Expression #2:

Datract|hacĸer|ɢoogl|responsive\-test|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter|top10\-way

Om je eigen aangepaste filter te maken, moet je:

  1. Je Google Analytics account openen
  2. Naar Admin gaan, op Filters klikken en dan op “Add Filter.”
  3. Geef je filter een naam, selecteer “Custom” voor Filter Type en selecteer “exclude”.
  4. Zet het veld in op “campaign source” en plak vervolgens een expression in het vak.
  5. Verifieer de filter en klik op “Save.”
  6. Herhaal het proces voor expression #2.
Fake language spam

Language spam wordt vaak door spammers gebruikt voor persoonlijke doeleinden of om hun sites of producten te promoten. Ze manipuleren de taal die wordt gebruikt door echte websites als thenextweb.com, lifehacker.com en reddit.com.

Zo verwijder je fake language spam in Google Analytics:
  1. Je Google Analytics account openen
  2. Naar Admin gaan, op Filters klikken en dan op “Add Filter.”
  3. Geef je filter een naam, selecteer “Custom” voor Filter Type en selecteer “exclude”.
  4. Zet het veld op “language setting” en plak vervolgens het volgende in het vak met filter patterns: \s[^\s]*\s|.{15,}|\.|
  5. Verifieer de filter en klik op “Save.”

3. Het .htaccess bestand van je domein wijzigen of een regel toevoegen in Nginx

Als je host cPanel gebruikt: een van de meest effectieve manieren om referral spamverkeer te blokkeren is door je .htaccess bestand te bewerken. Dit bestand wordt gebruikt om je server te beheren en kan worden geïnstrueerd om spambezoeken van bepaalde domeinen of IP addressen te blokkeren.

Het blokkeren van spamverkeer via je .htaccess is effectief
Het blokkeren van spamverkeer via je .htaccess is effectief (zolang je voorzichtig bent en je site niet beschadigt).

Deze methode blokkeert niet alleen de referral spamdomeinen van je website, maar ook van je server. Dit is handig als je je serversnelheid lekker snel wil houden.

Zo blokkeer je spam via je .htaccess bestand:

Stel dat je graag Semalt, free-traffic.xyz en buttons-for-websites.com wil uitsluiten. Je kan dan eenvoudig het volgende commando toevoegen aan het .htaccess bestand van je website:

## SITE REFERRAL BLOCK
RewriteCond %{HTTP_REFERER} semalt\.xyz [NC,OR]
RewriteCond %{HTTP_REFERER} free-traffic\.xyz [NC,OR]
RewriteCond %{HTTP_REFERER} buttons-for-website\.com [NC,OR]
RewriteRule .* – [F]

Geen idee wat dit allemaal betekent? Geen probleem. Dit is een kort overzicht van alles wat er in het commando plaatsvindt:

  • ‘NC’ maakt het commando niet meer hoofdlettergevoelig, zodat ook SeMaIT.com of Free-Traffic worden opgevangen door het filter.
  • ‘OR’ geeft aan dat er meerdere referrers moeten worden geblokkeerd.
  • De laatste regel hebben we erneer gezet om aan te geven wat er moet gebeuren als een website toegang probeert te krijgen en wordt geweigerd.
  • ‘F’ staat gelijk aan fail (mislukt) en betekent dat de referrer een 403 fout te zien krijgt.

Nogmaals, als het gaat om alles wat met .htaccess te maken heeft: wees extreem voorzichtig.

Als je ook maar één teken op de verkeerde plek hebt staan of per ongeluk een dubbele spatie invoert, dan kan je hele website offline gaan.

Dit is hoe je spam blokkeert in Nginx:

Als je host gebruikmaakt van Nginx als webserver in plaats van Apache, dan is het niet mogelijk om je .htaccess bestand te bewerken (omdat deze simpelweg niet bestaat) en moet je een regel instellen in Nginx om per referrer de verzoeken te blokkeren:

if ($http_referer ~* "bad-site-to-block\.com") {
    return 403;
}

Als je een klant bent van Kinsta, neem dan contact op met onze support en vraag ze om deze regel toe te voegen.

4. Een externe tool gebruiken om referral spam te blokkeren

Als je een WordPress gebruiker bent, dan kan je een referrer spamplugin gebruiken om van botverkeer af te komen.

Je beste optie is Sucuri die referrer spam voor je monitort en deze verwijdert van je website. Bovendien kan deze plugin je ook beschermen tegen DDoS aanvallen, omdat het een alles-in-één oplossing is voor het beveiligen van websites.

Als Sucuri iets teveel van het goede voor je is, dan is Stop Referrer Spam wellicht een goed alternatief. Deze plugin maakt gebruikt van een openbare lijst van referrer spammers die opgesteld is door Matomo, het bedrijf achter het Google Analytics alternatief Piwik.

Er zijn nog een paar andere opties, maar deze zijn al een tijdje niet bijgewerkt, dus mogelijk zijn ze niet helemaal compatibel met je WordPress installatie. Het runnen van verouderde software kan ook voor beveiligingslekken zorgen, maar als je ze per se wil testen, dan zijn dit ze:

Maak altijd een back-up voordat je een nieuwe plugin installeert, zodat je makkelijk kan herstellen naar een werkende site als er iets mis gaat.

Veelgestelde vragen over spam in Google Analytics

Hier zijn antwoorden op een aantal van de meest gestelde vragen over Google Analytics spam:

Kan ik spamsites bezoeken die ik in Google Analytics vind?

Het eerste (en belangrijkste) dat je moet onthouden is: klik niet op de link!

Als je naar zo’n website gaat, dan krijgen spammers wat ze willen. In plaats daarvan kan je de website het best googelen tussen aanhalingstekens:

Zoeken naar spam referrersites in Google om te zien of ze al een keer aangegeven zijn
Zoeken naar spam referrersites in Google om te zien of ze al een keer aangegeven zijn

Als je het op deze manier doet, hoef je die site niet te bezoeken, maar krijg je er wel meer te weten over. Als de site inderdaad een bron van Google Analytics spam is, dan heeft iemand er waarschijnlijk al over geschreven.

Waarom is het belangrijk om spam uit mijn Google Analytics te filteren?

Google Analytics data (en website-analytics in het algemeen) zijn een van de beste manieren om de prestaties van je site bij te houden en om te zien wat wel en niet werkt voor je online publiek. Je kan niet alleen zien wat goed gaat, maar ook wat niet zo goed gaat (oftewel verbeterpunten).

Maar als je hier ook referral spam tussen hebt zitten, dan staat de nauwkeurigheid van deze gegevens op het spel.

Een behoorlijk aantal sessies zouden wel eens nepbezoeken kunnen zijn:

Nepbezoeken van Semalt in Google Analytics
Nepbezoeken van Semalt in Google Analytics

Als je niet over de best mogelijke gegevens beschikt in Google Analytics, dan loop je het risico om verkeerde beslissingen te nemen. Kort samengevat, als de gegevens niet nauwkeurig zijn, kan je makkelijk dingen verkeerd interpreteren.

Het kan bijvoorbeeld zo zijn dat je veel tijd en geld besteed aan een bepaalde pagina van je site, omdat het lijkt alsof deze erg populair is onder je doelgroep. Maar als al het verkeer van bots afkomstig is, dan heeft het helemaal geen zin om hierin te investeren.

Het opschonen van je data en het instellen van filters tegen spambots zorgt ervoor dat je analyses nuttigere en nauwkeurigere inzichten opleveren.

Kan ik ook Google Analytics data uit het verleden opschonen?

Met spamfilters krijg je schonere data, maar ze worden niet toegepast op data uit het verleden.

Zodra je je filters hebt ingesteld, wordt spam vanaf die datum weggefilterd, maar dit geldt niet voor reeds verzamelde data. De data uit het verleden bevat dus nog steeds onnauwkeurige gegevens die zijn veroorzaakt door bots.

Gelukkig is er niet alleen maar slecht nieuws. Je kan nog steeds de gegevens van met en zonder spam vergelijken in Google Analytics:

Vergelijken van met en zonder spamverkeer in Google Analytics
Vergelijken van met en zonder spamverkeer in Google Analytics

Door de vergelijking te zien tussen je analyses van voor en na het toepassen van spamfilters, kan je beter begrijpen hoeveel verkeer afkomstig was van bots, waardoor je een nauwkeuriger beeld van je site krijgt.

Samenvatting

Helaas is het volledig vermijden van spam onmogelijk. Maar je kan wel de impact ervan op je Google Analytics gegevens bepalen.

Door de juiste filters, plugins te gebruiken in combinatie met wat technische knowhow, ben je goed uitgerust om de spammers tegen te houden. Hiermee zorg je voor meer accurate gegevens in Google Analytics en kan je een betere website maken.

Nu is het jouw beurt: wat is jouw favoriete manier om spam te verwijderen in Google Analytics?

Matteo Duò Kinsta

Hoofdredacteur bij Kinsta en content marketing consultant voor WordPress plugin-ontwikkelaars. Verbind met <a href="">Matteo op Twitter.