Rensa bort spam referrals (skräptrafik) från Google Analytics del 1

För en tid sedan skrev vi ett inlägg där vi beskrev hur man Filtrerar bort robottrafik via Google Analytics för att få renare statistik.

Den gången handlade det om att kryssa i en ruta i Google Analytics och låta Google Analytics filtrera bort kända robotar och spindlar automatiskt. Denna funktion bygger på att robotar identifierar sig som robotar och de filtreras därmed bort från webbstatistiksystemens rapporter.

Bortfiltreraruta

De som testat detta har säkert redan märkt att det tyvärr inte räcker till. Förhoppningsvis kommer Google att hitta på någon bättre lösning för att få bort alla spam referrals snart. Men fram till dess måste man vidta egna åtgärder för att få renare statistik i rapporterna.

Vi har tidigare berört ämnet i och med artikeln om Semalt som är en av dessa domäner/företag som ägnar sig åt att ”förstöra” webbstatistiken. Trafiken från Semalt identifieras inte som robottrafik och därmed dyker de upp i webbstatistikrappporterna. Semalt var en av de första falska hänvisningsadresserna (spökhänvisningar) som började dyka upp i webbstatistiksystem.

Nedan beskriver vi hur man med hjälp av segment kan rensa bort falska hänvisningar från både skräpsökrobotar och spökhänvisningar ifrån historisk data. När man sedan skapat segmentet och testat att segmentet fungerar som det ska kan man skapa ett permanent filter för framtida data. Hur man gör det beskriver vi i del 2.

Vad är Spöktrafik (Ghost traffic) för något?

Spöktrafik är trafik som aldrig besöker webbplatsen. Spammarna använder den teknik som Google Analytics har idag och kan via denna skicka http-requests direkt till Google Analytics insamlingsservrar utan att egentligen besöka webbplatsen. Spammarna använder ett relativt enkelt program som sänder falska (spök) anrop till specifika Google Analytics ”properties”.

Trafiken kommer alltså inte ifrån vanliga robotar eller spindlar och är därför svårare att blockera eftersom de aldrig ens besöker webbplatsen (trafiken skickas direkt från spammarna till Google Analytics). Spammarna lämnar ofta spår i värdnamnrapporten eller hänvisningsrapporten för att locka till sig klick till sina sajter som är fulla med spam. Klicka aldrig på en sådan länk. Ifall ni är osäkra på ifall det är en skräplänk eller inte kan ni googla på den och se vad andra skrivit om den.

Skapa ett segment i GA för att filtrera bort skräptrafik

Segmentet för att filtrera bort skräptrafiken nedan består av två delar. I den första delen använder vi ett inkludera- värdnamn-filter för att utesluta all spöktrafik och i den andra delen ett exkludera hänvisningsfilter för att exkludera falska hänvisningar.

Inkludera värdnamn

När ni först implementerade Google Analytics på er webbplats så var det säkert också endast just där som ni implementerade GA. Vid ett senare tillfälle kanske även i ett betalningssystem etc. När ni tittar i rapporten ”Värdnamn” bör det därför inte finnas några andra värdnamn än just de där ni implementerat Google Analytics. Resterande är förmodligen spöktrafik.

Ni hittar rapporten via: Målgrupp -> Teknik -> Nätverk -> Värdnamn.

Värdnamnsrapporten

Det finns dock några vanliga undantag:
• translate.googleusercontent.com – Vissa besökare använder Google translate för att översätta webbplatserna och dessa vill vi låta vara kvar.
• webcache.googleusercontent.com – Några besökare använder även Googles cachade version av sidorna på webbplatsen så dem får också vara kvar.

Istället för att exkludera alla möjliga olika spökhänvisningar (hänvisningar där besöken aldrig nått webbplatsen) så tillåter vi istället bara de giltiga värdnamnen. På det sättet behöver vi inte uppdatera filtret förutom när vi implementerar GA på en ny instans.

Så här skapar man segmentet för att inkludera värdnamn

Skapa ett nytt segment

Lägg till segment

Klicka på + Nytt segment

Nytt segment

Döp segmentet

Döp segmentet

Klicka på ”Villkor” under Avancerat

Villkor under avancerat

Välj Sessioner, Ta med, Värdnamn, matchar reguljärt uttryck -> skriv sedan in de värdnamn ni vill få med. Separera dem med ”|” utan mellanrum. Lägg även till ”.*” innan varje nytt värdnamn. Det reguljära utrycket ”.*” gör att även subdomäner tas med.

Inkludera värdnamn

Filtret ovan bör få bort spöktrafiken. För att testa att segmentet fungerar kan man återigen besöka ”Värdnamn-rapporten”. Målgrupp -> Teknik -> Nätverk -> Värdnamn. Nu ska endast de värdnamn ni valt att ta med vara kvar i rapporten.

Nedan beskriver vi hur man utvidgar segmentet genom att utesluta en mängd skräphänvisningar.

Uteslut hänvisningstrafik från skräpsajter

Klicka på nedåtpilen till höger om segmentet och välj redigera

Redigera segment

Klicka på ”+ Lägg till filter

Lägg till filter

Välj Sessioner, Uteslut, Medium, matchar exakt -> referral
Klicka på ”OCH” – > välj källa, matchar reguljärt uttryck

Uteslut refferals

Ett reguljärt uttryck (regex) får max vara 250 tecken. Därför måste man dela upp dem i flera olika filter. Man separerar filtren med ”ELLER”.

Följande spam referrals (skräphänvisningar) vill vi filtrera bort:

Filter 1

7makemoneyonline.com|12masterov.com|anticrawler.org|atubecatcherdownload.com|avtodomik.com.ua|bard-real.com.ua|best-seo-offer.com|best-seo-solution.com|billiard-classic.com.ua|buttons-for-website.com|buttons-for-your-website.com

Filter 2

buy-cheap-online.info|cardiosport.com.ua|ci.ua|comhit.net|customsua.com.ua|delfin-aqua.com.ua|depositfiles-porn.ga|dipstar.org|domination.ml|hulfingtonpost.com|e-kwiaciarz.pl|este-line.com.ua|darodar.com

Filter 3

free-share-buttons.com|free-social-buttons.com|generalporn.org|Get-Free-Traffic-Now.com|ghazel.ru|googlsucks.com|itlogic.in.ua|it-max.com.ua|kambasoft.com|maridan.com.ua|mebeldekor.com.ua|med-zdorovie.com.ua|merinos.se|mk-prestige.com.ua|obuvi.com.ua

Filter 4

offers.bycontext.com|olgacvetmet.com|onlywoman.org|palvira.com.ua|pornhub-forum.ga|ranksonic.com|ranksonic.org|savetubevideo.com|se.wow.com|search.gboxapp.com|search.genieo.com|semalt.com|site3.free-share-buttons.com

Filter 5

site4.free-share-buttons.com|taf.avtodomik.com.ua|theguardlan.com|tool.twintipinsights.com|trion.od.ua|ultraslo.com|windowssearch.com|vr.biz.ua|youporn-forum.ga|youporn-forum.uni.me|алкоголизм.лечениенаркомании.com

Filter 6

наркомания.лечениенаркомании.com|event-tracking.com|guardlink.org

Alla referral filter

När man är klar klickar man på ”spara”. Sedan kan man testa att segmentet fungerar genom att gå till rapporten Hänvisningar. Förvärv –> All trafik-> Hänvisningar. Nu ska ingen av de falska hänvisningarna som vi uteslutit synas i rapporten.

Nu är vi klara med segmentet och kan använda det bakåt i tiden för att få mer rättvisande statistik. För att få bättre data framåt i tiden kan vi använda samma tillvägagångsätt beskrivet ovan och filtrera bort skräptrafiken innan den når Google Analytics rapporterna. Hur man skapar ett sådant filter beskriver vi i den andra delen av den här artikelserien.