Google Analytics, falsi referral (Referrer Spam) e finte visite
Se utilizzate Google Analytics, probablmente avete notato un fenomeno strano: una lista di referral che non comprendete.
Sono i falsi referral e vi consigliamo di liberarvene!
Individuare i falsi referral
Provate a vedere il report di Analytics: Acquisizione > Tutto il Traffico > Referral.
Se vi trovate in una situazione come quella riportata sopra, in cui tra i referral ci sono siti come:
- free-share-buttons.com
- buttons-for-website.com
- semalt.semalt.com
- site33.simple-share-buttons.com
- site31.simple-share-buttons.com
- best-seo-offer.com
abbiamo due notizie per voi: una cattiva e una buona
- La cattiva notizia: siete affetti da SPAM su Google Analytics;
- La buona notizia: leggendo il seguito potete imparare come correre ai ripari.
Il problema è particolarmente rilevante soprattutto nei siti delle piccole e medie aziende (PMI) in quanto molto spesso il numero delle visite non è elevato e i referral sono generalmente pochi. I fenomeni descritti poc’anzi possono quindi “sporcare” i dati in maniera consistente, rendendo la lettura delle analytics totalmente inutile in quanto basata su dati inaffidabili.
Il Referrer Spam (o falso referral) si verifica quando il sito riceve traffico da un spam bot e questo viene registrato da Google Analytics come traffico normale.
I bot (abbreviazione da robot) detti anche crawler sono software che navigano in automatico attraverso internet per rilevare e prelevare contenuti trovati in rete. Sono utilizzati per lo più dai motori di ricerca nel processo di identificazione ed indicizzazione dei contenuti dei siti.
Alcuni bot sono invece utilizzati per scopi malevoli quali:
- commettere click fraud (generare cioè falsi click)
- raccogliere/rubare indirizzi e-mail
- copiare contenuti dei siti
- gonfiare artificialmente il traffico dei siti web
Quindi a seconda di come viene utilizzato un bot, possiamo avere bot “buoni” e bot “cattivi”.
Esempio di un bot “buono” è Googlebot che viene utilizzato da Google per eseguire la scansione e indicizzare le pagine web su Internet.
La maggior parte dei bot – sia buoni sia cattivi – non esegue JavaScript e quindi le loro “visite” non vengono registrate dai sistemi di Analytics che si basano su script Java, come ad esempio Google Analytics, ma non è così per tutti.
I bot che eseguono JavaScript appaiono dunque nei rapporti GA e alterano di fatto i dati di traffico (traffico diretto o referral) e tutte le metriche basate su sessioni come la frequenza di rimbalzo, il tasso di conversione ecc.
In alcuni casi si spingono addirittura a generare falsi eventi come si può vedere nell’immagine.
In questo caso oltre a una serie di eventi voluta troviamo: “to use this…” che è una intrusione non voluta nel nostro account di Google Analytics.
I motori di ricerca che non eseguono JavaScript – come Googlebot – invece non inquinano i dati sul traffico e le relative metriche. Per sapere se Googlebot è passato sul nostro sito dobbiamo ricorrere ai dati registrati nei log dei server e a strumenti appositi come Google Webmaster Tool.
Bot cattivi utilizzano vari metodi per mascherare se stessi, in modo da non poter essere facilmente rilevati, ad esempio fingendo di essere un browser web (come Chrome, Internet Explorer, ecc) o possono fingere di essere traffico proveniente da un sito web legittimo.
Risolvere il problema dei referrer spam
Per risolvere il problema, anche se non in modo definitivo perché continuano a crescere, si può procedere a mano come descritto qui in seguito o più semplicemente affidarsi a un servizio messo a disposizione gratuitamente da Simo Ahava, guro della Web Analytics: spam insertion tool che evita il lavoro iniziale ma non risolve ovviamente il problema dell’aggiornamento.
Rimozione manuale dei referrer spam
Occorre sostanzialmente filtrare all’ingresso questi siti malevoli.
Ecco come procedere:
- Report Acquisizione > Tutto il traffico > Referral del proprio account GA e poi ordinare per frequenza di rimbalzo decrescente:
- Cercare referenti con il 100% o 0% frequenza di rimbalzo e 10 o più sessioni. Essi sono molto probabilmente referrer spam;
- Per semplificare il lavoro si può trovare un elenco quasi esaustivo dei referrer spam al seguente indirizzo: https://perishablepress.com/blacklist/ultimate-referrer-blacklist.txt;
- Creare i filtri per escluderli.
I filtri creati avranno il seguente aspetto:
Non va usata invece la “lista esclusione referral” (Amministrazione > Proprietà > Informazioni sul monitoraggio > Elenco Esclusione referral, perché essa converte in dirette le visite dai domini specificati spostando solamente il problema.
Attenzione: con questi filtri non sempre la verifica Filtri di GA funziona.