Recupero post-Penguin: come rimuovere i backlink sospetti

google strumenti
Tempo stimato di lettura: 11 minuti, 0 secondi
Pubblicato il 26 giugno 2012

Il vostro sito è stato colpito da Penguin Update? Se avete questo sospetto potrebbe essere opportuno delineare in modo accurato lo scenario, in modo da comprendere al meglio la situazione; al di là dell’analisi dei contenuti, di fatto, è importantissimo individuare ed esaminare il proprio link profile. Questo significherà tabellare l’elenco di tutti i backlink al vostro sito, operazione che è resa possibile da una molteplicità di strumenti disponibili sul web, e procedere alla rimozione dello spam.

Quali strumenti utilizzare per l’analisi?

Una delle opportunità in questo tipo di analisi è legata all’uso di strumenti come Ahrefs o Open Site Explorer, ma esistono almeno due problemi nell’uso di strumenti del genere per l’Italia. Prima di tutto essi sono disponibili solo un numero limitato di volte o, tipicamente, soltanto dietro pagamento di un canone mensile (spesa tutt’altro che abbordabile, in molti casi); in secondo luogo, anche ammettendo di poterne disporre in modo illimitato, difficilmente potremo essere sicuri di avere “copertura” su tutti i backlink che ci interessano. Questi software, infatti, tendono a non consultare l’indice di Google o Bing, bensì utilizzano i dati dei propri crawler che sono cosa ben diversa.

Per i nostri scopi, invece, è indispensabile che l’operazione individui tutti i collegamenti esterni al nostro sito che i motori più famosi potrebbero tenere in considerazione. Sappiamo che Google non offre queste informazioni pubblicamente, e al tempo stesso l’utilizzo dell’operatore link: è considerato piuttosto vano in quanto presenta solo un minuscolo campione casuale di backlink, spesso con dei duplicati e, generalmente, piuttosto lacunoso. Prima di procedere oltre, faccio notare che il discutere di “penalizzazione post-Penguin” è solo una sorta di convenzione, anche in ragione del fatto che non sempre in ambito SEO è possibile stabilire con certezza “chi abbia fatto cosa” – come chiunque abbia lavorato su un motore di ricerca sa molto bene. Di fatto, quindi, le tecniche descritte di seguito possono estendersi per recuperare le penalizzazioni di qualsiasi update algoritmico, e anzi sarebbe buona norma trovare il tempo di eseguire questa operazione periodicamente.

Chi deve preoccuparsi?

È bene ripetere su cosa, in via ufficiale, ha posto l’attenzione Google Penguin:

  1. valorizzazione dei siti di qualità e delle tecniche white hat di promozione dei contenuti;
  2. penalizzazione del keyword stuffing in varie “gradazioni” (ripetizione impropria di chiavi di ricerca ai fini del posizionamento);
  3. penalizzazione di schemi di link anomali noti come “unusual linking pattern” (fonte)

A quanto risulta attualmente, gli schemi di link illeciti vengono a volte segnalati nel Webmaster Tool; le tecniche di recupero indicate considerano invece singoli backlink sospetti. Per quanto riguarda il punto 2, invece, la rilevazione potrebbe essere più complicata e riguarda, di fatto, l’analisi di contenuti esterni al nostro sito. Se in generale avete acquistato link, usato software di link building o generato parecchi link senza una reale utilità per gli utenti, avrete ragione di preoccuparvi di questo update.

Quali sono i “ferri del mestiere”?

In questa analisi ho optato per ricorrere esclusivamente ai due strumenti gratuiti forniti da Google:

  • Google Analytics, che permette di visualizzare i link che portano traffico usando i segmenti personalizzati;
  • Google Webmaster Tools, che offre la lista di backlink al vostro sito direttamente.

Non è detto, in generale, che i due strumenti rilevino le stesse cose, quindi sarà opportuno utilizzare entrambi e successivamente unificare la lista in un unico foglio Excel. È necessario fare una serie di premesse, a questo punto, che derivano più che altro dalla mia esperienza diretta:

  1. i siti che si prestano alla link analysis sono, nella stragrande maggioranza dei casi, quelli che hanno generato un minimo di traffico diretto o, quantomeno, di ricerca;
  2. per questa ragione siti molto giovani e/o poco visitati offrono poche o nessuna informazione rispetto a quante ne avremmo bisogno;
  3. un problema concreto potrebbe essere legato all’analisi di effetti collaterali post-Penguin su siti molto piccoli (landing page, minisiti ecc.), ma in questi casi è necessario lavorare prioritariamente sui contenuti, più che sui link;
  4. se avete molti siti monitorati, quindi, è essenziale concentrare l’attenzione laddove abbiate un maggior sospetto di penalizzazioni (ad es. sito scomparso in toto dai risultati).

Uso del WebMaster Tools per rilevare i backlink al nostro sito

Quello di cui abbiamo bisogno si trova molto velocemente: basta aprire lo strumento, cliccare sulla voce “Traffico“, poi su “Link che rimandano al tuo sito” e successivamente – alla voce “Chi utilizza più link” – su “Altro“. Aprendo questa pagina vedremo una lista di siti che collegano il nostro, con indicazione del nome del dominio, del numero di backlink totale proveniente dalla fonte in questione e del numero di pagine indicizzate che contengono il backlink.

Si tratta di informazioni che non sono fornite in tempo reale, nel senso che un link acquisito oggi potrebbe non essere rilevato; ad ogni modo si tratta del quadro più completo che, almeno in prima istanza, potremmo desiderare. Possiamo esportare questi dati in formato CSV (Comma-Separated Values) per poi importarli in un foglio di calcolo Excel, oppure – opportunità introdotta di recente – utilizzare direttamente Google Docs.

Quali backlink bisogna rimuovere?

I soliti “santoni” del settore hanno enormemente abusato di questo concetto, dando indicazioni fin troppo specifiche sui backlink da rimuovere basandosi, ad esempio, sull’analisi dei testi àncora, che secondo loro non dovrebbero possedere dei pattern troppo ripetitivi; ma questa, in realtà, è una “regola non scritta” che viene seguita dai SEO da diversi anni e che c’entra poco con Penguin. Di fatto Google non ha fornito informazioni così dettagliate sul proprio update proprio per evitare che i webmaster potessero aggirare il meccanismo; al tempo stesso gli azzardi sull’argomento non sono mancati e, direi in modo incredibile, in molti hanno dato ascolto a questi suggerimenti con esito vagamente autolesionista. Non fatevi tentare, inoltre, dal credere che i semplici numeri riportati nella tabella precedente possano farvi comprendere quali link rimuovere: non si tratta di un’analisi così superficiale, perchè i siti sospetti potrebbero essere tali sulla base di criteri a più ampio respiro. Di sicuro la lista va analizzata tutta, e molto spesso lo spam si potrebbe nascondere tra le ultime righe, anche se non è detto che sia per forza pericoloso.

Per stabilire quali link debbano includersi nella “lista dei cattivi”, esistono svariati principi applicabili:

  1. backlink segnalati esplicitamente dal Webmaster Tools;
  2. backlink da portali in altra lingua, salvo casi eccezionali (link a tema);
  3. backlink da siti che si possano usare come link farm (ad es. quelli che danno informazioni sui domini come whois.domaintools.com);
  4. backlink da siti di natura estranea a quella del vostro (ad es. un sito sulla raccolta differenziata con un link al vostro blog di cinema);
  5. aggregatori che copiano i vostri contenuti, anche parzialmente; senza per questo voler criminalizzare, si tratta di una pratica ormai vetusta e sostanzialmente improduttiva, dannosa nella maggioranza dei casi (ho registrato diverse circostanze in cui le notizie ricopiate si posizionavano prima del contenuto originale)
  6. backlink multipli provenienti da un sito senza alcuna utilità per gli utenti (costruiti in modo automatico o sulla base dei tweet, a meno che non sia un aggregatore alla ZicZac sotto il vostro controllo).

Come si rimuovono i backlink indesiderati?

Una volta individuata la lista dei potenziali link-spam, è opportuno visitare i singoli siti ed accertarsi della natura “malevola” del backlink stesso, oltre al fatto che lo stesso sia effettivamente presente; di fatto la decisione di rimuovere i “vicini scomodi” dovrebbe essere effettuata sulla base del vostro buonsenso, e in ogni caso vi suggerisco di non calcare troppo la mano. Considerate sempre il seguente fatto: i link non sono affatto l’unica causa di penalizzazione possibile, e se per assurdo tutti seguissero i suggerimenti dei guru di cui sopra – del tipo: “rimuovere i backlink con chiavi troppo mirate perchè non si sa mai” – in molti potrebbero auto-eliminarsi dal mercato senza rendersene conto; ed è una cosa piuttosto comune, purtroppo, che può capitare qualora una strategia di link building sia troppo astratta o senza una solida logica di web-marketing.

Ad ogni modo il primo passo necessario è quello di verificare che i backlink siano davvero indicizzati, cercando su Google: “site:sitosospetto.est nomesitotarget.est“,  oppure “site:sitosospetto.est chiave-di-ricerca” (senza virgolette). Se uscisse fuori almeno un risultato per una chiave di ricerca piuttosto competitiva, ad esempio, ed il sito sospetto è di bassa qualità (testi scadenti, scarsa navigabilità, grafica poco curata, commenti ricchi di spam) è il caso che richiediate la rimozione del backlink al webmaster. In alternativa  potete segnalare il link malevolo direttamente a Google, ma non esiste garanzia di risposta e non è scontato che riusciate a risolvere il problema. Se ad esempio avete individuato un sito che ha inserito un backlink improprio al vostro sito, la cosa più semplice è contattare il webmaster lasciando un commento sul suo blog o scrivendogli una mail.

Nella pratica, pero’, potrebbe essere più complesso rimuovere alcuni tipi di link in ingresso, sia perchè a volte è impossibile rintracciare i responsabili, sia perchè essi potrebbero ignorare la vostra richiesta. Se il backlink non fosse rivolto alla home page, comunque, potete pensare di “invalidarlo” cambiando l’URL della pagina vittima (ad esempio da miosito.com/categoria a miosito.com/lacategoria): dopo averlo fatto, ovviamente, farete in modo di reindirizzare il traffico “pulito” al nuovo indirizzo (backlink di qualità inclusi, ovviamente) e dovrete risolvere tutti i nuovi errori 404.

Sarebbe auspicabile, per semplificare la vita a tutti, che il Webmaster Tools permettesse di segnalare i link che non vogliamo siano conteggiati ai fini del rank: nel frattempo siamo purtroppo costretti a fare tutto manualmente. In generale è opportuno lasciare intatti solo i backlink che siano utili ad almeno una categoria di utenti, per quanto minuscola essa possa essere, e questo vale come criterio generale: facciamo sempre attenzione, inoltre, a non invalidare precedenti strategie white hat facendo una “strage” incondizionata.

…e le àncore?

Nella medesima sezione del Webmaster Tools è possibile individuare un’ulteriore sezione utile, ovvero quella relativa alle anchor text esterne più utilizzate per il vostro sito (“Come sono collegati i tuoi dati?“); senza entrare nel merito di discorsi complessi (per cui rimando al mio precedente articolo sui link pattern) il sospetto che ci possa essere qualcosa che non va è legato a due casistiche di base:

  • ancore che siano completamente fuori tema rispetto all’argomento del sito;
  • ancore che siano troppo concentrate su pochi termini, ovvero senza un’opportuna variazione sulla long tail.

Senza voler generalizzare e creare allarmismi inutili, direi che il numero di ancore differenziate dovrebbe essere, per siti medio-piccoli, di almeno un centinaio di termini differenti; in generale, inoltre, le ancore più influenti dovrebbero essere elencate per prime.

Usare Google Analytics per trovare backlink “cattivi”

L’utilizzo di Google Analytics, ed in particolare dello strumento “Segmenti avanzati“, permette di filtrare le visite rilevate al vostro sito in base alla provenienza (referall). Il meccanismo su cui si basa questo secondo tool è legato alla definizione di alcuni filtri che possano escludere le fonti di traffico “fidate”, e mostrarvi di conseguenza tutte le altre. Tra di esse è possibile che si annidi qualche link malevolo non “visto” dal WMT; non è detto, infatti, che la lista definita in precedenza sia completa – e la guida ufficiale è molto chiara a riguardo: “può darsi che non tutti i link che rimandano al tuo sito siano elencati“. Possiamo quindi sfruttare Analytics per individuare ulteriore spazzatura che sia annidata in mezzo ai nostri riferimenti. Un modo per farlo è quello di creare un nuovo segmento personalizzato con condizioni “AND” di questo tipo:

  • ESCLUDI Sorgente Contenente facebook.com
  • ESCLUDI Sorgente Contenente okNotizie.virgilio.it
  • ESCLUDI Sorgente Contenente ziczac.it
  • ESCLUDI Sorgente Contenente [altra fonte fidata]
  • ESCLUDI Sorgente Contenente (direct)
  • ESCLUDI Sorgente Contenente search-results

In pratica vogliamo monitorare tutto il traffico “sporco” escludendo quello fidato, identificando la provenienza dello stesso ed applicando, se necessario, le stesse tecniche di rimozione. Di seguito riporto, per maggiore chiarezza, come debba essere scritta la regola per escludere il traffico da Facebook all’interno dello strumento in esame.

Per estensione stiamo quindi “suggerendo” ad Analytics di mostrarci tutto il traffico che non provenga da fonti trusted; salvate dunque il segmento e, a questo punto, allargate il periodo di considerazione ad almeno 6 mesi, cliccando sull’apposito calendario in alto a destra. Ora cliccate sulla sezione relativa al traffico dai referall (“Sorgenti di traffico”, “Sorgenti”, “Referral”): dovreste vedere chiaramente tutte le fonti di traffico “non fidate” di cui potreste non essere a conoscenza. Per quanto riguarda uno dei miei siti più trafficati, ad esempio, come primo risultato usciva fuori un blog aggregatore di feed (punto 5), che pero’ avevo già fatto rimuovere a suo tempo. Se trovate fonti di traffico che vi sembrano non idonee al vostro sito (fuori tema, tipicamente), potete pensare di ricorrere alle stesse strategie descritte in precedenza.

Conclusioni

Le tecniche che ho elencato non sono esclusive, e non rappresentano l’unica alternativa possibile per operare un recupero post-Penguin: in alcuni casi potrebbero anche non essere effettive, ovvero non rilevare nulla di anomalo, ma l’attenzione verso i link spam dovrebbe rimanere sempre attiva. Di fatto si tratta di strategie che utilizzo periodicamente su buona parte dei miei siti, quantomeno su quelli che dipendono in misura considerevole dal traffico di ricerca, e solo in alcuni casi ho avuto problemi (non esattamente penalizzazioni, per fortuna). Il problema di fondo, comunque, rimane la frequente difficoltà nel rimuovere backlink indesiderati, che potrebbero aver inserito a vostra insaputa; la cosa migliore, in effetti, è che questo non condizioni la nostra attività, permettendo così al sito di crescere in modo naturale e senza ossessioni su aspetti non controllabili.

  • Come sempre un ottimo articolo, super approfondito e chiaro! Grazie Salvatore, da stampare e appendere in caso di bisogno 😉

  • Cristian

    Bravo.

  • Bell’articolo davvero… farò un controllo su tutti i miei siti seguendo i tuoi suggerimenti.

  • per quanto riguarda i backlink di spam c’è una novità fresca fresca di due giorni http://www.riccardoperini.com/google-disavow-links.php

  • Ciao Salvatore, esclusi webmaster tool e analytics, quali strumenti possiamo utilizzare per capire velocemente se ci sono backlink dannosi? Ad esempio, majestic seo o ahrefs (a pagamento) forniscono report veloci per segnalare l’autorevolezza di quei backlink?

    • Ciao Roberto,

      queste operazioni a mio avviso si devono fare mediante scrematura manuale dei link: è un lavoraccio ma è l’unico modo per uscirne positivamente senza perdere link importanti. Con gli strumenti automatici credo si rischi solo di fare confusione, peggio che peggio quelli orientati sui mercati di ricerca non italiani.

      Nulla mi pare più affidabile di un occhio umano critico in questi scenari, magari mi sbaglio 🙂

      • concordo con te Salvatore…i ferri del mestiere pagano sempre ma sta diventando sempre più complesso tenere sott’occhio tutto con strumenti manuali. Faccio una fatica boia a controllare tutti i domini!! Grazie comunque per avermi confermato il metodo.

Shares