Si possono scoprire le query “not provided”?

Ricerca Query
Tempo stimato di lettura: 5 minuti, 0 secondi
Pubblicato il 6 marzo 2013

Google ha deciso da circa un anno di nascondere le query provenienti da utenti loggati con Gmail: cosa possiamo fare, dunque, per sopperire alla mancanza delle chiavi di ricerca “not provided“?

Spulciando i dati di Google Analytics nelle nostre consuete attività di ottimizzazione potrà essere comune imbattersi nelle query “not provided“: si tratta di una generica etichetta che rende anonime le ricerche, in particolare qualora esse siano effettuate dagli utenti che erano loggati in Google. Questa feature ha mandato su tutte le furie, a suo tempo, diversi blogger e SEO del settore: occultare informazioni così importanti significa rinunciare, in molte circostanze, a volte a pià della metà delle query di interesse del sito in analisi. E questo, naturalmente, crea delle difficoltà enormi per quanto riguarda la ricerca di parole chiave e l’analisi delle fette di mercato di interesse. Al di là del fatto che sia possibile lavorare ugualmente anche senza ricorrere a queste informazioni (come vedremo a breve in questo articolo), quello che vorrei provare a chiedermi, in definitiva, è di fatto legato alle seguenti due domande:

  • ha senso chiedersi quali possano essere le query di ricerche nascoste da “not provided“?
  • in caso di risposta positiva, è possibile effettuare una forma di reverse-engineering per scoprire le query nascoste?

Cosa ha detto Google in merito?

Prima di inoltrarci nell’argomento, prendiamo brevemente in considerazione le informazioni ufficiali disponibili dall’azienda del motore di ricerca stesso. La documentazione di Google, infatti, parla chiaro:

  • Quando accedi a Google.it, la ricerca organica viene condotta in un contesto sicuro. Se visiti un sito da questi risultati di ricerca, la visita è ancora classificata come organica, ma i termini di query non sono disponibili nel rapporto. L’etichetta (not provided) è utilizzata al posto dei termini di query.

Stessa sostanza che, in effetti, viene confermata anche sul blog di Google Analytics:

  • abbiamo creato il token “(not provided)” all’interno della reportistica del traffico di ricerca organico. Continuerai dunque a vedere i referral senza alcun cambiamento, ma soltanto le query per gli utenti loggati ne saranno affette.

Google ha iniziato a nascondere queste informazioni, a mio avviso, per una ragione molto semplice: ragionare troppo in termini di chiavi di ricerca (che, come sappiamo, dovranno poi apparire all’interno del testo ed essere contestualizzate, focalizzate e distribuite nel sito) porta ad una forma mentis che devia l’attenzione dal problema principale, che è annesso invece ai siti ed ai portali che forniscano un’effettiva qualità dei contenuti. In un certo senso, quindi, la risposta alla prima domanda potrebbe essere nettamente negativa: tanto varrebbe cambiare approccio, sviluppare modi creativi di lavorare e svincolarsi, se possibile, dall’analisi dei freddi numeri per fare in modo di realizzare, nel concreto, pagine web innovative, originali e concrete. D’altro canto la curiosità nel conoscere quei dati non è un aspetto da trascurare, e trovo questo approccio vagamente “hacker” piuttosto interessante specie se, come a volte succede, ci procura informazioni in modo decisamente non convenzionale.

Cosa suggeriscono di fare gli esperti del settore?

Tra i tanti contributi alla discussione che mi è capitato di leggere (un articolo di Search Engine Watch è particolarmente illuminante, in merito), segnalo il sempre valido LowLevel che, circa un anno fa, provò a proporre un possibile “approccio di attacco” per provare ad indagare nel “buco nero” rappresentato dalle query “not provided“, evidenziando come l’analisi del parametro – all’interno delle ricerche di Google – “ved” sia probabilmente tra i più rappresentativi per la questione, in quanto consente di:

  • individuare da quale “sacco” provenga l’informazione (news, blog, video, pagina web);
  • conoscere la posizione in SERP dell’elemento e la tipologia di link.

Schermata 2013-03-05 alle 08.35.36 Schermata 2013-03-05 alle 08.35.47

The most important: cosa possiamo fare per “indovinare” le querynot provided“?

In effetti un buon modo per approcciare alla questione è quello di partire dall’analisi del nostro Webmaster Tools: proviamo quindi a paragonare la lista di query rilevate dallo strumento con quelle fornite dai risultati organici di Analytics, ad esempio ricopiandole in un file Excel ed ordinando le due colonne in modo alfabetico. Eliminando i termini duplicati, di fatto, riusciremo ad individuare in modo “euristico” (e con una buona percentuale di probabilità) almeno una parte delle query nascoste dal (not provided). In particolare i termini occultati dal not provided potrebbero coincidere, in tutto o in parte, con quelli del Webmaster Tools che non sono presenti nell’elenco di termini fornito da Google Analytics: una strategia immediata e di facile attuazione che potrebbe, quantomeno, farci intravedere la luce in fondo al tunnel. Questo potrebbe suggerire che l’incubo sia finito e che finalmente ci siamo risvegliati nel nostro letto, ma in realtà una strategia così semplice non può certo sopperire interamente (bensì solo in parte) alla mancanza sostanziale di informazioni di cui attualmente soffriamo. Tuttavia la tecnica proposta, per quanto elementare, può darvi qualche suggerimento di troppo per effettuare la cara vecchia keyword research quasi-completa senza patemi d’animo: è decisamente meglio – a mio avviso – operare in questi termini piuttosto che provare a fare reverse engineering degli algoritmi di Google, argomento tanto affascinante quanto pari al rischio di fare un clamoroso buco nell’acqua.

In conclusione nonostante il fatto che i “termini di query non siano disponibili nel rapporto“, non dimentichiamo che (almeno per il momento!) “continueremo a vedere i referral” all’interno del nostro rapporto di Analytics: in altri termini non riusciremo a visualizzare le query più richieste, ma potremo comunque visualizzare i link di provenienza e soprattutto le pagine destinazione. A questo punto, infatti, ci sono due possibilità:

  • se le nostre pagine sono contestualizzate correttamente, non dobbiamo fare altro che “indovinare” le query di ricerca più comuni analizzando title, corpo e contenuto delle pagine più visitate (che sono ancora visibili e che difficilmente non diventeranno tali nel breve periodo);
  • se diversamente le nostre pagine sono fuori focus, ovvero possiedono title e descrizioni vaghe e/o ingannevoli, effettuiamo un bel site:indirizzo.com e cerchiamo prima di tutto di effettuare una buona ottimizzazione in-site del nostro portale.

Ovviamente non ho voluto proporre alcuna cura definitiva al problema, ma in questo caso mi pare particolarmente interessante partire da queste osservazioni per sviluppare un po’ di discussione in merito: e voi, cosa ne pensate?

  • niguli

    è un problema grosso, anche perché parlando in termini numerici ormai verifico che la top kwd di accesso è proprio il gruppo (not provided), con percentuali elevatissime, superiori in alcuni casi al 35-40%. Provo a farti una domanda a cui fin’ora non ho saputo rispondere… secondo te in che percentuale ipotetica stanno le kwd no brand all’interno del gruppo Not provided?

    • ciao niguli… bhe è una bella domanda, rischio di spararla grossa ma secondo me anche la metà delle keyword rischia di essere assorbita nel not provided… cmq sui diversi siti che controllo questa etichetta, almeno finora, prende quasi sempre il 45-50%

      • si in effetti ho casi con percentuali ancora superiori! La mia curiosità in realtà era più rivolta a quale percentuale di queste not provided può essere considerata legata a kwd no brand .. secondo me, anche se dipende dal sito, sicuramente più del 50%

        • Dario

          Ciao ragazzi, provo a portare il mio piccolo apporto da “analista” 🙂 , ma non è farina del mio sacco. Io credo che qualunque piccolo aggiustamento possa servire ma il punto è questo: lavoriamo su quello che abbiamo! Da un punto di vista di misurazione, qual’è l’altro strumento di marketing che consente comunque l’analisi del 60% degli “arrivi”. Nessuno! Quindi, pur essendo importante il cercare di trovare nuove strade, è indispensabile fare i conti con la realtà.

          Ciao!

  • La tua è una pratica scorretta, poiche indirizzi gli utenti sul tuo sito, e solo dopo si legge nel tuo articolo che devi essere contattato privatamente per ottenere tale filtro (che poi si trova con facilita in giro) solo in cambio di un like alla tua fan page. Classico furbata all’italiana.

    • Scorretta mi sembra eccessivo, anche perché se hai letto tutto il mio articolo hai potuto notare che fornisco anche informazioni a corredo meno facili da trovare. Ad ogni modo rispetto la tua opinione.

      • NybeCommunication

        Ciao Francesco, abbiamo tolto il commento con il link perché ci sembra una pratica poco ortodossa.

        Inoltre, se hai un metodo è bene condividerlo liberamente in commenti di blog esterni al tuo, anche se ci pare di capire che in realtà non è un sistema che aiuta nello scoprire le query not provided.

        Grazie comunque 🙂

        • Va bene, non fa niente, il mondo continuerà a girare anche senza il mio link sul vostro blog.

          Prego, anche se a questo punto non ho capito perché mi hai ringraziato.

          • Non ti nascondo che ho qualche perplessità in merito alla segnalazione, perchè riuscire ad estrapolare le parole chiave utilizzando un filtro (che è per sua natura sottrattivo) da un qualcosa che, piaccia o meno, non c’è mi sembra ai limiti della sci-fiction.

            Se poi ti riferisci al fatto che i contenuti più visitati siano comunque visibili e filtrabili “come se fossero” chiavi, ok, siamo d’accordo, ma ad ogni modo di chiavi vere e proprie non ne vedi, anche se puoi plausibilmente dedurle attivando un po’ i neuroni, ovviamente. Lo scrivo per amore di discussione a questo punto ma tant’è.

          • Si, il filtro not provided funziona esattamente come hai scritto. Ti accorgi di quanto è utile solo quando lo usi.

          • NybeCommunication

            Per aver partecipato alla discussione.
            La cortesia è sempre una buona cosa 😉

  • grazie dei consigli, in effetti l’incrocio fra i due è l’unica. una cosa manuale da fare in più, ma fa niente…:)

Shares