Si possono scoprire le query “not provided”?

Tempo stimato di lettura: 5 minuti, 0 secondi
Pubblicato il 6 Marzo 2013

Google ha deciso da circa un anno di nascondere le query provenienti da utenti loggati con Gmail: cosa possiamo fare, dunque, per sopperire alla mancanza delle chiavi di ricerca “not provided“?

Spulciando i dati di Google Analytics nelle nostre consuete attività di ottimizzazione potrà essere comune imbattersi nelle query “not provided“: si tratta di una generica etichetta che rende anonime le ricerche, in particolare qualora esse siano effettuate dagli utenti che erano loggati in Google. Questa feature ha mandato su tutte le furie, a suo tempo, diversi blogger e SEO del settore: occultare informazioni così importanti significa rinunciare, in molte circostanze, a volte a pià della metà delle query di interesse del sito in analisi. E questo, naturalmente, crea delle difficoltà enormi per quanto riguarda la ricerca di parole chiave e l’analisi delle fette di mercato di interesse. Al di là del fatto che sia possibile lavorare ugualmente anche senza ricorrere a queste informazioni (come vedremo a breve in questo articolo), quello che vorrei provare a chiedermi, in definitiva, è di fatto legato alle seguenti due domande:

  • ha senso chiedersi quali possano essere le query di ricerche nascoste da “not provided“?
  • in caso di risposta positiva, è possibile effettuare una forma di reverse-engineering per scoprire le query nascoste?

Cosa ha detto Google in merito?

Prima di inoltrarci nell’argomento, prendiamo brevemente in considerazione le informazioni ufficiali disponibili dall’azienda del motore di ricerca stesso. La documentazione di Google, infatti, parla chiaro:

  • Quando accedi a Google.it, la ricerca organica viene condotta in un contesto sicuro. Se visiti un sito da questi risultati di ricerca, la visita è ancora classificata come organica, ma i termini di query non sono disponibili nel rapporto. L’etichetta (not provided) è utilizzata al posto dei termini di query.

Stessa sostanza che, in effetti, viene confermata anche sul blog di Google Analytics:

  • abbiamo creato il token “(not provided)” all’interno della reportistica del traffico di ricerca organico. Continuerai dunque a vedere i referral senza alcun cambiamento, ma soltanto le query per gli utenti loggati ne saranno affette.

Google ha iniziato a nascondere queste informazioni, a mio avviso, per una ragione molto semplice: ragionare troppo in termini di chiavi di ricerca (che, come sappiamo, dovranno poi apparire all’interno del testo ed essere contestualizzate, focalizzate e distribuite nel sito) porta ad una forma mentis che devia l’attenzione dal problema principale, che è annesso invece ai siti ed ai portali che forniscano un’effettiva qualità dei contenuti. In un certo senso, quindi, la risposta alla prima domanda potrebbe essere nettamente negativa: tanto varrebbe cambiare approccio, sviluppare modi creativi di lavorare e svincolarsi, se possibile, dall’analisi dei freddi numeri per fare in modo di realizzare, nel concreto, pagine web innovative, originali e concrete. D’altro canto la curiosità nel conoscere quei dati non è un aspetto da trascurare, e trovo questo approccio vagamente “hacker” piuttosto interessante specie se, come a volte succede, ci procura informazioni in modo decisamente non convenzionale.

Cosa suggeriscono di fare gli esperti del settore?

Tra i tanti contributi alla discussione che mi è capitato di leggere (un articolo di Search Engine Watch è particolarmente illuminante, in merito), segnalo il sempre valido LowLevel che, circa un anno fa, provò a proporre un possibile “approccio di attacco” per provare ad indagare nel “buco nero” rappresentato dalle query “not provided“, evidenziando come l’analisi del parametro – all’interno delle ricerche di Google – “ved” sia probabilmente tra i più rappresentativi per la questione, in quanto consente di:

  • individuare da quale “sacco” provenga l’informazione (news, blog, video, pagina web);
  • conoscere la posizione in SERP dell’elemento e la tipologia di link.

Schermata 2013-03-05 alle 08.35.36 Schermata 2013-03-05 alle 08.35.47

The most important: cosa possiamo fare per “indovinare” le querynot provided“?

In effetti un buon modo per approcciare alla questione è quello di partire dall’analisi del nostro Webmaster Tools: proviamo quindi a paragonare la lista di query rilevate dallo strumento con quelle fornite dai risultati organici di Analytics, ad esempio ricopiandole in un file Excel ed ordinando le due colonne in modo alfabetico. Eliminando i termini duplicati, di fatto, riusciremo ad individuare in modo “euristico” (e con una buona percentuale di probabilità) almeno una parte delle query nascoste dal (not provided). In particolare i termini occultati dal not provided potrebbero coincidere, in tutto o in parte, con quelli del Webmaster Tools che non sono presenti nell’elenco di termini fornito da Google Analytics: una strategia immediata e di facile attuazione che potrebbe, quantomeno, farci intravedere la luce in fondo al tunnel. Questo potrebbe suggerire che l’incubo sia finito e che finalmente ci siamo risvegliati nel nostro letto, ma in realtà una strategia così semplice non può certo sopperire interamente (bensì solo in parte) alla mancanza sostanziale di informazioni di cui attualmente soffriamo. Tuttavia la tecnica proposta, per quanto elementare, può darvi qualche suggerimento di troppo per effettuare la cara vecchia keyword research quasi-completa senza patemi d’animo: è decisamente meglio – a mio avviso – operare in questi termini piuttosto che provare a fare reverse engineering degli algoritmi di Google, argomento tanto affascinante quanto pari al rischio di fare un clamoroso buco nell’acqua.

In conclusione nonostante il fatto che i “termini di query non siano disponibili nel rapporto“, non dimentichiamo che (almeno per il momento!) “continueremo a vedere i referral” all’interno del nostro rapporto di Analytics: in altri termini non riusciremo a visualizzare le query più richieste, ma potremo comunque visualizzare i link di provenienza e soprattutto le pagine destinazione. A questo punto, infatti, ci sono due possibilità:

  • se le nostre pagine sono contestualizzate correttamente, non dobbiamo fare altro che “indovinare” le query di ricerca più comuni analizzando title, corpo e contenuto delle pagine più visitate (che sono ancora visibili e che difficilmente non diventeranno tali nel breve periodo);
  • se diversamente le nostre pagine sono fuori focus, ovvero possiedono title e descrizioni vaghe e/o ingannevoli, effettuiamo un bel site:indirizzo.com e cerchiamo prima di tutto di effettuare una buona ottimizzazione in-site del nostro portale.

Ovviamente non ho voluto proporre alcuna cura definitiva al problema, ma in questo caso mi pare particolarmente interessante partire da queste osservazioni per sviluppare un po’ di discussione in merito: e voi, cosa ne pensate?

Shares