Google Leak? Cosa è successo

In:
Indice del contenuto

Add a header to begin generating the table of contents

Cosa Svela il Google Leak?

Google Leak? Prima di tutto, se ti stai chiedendo se queste informazioni siano vere, ecco qua: Google ha confermato l’autenticità dei documenti a The Verge, dichiarando, “Invitiamo a non fare supposizioni inaccurate sulla Ricerca basate su informazioni fuori contesto, obsolete o incomplete. Abbiamo condiviso ampie informazioni su come funziona la Ricerca e sui tipi di fattori che i nostri sistemi considerano, lavorando anche per proteggere l’integrità dei nostri risultati dalle manipolazioni.”

Nelle ultime settimane, il mondo SEO è stato sconvolto da una fuga di notizie senza precedenti da Google. Questo leak, contenente oltre 2.500 pagine di documenti tecnici trapelati da Gogole, ha rivelato dettagli intricati su come Google classifica i contenuti, gestisce i dati degli utenti e utilizza vari segnali per determinare il ranking delle pagine web. Rand Fishkin e Michael King, due noti esperti SEO, sono stati i primi a rendere pubbliche queste informazioni, portando alla luce segreti che potrebbero rivoluzionare il panorama della SEO.

GOOGLELEAK

La parte curiosa della pubblicazione accidentale su GoogleAPI GitHub è che, nonostante si tratti di documenti interni e sensibili, Google li ha rilasciati tecnicamente sotto una licenza Apache 2.0. Questo implica che chiunque trovi questi documenti ha ottenuto una “licenza di copyright perpetua, mondiale, non esclusiva, gratuita, senza royalty e irrevocabile,” rendendoli quindi liberamente disponibili online, come mostrato qui API di Google Content Warehouse

La Complessità del Ranking di Google

Uno degli aspetti più sorprendenti emersi da questa fuga di notizie è la complessità del sistema di ranking di Google. Non si tratta di un singolo algoritmo, ma di un sistema centrale chiamato Super Root.

Il “Super Root” è un sistema centrale nel motore di ricerca di Google che coordina i vari microservizi coinvolti nella generazione delle SERP (Search Engine Results Pages). Funziona come un “cervelldo” che interagisce con diversi servizi di Google, come le mappe e YouTube, per assemblare i risultati di ricerca ogni volta che viene inserita una query. Super Root invia le query ai vari componenti, riunendo i risultati finali che vengono poi mostrati all’utente. Questo sistema consente a Google di gestire in modo efficiente la complessità del suo motore di ricerca, assicurando che ogni componente lavori in sinergia per fornire i risultati più pertinenti e accurati.

Questo sistema funge da cervello di Google Search, interagendo con vari servizi come le mappe e YouTube per generare i risultati di ricerca.

Inoltre, Google utilizza funzioni di reranking chiamate Twiddlers, che operano dopo l’algoritmo di ricerca primario.

I “Twiddlers” di Google sono funzioni di ri-classificazione che operano dopo l’algoritmo di ricerca primario, noto come Ascorer, il sistema di base che analizza i documenti e fornisce un punteggio di ranking iniziale.

Questi Twiddlers agiscono sui risultati già classificati, modificando il punteggio di recupero delle informazioni di un documento o cambiando il ranking di un documento stesso. Essenzialmente, i Twiddlers funzionano in modo simile a filtri e azioni in un sistema come WordPress, dove ciò che viene visualizzato viene regolato proprio prima di essere presentato all’utente.

I Twiddlers possono offrire vincoli di categoria, promuovendo la diversità limitando specificamente il tipo di risultati. Ad esempio, un Twiddler potrebbe essere configurato per consentire solo tre post di blog in una determinata SERP, chiarendo quando il ranking è una causa persa basata sul formato della pagina. Questi Twiddlers, come NavBoost, QualityBoost, RealTimeBoost e WebImageBoost, giocano un ruolo cruciale nell’ottimizzazione finale dei risultati di ricerca.

NavBoost

NavBoost è un fattore di ranking di Google che si concentra sui clic degli utenti nei risultati di ricerca (SERP). Questo sistema utilizza vari segnali, tra cui i clic degli utenti, per determinare i risultati più rilevanti. NavBoost memorizza i clic passati per le query fino a 13 mesi e segrega i risultati in base a caratteristiche come la localizzazione e il tipo di dispositivo (mobile o desktop). Questo sistema è anche conosciuto come “Glue”, che include tutte le altre interazioni ricche su una pagina dei risultati di ricerca, come scroll, hover e mouseover. In sostanza, NavBoost enfatizza l’importanza della chiara navigazione del sito e di un’interfaccia utente amichevole per migliorare il ranking nei risultati di ricerca per le query di navigazione​.

QualityBoost

QualityBoost è una funzione di reranking che migliora il ranking delle pagine web basandosi sulla qualità dei contenuti. Questo sistema analizza vari indicatori di qualità, come la pertinenza, l’originalità e l’utilità dei contenuti, per determinare il punteggio finale di una pagina nei risultati di ricerca. QualityBoost premia i contenuti di alta qualità che soddisfano le esigenze e le aspettative degli utenti, contribuendo a migliorare la visibilità del sito nei risultati di ricerca​

RealTimeBoost

RealTimeBoost è un sistema di Google che adatta il ranking delle pagine web in tempo reale. Questo sistema considera le interazioni recenti degli utenti e altri segnali di comportamento per aggiornare costantemente il posizionamento delle pagine nei risultati di ricerca. RealTimeBoost consente a Google di reagire rapidamente ai cambiamenti nelle preferenze degli utenti e nelle tendenze di ricerca, assicurando che i risultati più pertinenti e attuali siano sempre mostrati agli utenti​.

L’Importanza dei Clic e dei Dati di Chrome

I documenti trapelati hanno confermato che Google utilizza i dati dei clic degli utenti per determinare il ranking delle pagine web. Sistemi come NavBoost e Glue filtrano i clic rilevanti, escludendo quelli che non lo sono, e misurano la durata dei clic come indicatore di soddisfazione dell’utente. Questo conferma che Google utilizza le informazioni del search journey per affinare il ranking delle pagine, premiando quelle che offrono una migliore esperienza utente.

Un altro aspetto cruciale è l’uso dei dati di clickstream raccolti tramite il browser Chrome. Google utilizza questi dati per calcolare metriche che influenzano il ranking delle pagine, come il numero di clic su pagine specifiche e la durata dei clic. Questo approccio permette a Google di avere una visione dettagliata del comportamento degli utenti su Internet e di utilizzare queste informazioni per migliorare la pertinenza dei risultati di ricerca.

L’Autorità del Sito e la Gestione dei Link

Il concetto di Site Authority è emerso come uno degli elementi più importanti per il ranking. Questo termine si riferisce all’autorità complessiva di un sito web, influenzata dalla qualità dei contenuti, dai link in entrata e dall’engagement degli utenti. Un sito con alta autorità ha maggiori probabilità di posizionarsi bene nei risultati di ricerca rispetto a un sito con bassa autorità.

Site Authority è un termine utilizzato nel campo della SEO per descrivere la forza complessiva e la capacità di ranking di un sito web. Questa autorità è determinata da una combinazione di fattori che influenzano il posizionamento di un sito nei risultati dei motori di ricerca. Alcuni dei fattori che contribuiscono alla Site Authority includono:

  • Qualità e Quantità dei Link in Entrata: I link provenienti da siti autorevoli e rilevanti aumentano l’autorità del sito ricevente. Link di alta qualità, in particolare, sono visti come voti di fiducia che migliorano la credibilità del sito.
  • Contenuti di Qualità: Contenuti pertinenti, originali e di alta qualità aumentano l’autorevolezza del sito. Google premia i contenuti che rispondono in modo efficace alle query degli utenti.
  • Engagement degli Utenti: Metriche come il tempo di permanenza sulla pagina, il tasso di rimbalzo e le interazioni complessive degli utenti con il sito sono indicatori di una buona esperienza utente, contribuendo così all’autorità del sito.
  • Età del Dominio: I domini più vecchi tendono ad avere un’autorità maggiore poiché hanno avuto più tempo per accumulare contenuti e link di qualità.

La Site Authority è considerata uno dei segnali principali che Google utilizza per determinare il posizionamento nei risultati di ricerca. È importante notare che migliorare l’autorità di un sito è un processo graduale che richiede tempo e impegno costante nella produzione di contenuti di qualità e nella costruzione di relazioni con altri siti autorevoli.

Noi SEO lo abbiamo sempre saputo che Google utilizza certe metriche per far salire i siti in SERP, ecco perché io ho sempre proposto ai miei clienti di fare link building di un certo livello. I link sono un ottimo modo per acquisire autorevolezza, ma la link building è un’arte che pochi conoscono davvero.

Chi, come me, ha lavorato con i link per più di 10 anni, può permettersi di fare un certo tipo di lavoro; altri neanche immaginano cosa siano i link e perché possano esserci link tossici o malevoli. Non tutti i link sono buoni, e non è la quantità a determinare il posizionamento di una pagina.

Whitelist per Settori e Archiviazione delle Versioni delle Pagine

I documenti rivelano l’esistenza di whitelist per settori specifici come viaggi, COVID-19 e politica, per garantire che solo domini affidabili appaiano per query potenzialmente problematiche o controverse. Inoltre, Google conserva copie di ogni versione di ogni pagina web indicizzata, creando una sorta di archivio storico digitale. Questa pratica consente a Google di monitorare l’evoluzione dei contenuti di una pagina e di valutare come le modifiche influenzano la qualità e la pertinenza della stessa.

Feedback dei Quality Raters e Ruolo delle Entità

Un altro elemento interessante è l’uso dei feedback dei Quality Raters, raccolti tramite la piattaforma EWOK. Questi feedback potrebbero influenzare direttamente il ranking delle pagine, anche se non è chiaro quanto siano influenti questi segnali. Inoltre, Google memorizza informazioni sugli autori associati ai contenuti e cerca di determinare se un’entità è l’autore di un documento, sottolineando l’importanza dell’autorevolezza e della credibilità degli autori.

Implicazioni per la SEO

Questa fuga di notizie ha il potenziale di rivoluzionare il modo in cui comprendiamo e approcciamo l’ottimizzazione per i motori di ricerca. Conferma alcune pratiche sospettate da tempo, come l’importanza dei link e dei contenuti di qualità, ma rivela anche nuove informazioni, come l’uso dei dati di Chrome per il ranking. I professionisti della SEO devono continuare a concentrarsi sulla produzione di contenuti di alta qualità e sull’ottimizzazione dell’esperienza utente, investendo anche nella costruzione di una forte autorità del sito.

Conclusione

In definitiva, il Google Leak ha fornito una visione senza precedenti della complessità e della sofisticazione degli algoritmi di Google. Mentre alcune delle informazioni confermano pratiche SEO già note, altre offrono nuovi spunti per ottimizzare i siti web in modo più efficace. Continuare a seguire le best practice SEO rimane essenziale per mantenere e migliorare il posizionamento nei risultati di ricerca di Google.

Fonti utilizzate per scrivere questo articolo:

Yoast – Per approfondimenti su come i leak influenzano le migliori pratiche SEO: Yoast – Insights and Implications of the Google Leak

Rankmeamadeus – Per la definizione e il funzionamento dei Twiddlers e del sistema Ascorer: Rankmeamadeus – Understanding Google’s Ascorer and Twiddlers in Search Ranking

iPullRank – Per dettagli sulle funzioni di NavBoost, QualityBoost e RealTimeBoost: iPullRank – Secrets from the Google Algorithm Leak

Ahrefs – Per una panoramica generale dell’autorità del sito e dei suoi fattori: Ahrefs – SEO Glossary

Search Engine Journal – Per approfondimenti sull’autorità topica e l’importanza dei contenuti di qualità: Search Engine Journal – What Is Topical Authority & How Does It Work

Torna in alto