Questo articolo ha come scopo quello di illustrare le principali dinamiche che sono alla base di un motore di ricerca, è importante ricordare che l’algoritmo di Google è segreto e non si conoscono alla lettera gli innumerevoli fattori che determinano il posizionamento di un sito Web ma solo le buone norme da applicare per facilitarne l'indicizzazione. Pertanto si consiglia di diffidare da chi garantisce un preciso posizionamento sui risultati di ricerca soprattutto in breve tempo, questo può avvenire solamente attraverso il lavoro di professionisti che applicano le guidelines SEO con lavoro costante e mirato, basandosi su esperienze e case studies reali. Per maggiori informazioni si consiglia di leggere la guida per webmaster ufficiale di Google.

Vi siete mai chiesti come è possibile trovare una precisa pagina web contenente l'informazione che stavate cercando tra milioni di risultati in pochi secondi?

Per generare i risultati nella SERP (Search Engine Results Page), la pagina dei risultati del motore di ricerca, Google esegue tre passaggi principali: 
Scansione, Indicizzazione e Ranking.

SCANSIONE

Prima di mostrare un risultato sulla relativa pagina di ricerca, qualsiasi motore di ricerca deve conoscere quali pagine esistono nella Rete per poterle raggiungere, analizzarle e poi catalogarle.

É importante sapere che quando viene pubblicato un nuovo sito Internet questo non viene automaticamente “registrato” dalla Rete, infatti non esiste “un’anagrafe centrale di tutte le pagine web”, ma deve essere prima di tutto scoperto dai motori di ricerca.

Per farlo i motori di ricerca come Google scandagliano il Web costantemente, alla ricerca di nuove pagine per poterle inserirle all’interno del proprio elenco di pagine conosciute. Questa operazione è chiamata scansione e avviene attraverso un programma che, tramite un processo algoritmico, determina in quali siti eseguire la scansione, con quanta frequenza e quali pagine inserire nel proprio registro.

alt_text

Questi software utilizzati per la scansione sono noti come crawler, bot, robot, o spider. Quello di Google si chiama Googlebot ma ne esistono altri proprietari per ciascuni motore di ricerca come Bingbot (Bing), DuckDuckBot (DuckDuckDuckGo), Yahoo Slurp (Yahoo), ecc…

Come fa Google a conoscere un nuovo sito?

Il processo di scansione generalmente ha inizio da un elenco di URL di pagine web già note grazie a precedenti processi di scansione. Per scansionare la Rete il bot di Google quindi segue un link da una pagina che già conosce ad una pagina nuova.

Ma come fa a trovare un sito appena messo Online che non ha nemmeno un link in ingresso?

Un modo efficace per far conoscere a Google un nuovo dominio è quello di inviargli una Sitemap, ossia una mappa del proprio sito web, dove sono presenti tutte le pagine presenti nel dominio. Questa operazione viene generalmente effettuata dagli sviluppatori o gestori di un sito web aggiungendola al file robots.txt o inviandola direttamente tramite Google Search Console.

Proprio perché Google visita un sito attraverso un altro link è molto importante linkare un nuovo dominio da una pagina già scandagliata in modo da agevolare Google & Co nelle operazioni di scansione. Questa operazione viene chiamata link building e se guardi il nostro portfolio, scoprirai che per ogni sito che realizziamo inseriamo un link, in questo modo favoriamo la naturale indicizzazione dei nuovi domini.

In passato Google premiava molto il numero di link in ingresso che un sito web possedeva e si è pertanto erroneamente abusato del concetto di link building: venivano infatti inseriti all'interno del codice HTML numerosi link ad altri siti web poco pertinenti, nascondendoli spesso dalla vista degli utenti. Questa abitudini fortunatamente sono andate in disuso in quanto Google ora non valuta più solamente il numero dei link, ma tiene conto della loro provenienza e della loro qualità.

I link provenienti da siti web affidabili continuano ad essere un indicatore di valore per Google, mentre quelli costruiti ad hoc per permettere un miglior posizionamento sono spesso considerati negativamente, e possono portare a una penalizzazione. Per approfondire l'argomento ti consiglio questo articolo di Paddy Moogan su MOZ, dedicato al link building - [in Inglese].

INDICIZZAZIONE

Dopo aver scoperto una nuova pagina, Google cerca di capire di cosa si tratta, analizzandone il codice e il contenuto. Tutte queste informazioni vengono archiviate nell'indice di Google, un enorme database composto da migliaia di computer dove sostanzialmente è presente tutta la Rete e da cui attinge per mostrare rapidamente i risultati di ricerca.

In questa fase inoltre Google stabilisce se una pagina è un duplicato o la versione canonica di un'altra pagina. Se la pagina viene considerata un duplicato, viene sottoposta a scansione con frequenza notevolmente minore rispetto a quella originale. Tieni presente che Google non esegue la scansione di pagine con un'istruzione noindex (intestazione o tag). Tuttavia, deve essere in grado di vedere l'istruzione; se la pagina è bloccata da un file robots.txt, da una pagina di accesso o da un altro dispositivo, è possibile che la pagina venga indicizzata anche se Google non l'ha visitata.

RANKING

Quando cerchiamo un’informazione ossia inseriamo una Query all’interno della barra di ricerca, Google cerca delle pagine pertinenti all’interno del suo indice e ci restituisce i risultati da lui ritenuti più pertinenti.

Qui è importante fare un’osservazione riguardo al termine “pertinente”.

Per Google (e per tutti i motori di ricerca!) un risultato è pertinente in base alla valutazione che gli affida basandosi su centinaia di fattori che spaziano dalla corrispondenza di parole chiave presenti nella pagina alla velocità di risposta di un sito web.

L’algoritmo di Google utilizza oltre 200 fattori per stabilire se una pagina è pertinente ad una determinata ricerca.

L'algoritmo è segreto ed è in continuo aggiornamento e proprio per questo motivo è impossibile garantire un posizionamento certo ma è molto probabile apparire per determinate ricerche se vengono eseguiti con precisione determinati accorgimenti, tra cui la creazione di contenuti originali e interessanti.