Sitemap: cos’è e perché è utile per un sito

Può essere definita come una vera e propria mappa che aiuta i motori di ricerca a farsi strada all’interno del sito Web, trovando (e analizzando) più facilmente gli URL inseriti, ed è un elemento cruciale nella costruzione di un dialogo positivo tra il sito e Googlebot.

Quindi, nel concreto: che cos’è una sitemap e perché può essere utile comunicarla a Google e agli altri motori di ricerca?

Che cos’è una Sitemap

Con il termine sitemap si intende un file che contiene tutti gli URL di un sito, elencati secondo una gerarchia impostata in fase di creazione. Inizialmente, il senso della sitemap era agevolare la navigazione degli utenti, come una vera mappa del sito, ma la sua utilità si estende anche all’attività di scansione e indicizzazione da parte dei crawler dei motori di ricerca.

Più in particolare, questo file è “un segnale di quali URL del tuo sito vuoi che Google scansioni” e può fornire informazioni sugli URL appena creati o modificati.

Sitemap: cos'è e perché è utile per un sito

A che cosa serve la Sitemap

Grazie alla sitemap, un crawler dei motori di ricerca come Googlebot può eseguire una scansione più efficiente del sito perché ha a disposizione una panoramica dei contenuti disponibili, con indicazioni delle risorse presenti e sul percorso per raggiungerle.

In linea di massima, i web crawler riescono a trovare la maggior parte dei contenuti se le pagine di un sito sono collegate in modo corretto: usare una mappa è un sistema sicuro per consentire ai motori di ricerca di comprendere più velocemente e in modo preciso l’intera struttura del sito.

I formati di Sitemap

Sono essenzialmente due i formati di Sitemap più utilizzati: il primo è il file Sitemap HTML, più vecchio e usato anche per facilitare la navigazione degli utenti e dunque migliorare la user experience.

Più specifico il formato Sitemap XML, inventato da Google nel 2005 (e chiamato allora Google Sitemaps) e poi adottato anche da altri motori di ricerca: esiste un vero e proprio protocollo, regolamentato dalla Attribution-ShareAlike Creative Commons License, e questo ha reso possibile l’estensione della mappa anche agli altri motori di ricerca.

A questi due tipi bisogna aggiungere per completezza anche le tipologie speciali di sitemap, che sono correlate ai contenuti presenti e dunque specifiche per siti per immagini, per video e per notizie.

I limiti delle Sitemap

Ci sono due requisiti fondamentali da rispettare: tutti i formati di Sitemap non possono superare il limite di 50 MB e 50.000 URL. Se il proprio sito ha un file di dimensioni maggiori o contenente più URL sarà necessario suddividere l’elenco in varie Sitemap o creare un unico file Indice Sitemap (che racchiude un elenco di mappe) da sottoporre a Google.

Uso di Sitemap e indicizzazione delle pagine

È sempre Google a chiarire con precisione alcuni aspetti su questo tema: innanzitutto, “l’utilizzo del Protocollo Sitemap non garantisce l’inclusione delle pagine web nei motori di ricerca”, e quindi non c’è certezza che le pagine presenti nel file della mappa siano tutte poi effettivamente indicizzate, perché Googlebot agisce secondo i propri criteri e rispettando i propri algoritmi complessi.

Perché usare le Sitemap per Google

Dopo queste premesse, a che serve in concreto usare una Sitemap? Ovviamente, tutti i siti possono beneficiare di una scansione migliore, ma ci sono casi particolari in cui Google consiglia vivamente di usare questi file. Innanzitutto, siti molto grandi devono usare la Sitemap per comunicare le pagine nuove o aggiornate di recente ai crawler, che altrimenti potrebbero trascurare la scansione di queste risorse; ancor più utile la mappa se il sito ha molte pagine di contenuti isolate o non ben collegate, che rischiano quindi di non essere considerate da Google.

I siti che devono usare la Sitemap

La Sitemap è consigliata poi per i siti nuovi e con pochi backlink in ingresso: in questo caso, Google e il suo crawler potrebbero avere difficoltà a trovare il sito perché non si evidenziano percorsi tra i link del Web. Infine, si invita a usare la mappa se il sito “utilizza contenuti multimediali, viene visualizzato in Google News o utilizza altre annotazioni compatibili con le sitemap”, aggiungendo che se “appropriato, Google può prendere in considerazione altre informazioni contenute nelle Sitemap per utilizzarle ai fini della ricerca”.

Come creare una Sitemap

Per generare una Sitemap bisogna innanzitutto decidere quali pagine del sito si desidera indicare e sottoporre a scansione da parte di Google, stabilendo la versione canonica di ogni pagina. Il secondo passaggio è la scelta del formato Sitemap da utilizzare, per poi mettersi all’opera con editor di testo o software appositi, oppure affidarsi a un’alternativa più facile e veloce, alla portata di tutti.

Qualunque sia la scelta, è fondamentale mettere subito la Sitemap creata a disposizione di Google, aggiungendola al file robots.txt o inviandola direttamente alla Search Console.

I vantaggi della Sitemap

In definitiva, dunque, usare una Sitemap è un metodo per facilitare la vita dei crawler e per fornire una mappa dei contenuti del proprio sito a Googlebot. Pur non garantendo che gli elementi indicati siano poi effettivamente scansionati e indicizzati, si consiglia di usare sempre una Sitemap perché “nella maggior parte dei casi l’esistenza di una Sitemap costituisce comunque un vantaggio per il tuo sito e non verrai mai penalizzato per il fatto di averne una”, come dice Google.

Come realizzare una sitemap

Idealmente, il CMS che gestisce il sito può fare automaticamente dei file sitemap, usando dei plugin o delle estensioni e Google stesso suggerisce di trovare un modo di creare sitemap in modo automatico anziché manualmente.

Il Rapporto Sitemap della Search Console

Per tenere sotto controllo queste risorse possiamo usare il Rapporto Sitemap in Search Console, uno degli strumenti per webmaster più utili, che serve per inviare a Google una nuova Sitemap per la proprietà, visualizzare la cronologia di invio, visualizzare eventuali errori riscontrati durante l’analisi e rimuovere file non più rilevanti. Questa azione rimuove la sitemap solo dalla Search Console e non dalla memoria di Google: per cancellare una sitemap dobbiamo rimuoverla dal nostro sito e fornire un 404; dopo vari tentativi, Googlebot smetterà di seguire quella pagina e non aggiornerà più la sitemap.

Prima ancora di creare la sitemap di un sito web deve essere chiara la strategia da adottare.

Parlaci del tuo progetto, la sitemap verrà da sè!

 

Cerchi un partner che ti affianchi nel mondo del web?

Raccontaci il tuo progetto o scrivici per maggiori informazioni.

Telefono

Privacy policy