gestione pagine duplicate canonical
  • Settembre 26, 2021
  • Gennaro Napoletano
  • 0

In questo articolo introduciamo un termine un po’ difficile, “canonicalizzare” , che di fatto vuol dire stabilire quali sono i contenuti o pagine principali del tuo sito, quelle che il motore di ricerca deve scansionare.

Ti sembra un concetto troppo difficile da comprendere? Niente paura, noi di Unidevs siamo qui per darti tutte le informazioni del caso! Allora cominciamo subito!

Come senza dubbio già sai, ogni pagina Web può essere raggiunta nella rete attraverso l’utilizzo di un URL. Tuttavia, può anche accadere che un sito contenga una o più pagine con contenuti simili e che quindi queste appaiano come versioni duplicate della stessa pagina. 

In simili circostanze, il motore di ricerca individua un unico URL come versione “canonica”, eseguendone la scansione, considerando invece tutti gli altri Url come “duplicati” e non sottoponendoli, quindi, a scansione. 

Ma chi provvede a scegliere qual è l’URL canonico?

Ora, diciamo brevemente che le cose stanno così: per cercare di indicizzare al meglio le pagine, evitando quindi di perdere tempo con quelle non necessarie, Google ha attivato diverse procedure “filtro”, che provvedono ad individuare ed eliminare, appunto, le pagine duplicate.  

Se non viene, quindi, prescelto dal programmatore un URL canonico per le pagine duplicate, Google provvederà a sceglierlo autonomamente, dal momento che il suo compito è proprio quello di mettere in evidenza i risultati più importanti come risposta a una specifica ricerca o “query” da parte degli utenti. 

Questo, però, non sempre è sufficiente a gestire i contenuti duplicati. Ecco perché, per chiunque abbia un sito internet, non può far a meno di ricorrere ai  “Meta tag Canonical”, i quali consentono di individuare e gestire  i contenuti doppione o duplicati, in modo che il motore di ricerca possa “canonizzarli” verso la pagina che intende posizionare.

Ora che siamo entrati un po’ di più nell’argomento andiamo a vedere subito tutti gli aspetti principali di questa pratica.

Che cos’è un url canonico

Per Url canonico si intende l’indirizzo di una pagina che Google individua come la più rappresentativa all’interno di un insieme di pagine duplicate presenti in un sito. 

La sua importanza si evidenzia soprattutto alla luce del fatto che, molto frequentemente, anche se la regola base è quella di creare i testi di ogni pagina del tuo sito in maniera univoca, talvolta accade che, per effetto di alcune piccole modifiche ai “filtri” delle pagine, lo stesso contenuto testuale presente in una pagina risulti accessibile da più indirizzi differenti (ad esempio, nel caso di un sito e-commerce, una scheda prodotto accessibile con diverse Url associate ai vari “filtri” di ricerca).

In questo caso, i problemi di contenuti duplicati sono una diretta conseguenza si un’errata canonicalizzazione all’interno del sito stesso sito, ossia il programmatore non ha provveduto a dire a Google quale sia l’URL preferita, “canonica” appunto, cioè quella che vogliamo che sia indicizzata.

Codice  per Identificare pagina canonica:

<link rel=”canonical” href=”https://sito.com/categoria/prodotto” />

 Il motore di ricerca, quando si trova in questa situazione, non può comprendere in maniera autonoma quale sia la pagina principale, perciò produce una indicizzazione errata di più URL che, rimandando alla stessa pagina che presenta lo stesso contenuto, crea problemi di duplicazione. 

Quando invece la gestione della canonicalizzazione avviene invece in maniera corretta, Google è messo in condizione di indicizzare una sola URL per ogni pagina, non creando così problemi di penalizzazione per effetto dei famigerati “contenuti duplicati”.  

Come raggruppare le pagine duplicate tramite il tag Canonical

Ci sono diverse procedure grazie alle quali è possibile raggruppare le pagine duplicate tramite il tag Canonical e che, quindi, è bene conoscere perché, come abbiamo detto alla fine del precedente paragrafo, se non vengono utilizzate, Google provvede a scegliere lui stesso l’URL che considera la versione canonica, eseguendone la scansione, designando invece tutti gli altri URL come duplicati.

Andiamo perciò subito a vedere quali sono quelle principali.

Tag link rel=”canonical”

Per indicare a Google che una pagina (ad esempio una scheda prodotto con una Url contenente un filtro) è un duplicato di un’altra, è possibile utilizzare il tag <link> nella sezione head del codice HTML.

Ecco un esempio per farti comprendere meglio: immagina di voler designare:

https://tuosito.com/prodotto/prodotto-categoria

come URL canonico, ma che lo stesso contenuto sia accessibile anche da altri Url. 

Bene, puoi designare questo Url come canonico contrassegnando tutte le pagine duplicate con un elemento link rel=”canonical” e indirizzandole alla pagina canonica. 

Ovviamente, possono esserci alcune difficoltà, ad esempio nel caso le versioni duplicate siano associate a dispositivi mobili, in tal caso quindi dovrai aggiungere anche il link rel=”alternate”, indirizzando alla versione per dispositivi mobili della pagina:

Intestazione HTTP rel=”canonical”

In alternativa alla procedura che abbiamo appena descritto, se hai la possibilità di configurare il tuo server, per designare l’URL canonico puoi anche utilizzare l’intestazione HTTP rel=”canonical” al posto del tag HTML.

Questa modalità funziona ad esempio per i documenti non HTML come ad esempio file PDF che vengono restituiti a seguito di risultati di ricerca.

Invio di una Sitemap

Un’altra modalità per indicare correttamente a Google qual è l’URL canonico per ognuna delle tue pagine consiste nell’inviare al motore di ricerca una Sitemap. 

All’interno della Sitemap, infatti, sono elencate solo le pagine  canoniche, ma sarà comunque sempre il robot di Google a decidere quali siano i contenuti duplicati, laddove presenti. 

Ciò nonostante, anche se la generazione di una Sitemap non dà garanzie contro i contenuti duplicati, questo è comunque un metodo semplice e tutto sommato accettabile per definire Url canonici nel caso di siti molto estesi.

Reindirizzamenti 301 per URL ritirati

Infine, se il tuo sito presenta il problema di Url duplicati obsoleti, ossia URL che presto hai intenzione di abbandonare ma non puoi farlo se non in maniera graduale, puoi ricorrere ai reindirizzamenti 301.

Cosa significa? Supponiamo che sia possibile accedere alla home del tuo sito con diverse URL:

  • https://tuosito.com/home
  • https://home.tuosito.com
  • https://www.tuosito.com.

Ecco in tal caso, puoi scegliere uno di questi URL come canonico e utilizzare i reindirizzamenti 301 per inviare il traffico che arriva sugli altri Url obsoleti all’Url preferito. 

Questa procedura è, in assoluto, quella migliore per far sì che anche gli utenti, oltre al motore di ricerca, arrivino sempre sulle pagina corretta. 

Dato che si tratta di un intervento che riguarda il server, se utilizzi un servizio di web hosting con inclusa l’assistenza come quello, ad esempio, che offriamo noi, sarai senza dubbio supportato in tutta la procedura da programmatori qualificati ed esperti.

Come Googlebot identifica le pagine duplicate

Andiamo ora a vedere come il robot di Google, o Googlebot, identifica le pagine duplicate. Questo ti aiuta senza dubbio a comprendere meglio l’utilità e l’importanza delle procedure sopra descritte.

Googlebot è il sistema che provvede all’indicizzazione dei siti, determinando quali siano i contenuti principali di ogni pagina processata. 

In genere, se il sistema individua pagine che si presentano sostanzialmente uguali, provvede a scegliere autonomamente la pagina che valuta come la più completa e utile, contrassegnandola come pagina canonica. 

Una volta individuata, la pagina canonica viene scansionata con una frequenza stabile rispetto alle altre pagine duplicate, anche per ridurre il carico di scansioni Google sul sito ed ottimizzare il crawl budget

La scelta della pagina canonica da parte di Googlebot può dipendere dal fatto che questa venga pubblicata su HTTP o HTTPS, ma anche dalla qualità della pagina stessa, dalla presenza di un Url inserito nella Sitemap o da eventuali etichettature rel=canonical. 

Le pagine duplicate vengono individuate in mancanza di questi elementi, ma anche dalla semplice presenza di versioni che rechino delle traduzioni anche parziali dei contenuti.

Esempi di pagine simili o duplicate

Esistono diversi elementi che portano alla creazione di pagine duplicate, che, in molti casi, hanno tutti i motivi per esistere all’interno di un sito e non possono quindi essere rimosse in quanto dannose. Te ne rimettiamo qui alcuni esempio per capire meglio:

  • Schede prodotto di un negozio online visualizzati con URL distinti a causa dei vari filtri di ricerca; 
  • Pagine in versione responsive per siti mobile;
  • Versioni di pagine web disponibili per la stampa;
  • Infine versioni della stessa pagina che sono tradotte in lingue differenti.

Ora, dato che queste tipologie di contenuti duplicati non sono dannose per un sito, ma spesso sono addirittura necessarie, è  evidente il bisogno di ricorrere alle modalità di cui ti abbiamo parlato in questo articolo che sono riconducibili appunto al processo di “canonicalizzazione”, parola ostica è vero ma, alla luce di quello che hai letto fino a qui, non così inarrivabile come può sembrare (almeno fino a che ci sono programmatori esperti come quelli che sono nella nostra squadra che saranno sempre pronti a supportarti).

Perché il programmatore deve scegliere la pagina canonica

L’intervento del programmatore, o meglio del consulente SEO, è di importanza strategica perché, grazie al suo intervento, è possibile indirizzare Google nella scelta delle pagine canoniche. 

Come abbiamo visto, esistono procedure in grado di indicare quali siano le pagine più adatte da mettere in evidenza in base agli obiettivi e alle necessità del sito e di chi lo gestisce. 

Le tecniche di programmazione che consentono di canonicizzare le pagine, infatti, consentono di scegliere la priorità della pagina – evitando che questa venga penalizzata dalle scelte automatiche di Googlebot – e, allo stesso tempo, di garantire che gli utenti del motore di ricerca giungano effettivamente sulla pagina giusta in seguito a una ricerca. 

Per questo motivo, è sempre meglio operare in ottica SEO, impostando un Url canonico.

Rel canonical oppure redirect 301?

In ambito SEO esistono in pratica due scuole di pensiero, che propendono per l’impiego del Rel-canonical o del Redirect 301. Vediamo di cosa si tratta. 

Il Rel canonical è una procedura che porta a semplificare l’attività dei crawler, che presiedono alla lettura dell’impostazione e della scansione degli Url, consentendo ai visitatori del sito di accedere a tutte le pagine, anche quelle con Url non canonico. 

Ecco di fatto come funziona: il Redirect 301 delle pagine duplicate verso un Url preferito provvede a trasmettere link equality alla pagina designata. Questo sistema offre un vantaggio da una parte, ma elimina le pagine duplicate, visto che l’utente viene reindirizzato automaticamente alla risorsa designata.

Conclusioni

Come avrai perfettamente compreso i Meta tag canonical hanno un’importanza davvero strategica nella perfetta indicizzazione del tuo sito, quindi per far che sì che siano inseriti al meglio dovrai affidarti a dei programmatori ed esperti SEO che sappiano gestire perfettamente i contenuti duplicati al fine di evitare penalizzazioni.

A tal proposito, ti ricordiamo che Unidevs dispone all’interno della sua squadra un servizio di consulenza SEO realizzato da consulenti esperti e perfettamente formati che sapranno indirizzarti verso le migliori strategie di SEO On page e SEO Off page necessarie a ottimizzare al meglio il sito. 

Gennaro Napoletano

Sono Gennaro Napoletano un Consulente SEO per Imprenditori e Professionisti.
Nel 2012 mi sono Laureato in Informatica all’università degli studi di Salerno.
Il 23 Settembre del 2017, dopo aver seguito un corso SEO professionale della durata di circa sei mesi ed aver superato l’esame, ho conseguito la qualifica di: SEO Senior

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *