Partie 3. Chapitre 3. Point 1

La balise link rel=canonical, communément connue comme étant la balise canonical (ou balise canonique) désigne une URL officielle parmi différentes pages copies au sein d’un même site. Détails.

 

Une balise canonique se cache dans cette image. Saurez-vous la repérer ?
Une balise canonique se cache dans cette image. Saurez-vous la repérer ?

 

L’URL canonique, la version par défaut

Prenons un exemple. En pratique, la page d’accueil d’un site peut avoir simultanément pour URL  :

  • https://www.monsite.com
  • https://monsite.com
  • https://www.monsite.com
  • https://monsite.com
  • https://www.monsite.com/index.php
  • https://www.monsite.com/fr/, etc..

Pour éviter que toutes ces URL soient prises en compte par les robots des moteurs de recherche durant la phase d’indexation, il suffit de définir une URL officielle en lui attribuant la balise link rel=canonical.

L’URL canonique définit, par conséquent, l’adresse du contenu source. En étant le contenu d’origine, la page canonicale correspond à la version par défaut d’un ensemble d’URL aux textes similaires au sein d’un même site. Le link canonical tag est également un indicateur pour les moteurs de recherche face aux agrégateurs de contenu. En pratique si des sites tiers copient une partie ou la totalité d’un contenu, les moteurs de recherche peuvent identifier l’article d’origine grâce à l’URL canonicale. Ainsi, c’est la page officielle qui sera d’office indexée sur les moteurs de recherche et non les pages dupliquées, même si celles-ci détiennent plus de notoriété ou de popularité que le site d’origine.

 

La mise en place d’une balise canonique

La mise en place d’une URL canonique est stratégique avant toute mise en ligne d’un site web ou d’une nouvelle page Internet. Et pour cause, la balise canonicale peut concerner la page d’accueil, tout comme toutes les autres pages du site. Sur un site e-commerce par exemple, il se peut que la fiche-produit A soit disponible depuis plusieurs URL de type :

  • https://www.monsite.com/produits/a.php
  • ou http:/www.example.com/produits/a.php?couleur=rouge
  • ou https://www.monsite.com/produits/a.php
  • ou  https://www.example.com/produits/a.php?couleur=rouge
  • ou encore https://www.example.com/produits/a.php?affilie=45124

Si pour le webmaster il s’agit d’un même contenu décrivant le produit A, les moteurs de recherche vont, en revanche, analyser trois pages différentes.

Pour aider Google et les autres moteurs de recherche à identifier la page à indexer, il suffit alors de placer la balise canonicale dans le code HTML, entre <head> et </head>.

Dans ce cas, l’URL canonicale prendra cette forme <link rel= »canonical » href= »URL » />. Dans notre exemple de la fiche-produit A, on aura alors <link rel= »canonical » href= »https://www.monsite.com/produits/a.php »>. Si l’idée est de baliser la page d’accueil du site en exemple, l’URL canonicale à placer dans l’en-tête HTML est  <link rel= »canonical » href= »https://www.monsite.com/ »>

L’URL canonique peut également être ajoutée depuis l’entête http.

Pour cela, il est recommandé de mettre en place une directive dans le fichier htaccess selon le format

Link: <URL>; rel= »canonical ». En pratique pour la page d’accueil par exemple, cela prendra la forme de Link: <www.monsite.com>; rel= »canonical ».

 

L’URL canonique : désigner la « page favorite »

Divers paramètres peuvent influencer la duplication d’une page en créant au passage de nouvelles URL. Pour une fiche produit par exemple, les identifiants de session, la présence de plusieurs catégories présentant le même produit, les paramètres d’affiliés ou de tracking sont autant d’éléments pris en compte par les CMS lors de la création d’URL.

Résultat : les pages générées dynamiquement se retrouvent en concurrence entre elles dans les pages de résultats de Google. Si cela multiplie les portes d’entrée, le référencement peut en pâtir.

Dans un souci de pertinence, les moteurs de recherche vont exclure de leur indexation les pages en double. Des pénalités SEO sont, en effet, envisageables pour les contenus dupliqués étant donné que les robots vont perdre leur temps à crawler les doublons et oublier les pages nouvelles ou qui ont de réelles valeurs ajoutées. Pour y faire face, la mise en place d’une URL canonique est primordiale. Etant l’URL officielle de la page, la balise canonique permet aux moteurs de recherche d’indexer une seule page sans crainte de Duplicate Content.

Les avantages SEO de la balise canonicale se traduisent également par une augmentation de popularité et de notoriété. Il est avantageux de recevoir plus de backlinks sur une même page que de les voir se disperser vers des pages identiques. En concentrant les backlinks sur une URL unique, à savoir l’URL canonicale, le référencement est optimisé pour une meilleure visibilité.

L’URL canonique est un filtre pour les moteurs de recherche. En intégrant cette balise dans le code HTML de la page officielle, Google va inclure dans son indexation la bonne page au lieu de se focaliser sur des pages tronquées. Ainsi, seule l’URL canonicale va remonter dans les pages de résultats. Les autres accès aux contenus similaires vont, quant à eux, rediriger l’Internaute vers cette page déjà optimisée correctement. La mise en place d’une URL canonique améliore ainsi au passage la navigation et l’expérience utilisateur.

 

Les erreurs associées à la mise en place d’une balise canonicale

S’il est essentiel de mettre en place une balise « link rel=canonical », des erreurs sont toutefois à éviter, dont la plus fréquente est celle de l’insérer dans le body au lieu de l’en-tête du code HTML. Pour tirer profit de ses avantages, il faut préciser notamment la page canonicale et éviter toute confusion avec les pages dupliquées souvent générées automatiquement. Dans le cas d’une réécriture d’URL notamment, il est préférable de privilégier les URL d’accès absolus, plutôt que les chemins relatifs.

Par peur de ne pas être indexés sur les moteurs de recherche, certains propriétaires de site spécifient différentes URL canoniques pour une seule et même page. Ils s’attendent ainsi à une augmentation de leurs chances de visibilité. Et pourtant, une telle pratique ne fera que créer une confusion pour les robots. Pour assurer son rôle, une balise canonicale ne peut concerner qu’une seule page à la fois.