Une balise pour les URL canonique

Création d’une nouvelle balise HTML

Les trois principaux moteurs de recherche se sont mis d’accord pour la création d’une nouvelle balise HTML, permettant d’indiquer quelle est l’URL canonique à prendre en compte pour une page. Est-ce la solution finale pour résoudre les problèmes de duplication de contenu ?

On pourra se rapporter aux articles Specify your canonical (Google), Fighting duplication (Yahoo) ou Partnering to help solve duplicate content issues (Live Search). Le protocole consite à insérer sur la page une balise du type <link rel= »canonical » href= »URL » />, afin d’indiquer aux moteurs quelle est la bonne adresse de la page à indexer.

Par exemple la page http://www.example.com/page.html?sid=asdf314159265, renfermant un identifiant de session, peut renfermer la balise suivante à l’intérieur du Head :
<link rel= »canonical » href= »http://www.example.com/page.html »/>

Il est important de noter que cette écriture est une suggestion vis à vis des moteurs de recherche, et que ceux-ci ne sont pas obligés d’en tenir compte.

La balise canonique peut concerner des pages dont le contenu diffère légèrement par rapport au contenu de l’URL canonique (par exemple ordre de présentation des produits), cela ne posera pas de problèmes aux moteurs de recherche. L’URL canonique peut très bien être redirigée vers une autre page, ou même pointer vers une erreur 404, cela n’affectera pas le traitement habituel des moteurs. En tout état de cause, si l’URL canonique ne pointe vers rien, les moteurs continueront à indexer les URL des pages dupliquées.

Globalement ce système est prévu pour les boutiques en ligne et autres sites générés par des CMS, qui créent un grand nombre d’URL avec des variables et entrainent potentiellement la création de pages en duplication (par exemple en inversant l’ordre des variables dans les URL).

Ce système fonctionnera entre un domaine un sous-domaine (par exemple www.monsite.fr et sousdomaine.monsite.fr) ainsi qu’entre des protocoles HTTP et HTTPS (par exemple http://wwww.monsite.fr et https/www.monsite.fr )

Par contre il est trés clairement dit que ce système ne fonctionnera pas pour des noms de domaines différents. Si votre site fait de la duplication de contenu avec les domaines monsite.fr et monsite.com, ou monsite.fr et monsiteamoi.fr, cela ne marchera pas.

Dans un article intitulé Learn about the canonical link element in 5 mn, Matt Cutts indique en outre que si des abus d’utilisation sont détectés par les moteurs, des mesures adaptées seront prises (imaginons par exemple qu’un webmaster peu scrupuleux utilise une URL bourrée de mots clés, et utilise ensuite une balise canonique pour pointer vers une URL « propre » à présenter dans les moteurs de recherche…)

Il s’agit d’un test destiné à donner un petit coup de pouce à l’indexation des URL et pas forcément de la solution définitive pour lutter contre la duplication de contenu sur le web.
N’oublions pas aussi qu’il vaut mieux penser dés le départ la structure de ses URL ou mettre en oeuvre une bonne redirection 301 plutôt que d’utiliser ce genre de bricolage, dont les effets ne sont pas garantis…

Ce contenu a été publié dans Général. Vous pouvez le mettre en favoris avec ce permalien.

Découvrez comment vos positions et celles de vos concurrents évoluent dans le temps avec notre outil SEO exclusif www.gookombat.com !
Formez-vous et approfondissez vos compétences avec nos experts métier, découvrez nos formations !