Partie 3. Chapitre 3. Point 1

Qu’est-ce que le duplicate content ?

Les cas de Duplicate Content dans les balises

Bien souvent, des balises sont générées en doublon suite à la création d’une nouvelle URL. Et pour cause, une page peut être accessible depuis différentes URL à la fois. Tel est le cas des pages produit des sites e-commerce. Des variantes de couleur ou de taille peuvent être à l’origine de balises dupliquées. Il en est de même pour les produits accessibles ou répertoriés dans différentes catégories à la fois, ainsi que dans les cas de réécriture d’URL.

Des URL dynamiques peuvent, par ailleurs, être générées par la fonction de tri de produit. Sur un site e-commerce, il se peut que le webmaster permet un tri des produits par ordre décroissant ou croissant, par nouveauté ou par ancienneté, par disponibilité ou par vente flash, etc. Dans tous ces cas et bien d’autres encore, les balises vont se dupliquer à l’infini. Les systèmes de pagination peuvent également être à l’origine de la duplication de contenus. Si 200 produits sont proposés, l’Internaute peut par exemple accéder à ces fiches en faisant des tris par 20, par 50 ou par 100. Si ces accès simplifient effectivement l’expérience de navigation de l’Internaute, ils multiplient au passage les balises dupliquées.

D’autres balises dupliquées proviennent, quant à elles, du tracking. Affiliation et flux RSS peuvent, en effet, influencer la création de nouvelles pages et donc de nouvelles balises. Il en est de même pour les cas d’identifiants de session, ainsi que les pages accessibles avec des paramètres optionnels précisés dans les URL. En générant des pages différentes en fonction des paramètres pris en compte, le système de gestion de site (CMS) va également dupliquer les balises.

Les conséquences des balises dupliquées

Pour ne pas freiner le référencement, la règle à retenir est d’allouer à chaque page une balise unique. Certes, les moteurs de recherche ne vont pas radicalement supprimer les contenus dupliqués comme ils le feront dans le cas de vol de contenu. Cela étant, les chances de positionnement des pages dupliquées sont minimisées. En concentrant l’effort de référencement sur l’unicité des pages et des balises avant toute autre stratégie SEO ou SMO, il devient plus facile d’améliorer la visibilité des contenus publiés.

Pour anticiper le Duplicate Content, la mise en place d’une redirection 301 est recommandée. Il est également possible d’indiquer aux moteurs de recherche la page à indexer parmi d’autres, en spécifiant une URL canonique. Ainsi, les balises dupliquées ne seront pas prises en compte lors du traitement du contenu. La mise en place de tags de type noindex et dofollow est aussi recommandée pour minimiser la dispersion des backlinks quand les balises sont dupliquées.

S’il est avantageux de diversifier les portes d’entrée vers votre site, il ne faut pas pour autant minimiser son référencement. Pour ce faire, il faut veiller à respecter la règle de base en référencement naturel, à savoir que chaque page indexée doit être unique. En veillant à l’unicité de vos contenus, vous pouvez allier l’accessibilité à la visibilité de votre site.

Vous aimerez aussi :
Le Duplicate Content externe
Le duplicate Content interne
Accessibilité de votre site par des urls distinctes
Balise canonical et duplication de contenu