Partie 3. Chapitre 3. Point 2

Index principal et secondaire de Google

Index principal et index secondaire de GoogleLe système d’indexation, vu par Google

L’indexation d’un contenu web regroupe trois actions spécifiques de la part des robots (ou spiders) des moteurs de recherche, à savoir : la visite, le « crawl » et l’indexation proprement dite. Sur Google, ces robots vont visiter le site, parcourir ses pages en copiant leur contenu, stocker les données recueillies sur ses serveurs et afficher celles-ci dans les pages de résultat en fonction des requêtes.

L’ensemble de ces pages répertoriées dans les résultats de recherche Google sur la base de mots-clés est regroupé dans l’index principal dudit moteur de recherche. En répertoriant les pages d’un site dans ses résultats au moment de la requête, Google dévoile, ainsi, le contenu de son index primaire.

 

 

La pertinence, gage de l’indexation principale

La notion d’index principal ou primaire est associée à Google et non pas à tous les moteurs de recherche. En choisissant d’afficher tous les résultats, Bing ne relaie pas, en effet, des contenus dans un index secondaire. C’est d’ailleurs une des raisons pour laquelle les résultats ne sont pas répertoriés de la même manière sur ces deux principaux moteurs de recherche pour une même requête.

Pour se positionner sur l’index principal de Google, la pertinence du contenu est alors essentielle.

Et pour cause, Google privilégie les pages pertinentes et utiles, pour éviter une indexation des sites jugés sans intérêt et les résultats redondants. Pour optimiser la pertinence de vos pages, divers facteurs sont à prendre en compte. Cela peut concerner des éléments comme la fraîcheur de la publication, les effets bloquants en matière de SEO, la ligne de flottaison, ou encore la structure des pages.

Pour identifier les divers facteurs d’un faible ratio d’indexation, le Google Webmaster Tools peut ouvrir à des pistes de réflexion. Cela étant, la pertinence d’un contenu est bien souvent associée à deux paramètres de base, à savoir la densité du contenu et l’originalité de la page.

Un faible volume textuel peut être considéré comme non pertinent en matière de référencement. Pour voir un contenu affiché dans l’index primaire de Google, prenez le temps de rédiger des contenus bien denses et utiles pour les Internautes et ne vous contentez pas d’aller à l’essentiel. Pour se retrouver dans le filtre des articles pertinents pour Google, il est également primordial d’éviter le Duplicate Content.

Pour favoriser l’indexation, il est préférable de ne pas succomber à la répétition massive des descriptifs produits proposés par les fournisseurs, tout simplement parce que la concurrence en fait de même. La duplication interne est également un frein à l’indexation primaire. Pour optimiser la pertinence d’un site aux yeux de Google, il faut réduire le taux de similarité des contenus en optant pour une redirection des pages ou l’utilisation d’une balise canonical.

 

Et l’index secondaire de Google ?

L’index secondaire ou complémentaire répertorie les pages « de second choix » de Google. Etant de moindre qualité par rapport à d’autres contenus, ces pages jugées peu pertinentes ne s’affichent pas dans les pages de résultat (SERP) que sur demande expresse de l’Internaute.

En effet, les contenus répertoriés dans l’index secondaire s’affichent uniquement quand l’utilisateur clique sur le message « Relancer la recherche en incluant les pages ignorées », visible tout en bas de la page de résultats. Etant considérées comme sans importance, ces pages sont ignorées lors de la requête classique.

Si Bing affiche tous les résultats, Google choisit d’indexer toutes les pages en instaurant un filtre. En effet, même les pages jugées de « mauvaise qualité » seront répertoriées dans les SERP de l’index secondaire et sont, par conséquent, référencées et indexées. La seule différence est que ces résultats omis ne s’afficheront que dans des requêtes spécifiques ou quand Google n’a pas d’autres contenus à proposer.

L’index secondaire n’est pas non plus une pénalisation du référencement. Il répertorie tout simplement les pages non pertinentes en les classant comme des résultats omis. Contrairement aux idées reçues, ce n’est pas une forme de censure d’information de la part de Google, mais plutôt une façon logique pour optimiser l’expérience de navigation des Internautes. Et pour cause, avoir des résultats en double, trop similaires ou sans intérêt en masse lors d’une requête serait handicapant pour tous les utilisateurs du moteur de recherche.

 

Quand des pages sont jugées sans intérêt

Si Google indexe toutes les pages, il est bien entendu préférable de les positionner dans l’index principal. Malheureusement, cela n’est pas possible si les contenus sont jugés non pertinents et par conséquent, ne méritent pas de se trouver dans les SERP. Et c’est là qu’intervient l’index secondaire.

Comme vu plus haut, le Duplicate Content, qu’il soit interne ou externe, volontaire ou non… reste un frein au référencement. La page des résultats omis de Google est d’ailleurs principalement constituée de contenus en double, notamment des pages générées dynamiquement par les CMS. Ces dernières ont été indexées, mais par la suite déclassées au rang de non pertinentes.

Le filtre de pertinence de contenu est également basé sur la popularité de la page. Un maillage faible en matière de liens internes et externes suppose que le contenu n’est pas suffisamment relayé et manque, par conséquent, d’intérêt. Cela concerne les sites ayant un volume de contenu faible, un backlink négligeable, ou des textes sans valeur ajoutée.

Non maîtrisé, le facteur de syndication de contenus peut enfin affecter l’indexation d’une page. La règle est qu’un contenu indexé en premier sera placé dans l’index principal et tous les autres contenus postérieurs seront considérés comme des doublons. Si l’antériorité d’un article joue en faveur de son indexation, il se peut néanmoins que celui-ci soit décrédité de sa « paternité », tout simplement parce que le site copie détient plus de notoriété. Pour éviter que la pertinence du contenu soit affectée à la concurrence et voir son contenu déclassé dans l’index secondaire, une analyse de positionnement systématique est alors de mise.