Qu’est-ce que le PageRank ?

Définition du Page Rank

A noté qu’à ce jour, le PR n’est plus une donnée mise à jour par Google et donc un facteur de positionnement

Le PageRank (PR) était le cœur du système de classement mis en œuvre par Google. Déposé en 2001, le brevet sur le PageRank porte sur l’utilisation d’un algorithme destiné à classer les pages web par pertinence.

L’algorithme du PageRank s’est complexifié au fil des années mais son socle est la notion de popularité : Google considère en effet qu’un lien pointant vers une page équivaut à un vote, et que plus une page possède de liens entrant de qualité, plus elle mérite d’avoir un PageRank élevé. Dans ce domaine on parle parfois du TrustRank, un indice qui évalue le taux de confiance que Google attribue à une page.

Le classement PageRank repose sur la nature exclusivement démocratique du Web et utilise son importante structure de liens comme indicateur de la valeur des pages. Les sites de grande qualité bénéficient d’un classement PageRank plus élevé, ce dont Google se souvient à chaque fois qu’il effectue une recherche. Google combine le classement PageRank et des techniques perfectionnées de mise en correspondance du texte pour afficher des pages intéressantes, en rapport avec les termes recherchés.

Un brevet déposé par Google le 17 avril 2007 affine le calcul du PageRank. Il en découle que le PageRank dépend de la qualité des liens entrants, mais aussi du nom de domaine et de son ancienneté, du trafic sur le site, et du comportement des internautes sur le site. (pour plus d’informations, consulter le site Scriptol)

On peut en déduire que, outre des critères plutôt mécaniques et automatisés, Google prend désormais en compte la notation humaine et l’appréciation des internautes (qui est déterminée en observant leur comportement sur un site).

Valeur du PageRank

Quelle est la valeur réelle du PageRank ? Il s’agit d’un nombre décimal, qui n’est connu que de Google.

Un internaute peut avoir accès, avec son navigateur à une valeur approximative du PageRank, s’il installe la barre d’outil Google.

Dans ce cas il s’affiche une barre de PR, qui correspond à une valeur de 1 à 10 et donc à une échelle logarithmique du vrai PageRank.

pagerankmeter
Exemple d’affichage du PR avec Mozilla Firefox

Selon Matt Cutts, l’affichage du PageRank dans la barre d’outils Google est une donnée qui est rafraîchie tous les trois à quatre mois. (voir article posté dans son blog le 2 octobre 2006). Par ailleurs Matt Cutts rappelle que la valeur du PageRank peut être différente selon le Datacenter Google interrogé.

Il s’agit donc d’une valeur purement indicative qui peut différer de la valeur réelle, sur laquelle sont théoriquement basés les résultats de recherche Google.

Outre la Toolbar Google il existe de nombreux outils pour connaître le PageRank d’un site, comme par exemple PageRank Tool (valeur du PR sur plusieurs datacenters) ou Visual PageRank (affichage d’une barre de PR sur les liens d’une page).

Impact du PageRank sur le classement Google

Les sites possédant un fort score de PageRank ont plus de facilité à apparaître dans les premiers résultats Google. Néanmoins il n’est pas rare de voir un classement des résultats de recherche qui ne respecte pas l’ordre du PR.

Il est important de garder à l’esprit que les résultats affichés dans la page de résultat Google sont des résultats dynamiques, susceptibles de varier fortement en fonction du temps et du Datacenter interrogé.
Dans ces conditions il est inutile de se focaliser sur la valeur du PageRank telle qu’elle est accessible à un internaute, car il n’agit pas de la valeur réelle, mais d’une « photographie » du PR à un instant donné.

Le PR doit donc être pris comme un indicateur, donnant une idée de la valeur d’un site pour Google et de son TrustRank.

Cette valeur est utile à connaître par exemple dans le cadre d’un échange de liens, pour obtenir des liens issus de sites de confiance, bien considérés par Google.

Elle n’est par contre pas déterminante en terme de classement dans les résultats de recherche.

L’effet Sandbox

Malgré son impact relatif en matière de référencement, le PageRank est scruté depuis toujours par les webmasters, qui cherchent à en comprendre les variations et les effets.

L’un de ces phénomènes est l’effet Sandbox, connu depuis 2004.
Le fonctionnement en est très simple : un site qui vient d’être mis en ligne risque de  posséder un PageRank à valeur nulle ou indéterminée pendant plusieurs mois.

l'effet sandbox

Il s’agit d’un « bridage » temporaire du site par Google, qui considère qu’il existe une phase de croissance naturelle pour un site et qu’il n’est donc pas pertinent de donner un bon classement à un site qui vient d’être créé.

Dans ce contexte il n’est pas rare de voir un site passer rapidement de PR 0 à PR 3, après la levée de ce bridage.

Il s’agit donc d’un effet temporaire, qui n’excède pas théoriquement quelques mois.

(voir plus d’informations sur WebRankInfo)

Pénalités sur le PageRank

Courant octobre 2007, de nombreux sites ont été victimes d’une mise à jour de l’algorithme de Google, entraînant des chutes brutales de PageRank. Parmi les victimes, on trouve de nombreux sites de confiance, tels que SearchEngineJournal, WebRankInfo ou Pixmania, qui perdent 3 à 4 points de PR. (voir les articles paru dans JDNET ou eNaty).

Selon les propres dires de Matt Cutts, cette sanction est une conséquence de la chasse aux liens artificiels ou payants menée par Google fin 2007.
Plusieurs sites se sont ainsi vus sanctionnés car ils proposaient des contenus de type « blocs de liens » jugés non pertinents par Google.

Il est important d’ajouter que cette sanction au niveau du PageRank n’a pas eu d’incidence au niveau du positionnement de ces sites et du trafic des internautes.

Il s’agit apparemment d’un avertissement de la part de Google, suite à un durcissement de sa politique vis-à-vis des échanges de liens.
Cette politique de pénalisation du PR est toujours d’actualité, il est donc fortement conseillé de prendre garde à limiter le nombre de liens vers des sites partenaires.

Voici un extrait du guide de qualité Google à propos des liens :

« Le classement de votre site dans les résultats de recherche Google est en partie basé sur l’analyse des sites qui comportent des liens vers vos pages. La quantité, la qualité et la pertinence de ces liens sont prises en compte dans votre évaluation. Les sites qui comportent des liens vers vos pages peuvent fournir des informations sur l’objet de votre site, et peuvent indiquer sa qualité et sa popularité. Toutefois, certains webmasters participent à des systèmes d’échange de liens et conçoivent des pages partenaires utilisées exclusivement à des fins de « cross-linking », sans tenir compte de la qualité des liens, des sources et de l’impact à long terme que cela aura sur leur site. Cette pratique constitue une infraction aux conseils aux webmasters de Google et peut avoir des effets négatifs sur le classement de votre site dans les résultats de recherche. Exemples de systèmes de liens :

  • liens conçus pour manipuler le classement PageRank ;
  • liens vers les polluposteurs (ou « spammeurs ») ou les « voisinages douteux » sur le Web
  • liens réciproques excessifs ou échanges de liens excessifs (du type « Établissez un lien vers mon site et j’établirai un lien vers le vôtre ») ;
  • achat ou vente de liens qui améliorent le classement PageRank. »