Accueil » Blog » Référencement naturel » Qu’est-ce que le fichier robots.txt ?
Qu’est-ce que le fichier robots.txt ?
. Chapitre 3. Point 1
Le principe du fichier robots.txt
Le fichier robots.txt est un fichier texte que vous insérez à la racine de votre site. Il liste un certain nombre de consignes à destination des moteurs de recherche. C’est d’ailleurs pour cette raison qu’il porte le nom de robots txt. Ce fichier vous permet donc de guider les crawlers lors de leur passage sur votre site. Vous avez le choix entre deux commandes différentes : l’user-agent et le disallow. Si vous optez pour l’user-agent, vous précisez à quel crawler la consigne va s’appliquer. Si vous le souhaitez, vous pouvez ainsi choisir d’appliquer la consigne uniquement aux spiders de Google, de Bing ou à l’ensemble des moteurs de recherche. Le disallow est, quant à lui, une commande empêchant les robots de circuler sur telle ou telle page de votre site. À titre exemple, si vous mettez Disallow:/images/ dans votre fichier seo robots txt, cela signifie que les spiders des différents moteurs de recherche ne peuvent parcourir le dossier images de votre site.Le robots.txt, différent de la balise noindex
Certains confondent le robots.txt avec la balise noindex. Pourtant, il s’agit de deux choses assez différentes. Le noindex est une balise qui interdit complètement l’accès aux pages aux robots d’indexation. Ainsi, contrairement au robots.txt où les robots peuvent toujours connaitre l’existence d’une page si un lien pointe vers elle, le noindex empêche l'indexation de l’URL, et ce, même s’il existe des liens qui pointent dessus.L’utilité du fichier robots.txt
Si vous désirez modifier le circuit des spiders, mettre en place un fichier robots.txt est indispensable. Si ce fichier est absent, les robots des moteurs de recherche parcourent toutes les pages de votre site. Notez toutefois que si les robots d’indexation ne peuvent pas lire le contenu de vos pages, cela ne signifie pas qu’ils ne les voient pas. Ainsi, si un lien pointe vers ces pages, elles peuvent être indexées. Mettre en place un fichier robots.txt vous permet d’améliorer la sécurité de votre site. Grâce à un fichier robots.txt, vous interdisez l’indexation de données confidentielles comme les coordonnées de vos clients, par exemple. Vous évitez ainsi que ces informations délicates ne soient accessibles à tous les internautes. Un fichier robots.txt est aussi intéressant dans la mesure où vous pouvez maitriser l’indexation de votre site internet. En effet, vous évitez que les pages peu pertinentes comme les conditions générales de vente ou les mentions légales ne soient répertoriées par les crawlers. Le fichier robots.txt évite aussi la création d’un duplicate content en empêchant les spiders de passer sur des pages au contenu identique. Cette maitrise de l’indexation n’est pas à prendre à la légère puisqu’elle est d’une importance capitale dans votre stratégie SEO.Les limites du fichier robots.txt
Avant de créer un fichier robots.txt, vous devez évaluer les risques liés à l’utilisation de cette méthode de blocage d’URL. Vous saurez ainsi si le fichier est la solution idéale pour assurer la protection de vos URL sur le web. Tout d’abord, gardez à l’esprit que les instructions que vous mettez dans vos fichiers robots.txt ne sont pas des règles, mais de simples consignes. En d’autres termes, les robots d’explorations peuvent ne pas les suivre. Si Googlebot et autres spiders sérieux respectent les instructions que vous mettez dans vos fichiers robots.txt, d’autres peuvent les contourner. Si vous désirez protéger les informations délicates et éviter leur récupération par les robots d’exploration, il est conseillé d’utiliser, en plus, d’autres méthodes de blocage comme la protection par mot de passe des fichiers privés installés sur votre serveur, par exemple. Pour en savoir plus : cette vidéo du référenceur Olivier Andrieu (Abondance) https://www.youtube.com/watch?time_continue=81&v=jTmvqBLIDIw&feature=emb_logoMettre en place un fichier robots.txt sur son site
Apprenez la syntaxe du fichier robots.txt
Quand vous établissez un fichier robots.txt, vous devez entrer des mots clés pour transmettre les consignes aux spiders des moteurs de recherche. Sur les versions de fichiers robots.txt les plus simples, les mots clés à utiliser sont le disallow et l’user-agent. L’user-agent est en fait un robot de moteur de recherche ou d’exploration. La plupart d’entre eux sont répertoriés dans la base de données des robots d’exploration. Le disallow, lui, est une commande qui demande à l’user-agent de ne pas se rendre sur une URL en particulier. Si vous désirez qu’une URL particulière appartenant à un répertoire parent non autorisé soit repérable par les robots d’indexation des moteurs de recherche, vous pouvez utiliser un autre mot clé, l’Allow, dans votre fichier robots.txt.Utilisez les bonnes commandes
Utiliser les bonnes commandes est indispensable pour vous assurer que la commande d’exclusion concerne réellement les pages et les contenus que vous désirez cibler. Si vous désirez bloquer l’accès à l’ensemble de votre site, vous devez mettre une barre oblique (/) après Disallow. Si vous souhaitez qu’un répertoire et son contenu soient bloqués, vous devez insérer la barre oblique après le nom du répertoire. Pour bloquer une page web, il faut mettre le nom de la page juste après la barre oblique. Ce ne sont là que quelques exemples des commandes que vous devez maitriser pour pouvoir créer un robots.txt à la hauteur de vos exigences.Respectez les règles de correspondance de format
Respecter les règles de correspondance de format est nécessaire pour optimiser le code inscrit sur votre fichier robots.txt. Si vous désirez bloquer une séquence de caractères, vous devez utiliser un astérisque (*). Ainsi, si vous désirez que le code d’exclusion bloque l’accès à tous les sous-répertoires commençant par le mot « private », vous devez mettre l’astérisque après le mot private. Pour bloquer l’accès aux URL incluant un point d’interrogation, vous devez insérer un point d’interrogation (?) à votre code.Testez votre fichier robots.txt
Pour vous assurer que votre fichier robots.txt est conforme à vos aspirations, vous pouvez le tester via le Google search console. L’outil de test de fichier robots.txt qui y est mis à votre disposition vous indique si votre fichier empêche les robots d’indexation du moteur de recherche d’explorer certaines URL de votre site. L’utilisation de ce testeur est relativement simple puisqu’il vous suffit d’entrer l’URL que vous avez désiré bloquer. L’outil parcourt votre URL comme les robots d’indexation le font habituellement. Il vous indique ensuite si l’accès lui a été refusé ou non.Soumettez votre fichier au moteur de recherche
Une fois que vous avez fini de créer votre fichier robots.txt, vous devez le soumettre au moteur de recherche. Pour que les robots d’exploration puissent trouver et identifier votre fichier robots.txt, il est important d’appliquer les conventions d’enregistrement indiquées par les moteurs de recherche. Il faut enregistrer le code de fichier robots.txt sur un fichier texte et placer ce dernier à la racine de votre domaine. Vous devez aussi nommer le fichier robots.txt. Notez-le : alors que le testeur de fichier robots.txt a disparu de la Search Console, Bing lui donne une nouvelle vie via son outil Webmaster Tools.Articles similaires
Référencement naturel
Balise Alt SEO : Définition, rôle & optimisations
Lundi 06 Juin, 2022
Lire cet article
Référencement naturel
Comment utiliser Google Keyword Planner pour votre SEO ?
Lundi 06 Juin, 2022
Lire cet article
Référencement naturel
Core Vitals : l’UX comme indicateur de qualité pour Google
Lundi 06 Juin, 2022
Lire cet article
Référencement naturel
Core Web Vitals : Comment les améliorer ?
Samedi 04 Juin, 2022
Lire cet article
Référencement naturel
Infographie : Comment optimiser le SXO de son site web ?
Vendredi 25 Juin, 2021
Lire cet article
Référencement naturel
Infographie : Comment booster votre SEO sur Amazon ?
Jeudi 29 Avril, 2021
Lire cet article
Référencement naturel
Infographie : Comment booster votre SEO sur Youtube ?
Vendredi 09 Avril, 2021
Lire cet article
Référencement naturel
Infographie : Comment booster votre SEO local ?
Jeudi 18 Mars, 2021
Lire cet article
Référencement naturel
SEO - SEA - SEM : On vous dit tout !
Mercerdi 07 Octobre, 2020
Lire cet article
Référencement naturelRéférencement payant
Google Keyword Planner : utilité et prise en main
Mardi 23 Juin, 2020
Lire cet article
Référencement naturel
Infographie : Les meilleurs acteurs sur la recherche vocale #2
Jeudi 04 Juin, 2020
Lire cet article
Référencement naturel
Les 5 avantages clés d'une stratégie SEO & les 3 piliers du référencement
Mardi 02 Juin, 2020
Lire cet article
Référencement naturel
Infographie : Les meilleurs acteurs sur la recherche vocale #1
Mercerdi 27 Mai, 2020
Lire cet article
Référencement naturel
Google May Core Update 2020 : Mise à jour majeure de l'algorithme
Mercerdi 06 Mai, 2020
Lire cet article
Référencement naturel
Comment s'en sortir avec une pénalité Google ?
Mardi 28 Avril, 2020
Lire cet article
Référencement naturel
UX et SEO : Comment allier les 2 pour booster votre visibilité ?
Jeudi 23 Avril, 2020
Lire cet article
Référencement naturel
Qu'est ce que la recherche vocale ou vocal search ?
Vendredi 03 Avril, 2020
Lire cet article
Référencement naturel
La position 0 dans Google... Utile ou futile ?
Mardi 31 Mars, 2020
Lire cet article
Référencement naturel
Les microdonnées : utiles pour un meilleur référencement ?
Jeudi 26 Mars, 2020
Lire cet article
Référencement naturel
Comment est-ce-que la dégradation des contenus affecte votre SEO ? (content decay)
Mardi 17 Mars, 2020
Lire cet article
Référencement naturel
Boostez votre référencement grâce aux techniques off-site
Mardi 10 Mars, 2020
Lire cet article
Référencement naturel
Stratégie de netlinking & Topical Trust Flow (TTF)
Jeudi 05 Mars, 2020
Lire cet article
Référencement naturel
SEO : Pourquoi et comment être référencé dans Google Actualités ?
Mardi 25 Février, 2020
Lire cet article
Référencement naturel
Maillage interne : Avantages pour votre stratégie SEO
Mardi 11 Février, 2020
Lire cet article
Référencement naturel
Qu'est-ce que l'Answer Engine Optimization ou "moteur de réponse" Google ?
Mercerdi 29 Janvier, 2020
Lire cet article
Référencement naturel
SEO : Détectez l’intention de recherche derrière les mots-clés
Jeudi 23 Janvier, 2020
Lire cet article
Référencement naturel
9 tendances SEO que vous ne pouvez pas ignorer en 2020
Mardi 07 Janvier, 2020
Lire cet article
Référencement naturel
Infographie sur la recherche vocale : statistiques et constats
Jeudi 14 Novembre, 2019
Lire cet article
Référencement naturel
SEO : En quoi la tendance à la recherche visuelle fait-elle évoluer le référencement ?
Jeudi 14 Février, 2019
Lire cet article
Référencement naturel
Qu'est-ce qu'un PAA : People Also Ask?
Mercerdi 03 Janvier, 2018
Lire cet article
Référencement naturel
Les causes possibles pouvant freiner votre référencement naturel
Jeudi 28 Décembre, 2017
Lire cet article
Référencement naturel
Quels sont les risques liés au passage en https ?
Jeudi 28 Décembre, 2017
Lire cet article
Référencement naturel
Pourquoi le Javascript et l'Ajax posent-ils problème pour le référencement naturel ?
Jeudi 28 Décembre, 2017
Lire cet article
Référencement naturel
Mon site est construit avec des frames, est-il possible d’optimiser son référencement naturel ?
Jeudi 28 Décembre, 2017
Lire cet article
Référencement naturel
La balise hreflang est-elle importante pour le référencement de mon site Internet ?
Jeudi 28 Décembre, 2017
Lire cet article
Référencement naturel
Quels sont les freins techniques pour le référencement d’un site réalisé en Flash ?
Jeudi 28 Décembre, 2017
Lire cet article
Référencement naturel
Pourquoi certains menus posent problème pour le référencement naturel ?
Jeudi 28 Décembre, 2017
Lire cet article
Référencement naturel
Pourquoi les formulaires peuvent-ils freiner le référencement de mon site Internet ?
Jeudi 28 Décembre, 2017
Lire cet article
Référencement naturel
J’ai un site Internet réalisé en flash, est-il possible d’optimiser son référencement naturel sur Google ?
Jeudi 28 Décembre, 2017
Lire cet article
Référencement naturel
Quelles sont les sanctions et pénalités Google ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
La perte de position sur Google en référencement naturel
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
Mon site a perdu ses positions QUE sur quelques mots clés, pourquoi ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
Mon site a perdu toutes ses positions dans Google d’un seul coup, pourquoi ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
Site blacklisté par Google : que faire ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
Quelles sont les sanctions infligées par Google Panda ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
Faut-il choisir un nom de domaine avec mes mots clés à l’intérieur pour être mieux référencé ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
Que faut-il faire en cas de pénalité Google ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
Comment savoir si mon site est pénalisé par Google ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
A quelles dates ont eu lieu les mises à jour Google Panda ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
Que sont les filtres algorithmiques ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
Pourquoi le Page Rank de mon site Internet a-t-il baissé ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
L’url rewriting est-elle importante pour le référencement naturel de mon site ?
Mercerdi 27 Décembre, 2017
Lire cet article
Référencement naturel
Référencement et création de site Internet
Vendredi 22 Décembre, 2017
Lire cet article
Référencement naturel
Qu’est-ce qu’un cocon sémantique ?
Vendredi 22 Décembre, 2017
Lire cet article
Référencement naturel
Pourquoi faut-il travailler la longue traîne en référencement naturel ?
Vendredi 22 Décembre, 2017
Lire cet article
Référencement naturel
Mon site vient d’être créé, Que dois-je faire pour le référencer ?
Jeudi 21 Décembre, 2017
Lire cet article
Référencement naturel
White Hat SEO, Black Hat SEO : de quoi s'agit-il ?
Jeudi 21 Décembre, 2017
Lire cet article
Référencement naturel
Optimisation de votre site pour le SEO
Jeudi 21 Décembre, 2017
Lire cet article
Référencement naturel
Pour aller plus loin en référencement naturel ….
Jeudi 21 Décembre, 2017
Lire cet article
Référencement naturel
Quels sont les meilleurs outils permettant de suivre les positions de mon site Internet en référencement naturel ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Suivre les résultats de votre référencement naturel
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Référencement des fichiers PDF / Word
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Généralités sur le référencement naturel
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Quels sont les différents types de Rich Snippet ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Comment améliorer sa visibilité sur Google ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Faut-il passer son site en mode sécurisé https ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Est-il possible de faire apparaître les sitelinks que l’on veut ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Comment être positionné en position 0 sur Google ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Comment savoir si la position 0 impact le trafic ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Comment savoir si une de mes pages s’affichent en position 0 ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Quels types d’informations s’affichent en position 0 ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Est-ce que je peux écrire du texte blanc sur fond blanc ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Est-ce que je peux cacher du texte dans les pages de mon site Internet ?
Mardi 19 Décembre, 2017
Lire cet article
Référencement naturel
Quelle est la différence entre référencement naturel et référencement payant ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Comment construire un cocon sémantique ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Existent-ils différents fichiers sitemaps ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Comment créer un fichier sitemap.xml ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Qu’est-ce que le fichier sitemap.xml ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Quelle est la part de marché des moteurs de recherche en France ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Est-il possible de travailler sur d’autres moteurs de recherche que Google ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Comment les moteurs positionnent les pages de mon site dans leurs résultats ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Quelle est la différence entre référencement et positionnement ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
En quoi est-ce utile de faire du référencement naturel si je fais déjà de l’adwords ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Le référencement payant Adwords permet-il d’être bien référencé naturellement ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Qu’est-ce que l’url d’un site Internet ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Quels sont les critères d’optimisation d’un fichier pdf en référencement naturel ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Est-il possible de référencer un fichier pdf ?
Lundi 18 Décembre, 2017
Lire cet article
Référencement naturel
Quels critères mon site doit respecter pour apparaître dans Google Actualités ?
Lundi 18 Décembre, 2017
Lire cet article