IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Webmarketing Discussion :

Le fichier robots.txt, sa syntaxe et son contenu, sa portée.


Sujet :

Webmarketing

  1. #1
    Membre à l'essai Avatar de jean-c
    Homme Profil pro
    Développeur, documentaliste, gestionnaire d'information
    Inscrit en
    Décembre 2014
    Messages
    24
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur, documentaliste, gestionnaire d'information

    Informations forums :
    Inscription : Décembre 2014
    Messages : 24
    Points : 14
    Points
    14
    Par défaut Le fichier robots.txt, sa syntaxe et son contenu, sa portée.
    Bonjour,

    Je cherche à créer un fichier robots.txt afin d'empêcher l'indexation de pages de mon site. J'ai déjà mis dans le fichier des instructions classiques empêchant l'indexation :

    Code txt : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    User-agent: *
    Disallow: /

    D'après mes lectures, cela devrait - théoriquement - permettre d'empêcher l'indexation de mes pages par des moteurs de recherche, notamment Google et d'autres très populaires, comme Yahoo.

    Je sais qu'il existe aussi la méthode de la balise <meta> placée dans le <head> de la page:

    Code html : Sélectionner tout - Visualiser dans une fenêtre à part
    <meta name="robots" content="noindex, nofollow" />

    Mais comme il semble falloir répéter cette méthode pour l'ensemble des pages dont on veut empêcher l'indexation, n'est-ce pas un peu fastidieux ? Ne pourrait-on pas écrire dans le fichier robots.txt ceci :

    Code txt : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    User-agent: *
    Disallow: /
    Noindex: /
    Nofollow: /
    Nosnippet: /
    Noarchive: /
    Noodp: /
    Noydir: /
    Noimageindex: /

    ne serait-ce pas plus simple ?

    Autre question : la portée de ce fichier robots.txt, suis-je obligé d'en placer un pour chacun de mes sites dont je ne veux pas indexer les pages, ou puis-je simplement en poser un sur le serveur en spécifiant avec Disallow: /monURL les url que je ne veux pas indexer ?

    Merci par avance de vos réponses.

  2. #2
    Modérateur
    Avatar de kolodz
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2008
    Messages
    2 211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 211
    Points : 8 316
    Points
    8 316
    Billets dans le blog
    52
    Par défaut
    Si tu veux plus d'information sur le fichier robot.txt...
    Je te conseil d'aller voir la documentation de google concernant cette partie :
    En savoir plus sur les fichiers robots.txt
    Créer un fichier robots.txt

    Cordialement,
    Patrick Kolodziejczyk.
    Si une réponse vous a été utile pensez à
    Si vous avez eu la réponse à votre question, marquez votre discussion
    Pensez aux FAQs et aux tutoriels et cours.

  3. #3
    Membre à l'essai Avatar de jean-c
    Homme Profil pro
    Développeur, documentaliste, gestionnaire d'information
    Inscrit en
    Décembre 2014
    Messages
    24
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Développeur, documentaliste, gestionnaire d'information

    Informations forums :
    Inscription : Décembre 2014
    Messages : 24
    Points : 14
    Points
    14
    Par défaut
    Bonjour,

    Comme conseillé plus haut j'ai appliqué la technique du R.T.F.M., et du coup, ça soulève d'autres questions !

    Du coup, il y a l'envoi d'une mention "X-robots-tag" qui certes, m'intéresse.
    Travaillant sous Wamp, je le place dans le fichier httpd.conf ; mais où ? Lorsque je le mets en place, mon serveur ne veut plus démarrer.

    Voilà grosso modo ce que j'avais écrit :

    Code conf : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    <FilesMatch "*">
    Header set X-Robots-Tag "noindex, nofollow, noarchive, notranslate, nosnippet"
    </FilesMatch>

    D'après les information données par Google, cela serait une bonne méthode couplée au fichier robots.txt.

    Que dois-je optimiser exactement ?

    Merci.

Discussions similaires

  1. [debutant(e)] Accès au fichier robot.txt
    Par SPACHFR dans le forum Référencement
    Réponses: 2
    Dernier message: 12/06/2013, 14h13
  2. Fichier robots.txt pour google
    Par ni-ni13 dans le forum Référencement
    Réponses: 0
    Dernier message: 27/09/2010, 14h45
  3. Cacher le fichier robots.txt aux navigateurs
    Par itmak dans le forum Apache
    Réponses: 3
    Dernier message: 04/01/2010, 12h34
  4. Comment créer le fichier robots.txt
    Par tremeur53 dans le forum Référencement
    Réponses: 2
    Dernier message: 13/05/2009, 02h30
  5. Cherche parseur fichier robots.txt
    Par bluecurve dans le forum Langage
    Réponses: 9
    Dernier message: 12/07/2005, 07h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo