IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Apache Discussion :

Cacher le fichier robots.txt aux navigateurs


Sujet :

Apache

  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Novembre 2005
    Messages
    200
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2005
    Messages : 200
    Par défaut Cacher le fichier robots.txt aux navigateurs
    En référence à cette discussion, je cherche aussi comme rbaatouc à empêcher les internautes de lire le fichier robots.txt mais laisser les moteurs de recherche le lire!

    C'est important car en effet le noms de quelques repertoires ne doivent ni être indexés et ni vus par les internautes.

    Si vous avez une autre solution pour réaliser cela elle sera la bienvenue

    Merci

  2. #2
    Rédacteur
    Avatar de _Mac_
    Profil pro
    Inscrit en
    Août 2005
    Messages
    9 601
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2005
    Messages : 9 601
    Par défaut
    Tu peux faire un filtre sur la valeur de l'en-tête User-Agent mais cette solution n'est pas parfaite. Dans le .htaccess de la racine du site :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    SetEnvIf User-Agent Mozilla navigateur
    SetEnvIf User-Agent Safari navigateur
    SetEnvIf User-Agent Opera navigateur
    ...
     
    <Files robots.txt>
        Deny from env=navigateur
    </Files>
    Avec ce filtre, si quelqu'un truque la signature de son navigateur, i.e. met autre chose que ce qui figure dans les SetEnvIf, il verra le fichier robots.txt.

    Après, dans l'absolu, je suis de l'avis de la conclusion de la discussion précédente : un robot suit les liens présents sur les pages Web sauf ceux indiqués dans robots.txt. Ce qui signifie qu'un robot ne peut pas voir plus de pages que ce qu'un utilisateur lambda peut voir avec son navigateur en suivant les liens du site. Un robot d'indexation bien fait ne cherche pas à construire d'autres URL. Par exemple, si /admin ne figure nulle part dans les liens publics du site, un robot n'ira jamais chercher à indexer /admin. Si tu ne veux pas que les internautes voient certains répertoires, il ne faut pas mettre de liens vers ces répertoires dans tes pages. Dire qu'on peut deviner des répertoires cachés en lisant le robots.txt, c'est un faux problème car par définition ne doivent figurer dans robots.txt que des URL publiques accessibles à partir de liens publiques de ton site. Donc pour moi, à part avoir des problèmes, un tel filtre n'a aucun intérêt.

  3. #3
    Membre éclairé
    Profil pro
    Inscrit en
    Novembre 2005
    Messages
    200
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2005
    Messages : 200
    Par défaut Utiliser .htaccess et .htpasswd pour sécuriser les repertoires à cacher
    La meilleur solution est de sécuriser les repertoires qu'on veux cacher et pour les robots et pour les internautes avec une authentification moyennant .htaccess et .htpasswd

    En effet, les robots et les internautes voient presque la même chose. Donc on permet de crawler ce qu'on veux montrer aux internautes.

    Et dans le fichier robots.txt il est préférable de ne pas mettre les noms de répertoires à cacher.

    Merci à tous.

  4. #4
    Rédacteur
    Avatar de _Mac_
    Profil pro
    Inscrit en
    Août 2005
    Messages
    9 601
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2005
    Messages : 9 601
    Par défaut
    On est d'accord

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. fichier robots.txt et spider ?
    Par nfluch dans le forum Général Conception Web
    Réponses: 2
    Dernier message: 02/08/2013, 14h03
  2. [debutant(e)] Accès au fichier robot.txt
    Par SPACHFR dans le forum Référencement
    Réponses: 2
    Dernier message: 12/06/2013, 14h13
  3. Fichier robots.txt pour google
    Par ni-ni13 dans le forum Référencement
    Réponses: 0
    Dernier message: 27/09/2010, 14h45
  4. Comment créer le fichier robots.txt
    Par tremeur53 dans le forum Référencement
    Réponses: 2
    Dernier message: 13/05/2009, 02h30
  5. Cherche parseur fichier robots.txt
    Par bluecurve dans le forum Langage
    Réponses: 9
    Dernier message: 12/07/2005, 07h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo