|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Membre à l'essai
![]() Inscription : mars 2006 Messages : 68 ![]() |
Bonjour,
je souhaiterais savoir si les moteurs de recherche ont l'obligation de respecter le fichier robot.txt, ou bien il existe des moteurs passant outre ce fichier ( et lesquels)? on m'a parlé de l'aspirateur httrack qui aspire un site web sans tenir compte du fichier robot.txt. y a t il un problème de droit si un moteur de recherche référence un contenu normalement protégé? merci de vos réponses piotr |
|
|
00
|
|
|
#2 |
![]() ![]() Sébastien DoeraeneIngénieur développement logiciels Inscription : juin 2004 Messages : 4 500 ![]() |
Les moteurs de recherches n'ont aucunement l'obligation de suivre robots.txt. Tu ne dois pas protéger le contenu de ton site avec robots.txt, mais bien avec des .htaccess et autres sécurités de ce genre.
Le robots.txt c'est juste pour éviter aux robots qui le respectent de visiter pour rien des URL qui renvoient des erreurs 403 ou 401 parce qu'elles sont protégées.
__________________
sjrd, rédacteur/modérateur Delphi Les règles du forum tu liras et tu respecteras. Ainsi ami des modos tu seras... Mis à jour le 6 mai 2012 : découvrez FunLabyrinthe v5.3 : un jeu de labyrinthe gratuit et personnalisable à l'infini avec des scripts Delphi-like. Découvrez aussi Sepi, un moteur de script orienté objet pour Delphi. Mes tutoriels |
|
00
|
|
|
#3 |
![]() ![]() Nicolas ValléeIngénieur Système Inscription : décembre 2005 Messages : 9 774 ![]() |
il y avait un .htaccess qui reconnaissait quand la connexion venait d'un "robot", et qui l'envoyait bouler... au risque de se faire blacklister
sinon, il y a un système qui permet de faire des urls "cycliques" et le robot part dans des boucles infinies, et plante sans indexer ton site... mais les moteurs de recherche n'apprécient pas non plus
|
|
|
00
|
|
|
#4 |
|
Membre à l'essai
![]() Inscription : mars 2006 Messages : 68 ![]() |
est-ce que quelqu'un aurait un tuto sur les moteurs de recherche et comment en programmer un?
|
|
|
00
|
|
|
#5 | |
![]() ![]() Nicolas ValléeIngénieur Système Inscription : décembre 2005 Messages : 9 774 ![]() |
Citation:
il y a des cours complets là-dessus... et plein de façon pour s'y prendre. Que souhaites-tu exactement ? |
|
|
|
00
|
|
|
#6 |
![]() ![]() Marc LussacResponsable marketing opérationnel Inscription : mars 2002 Messages : 26 358 ![]() |
En général les gentils crawlers (par exemple les moteurs de recherches) suivent le robot.txt et les méchant crawler (par exemple les aspirateurs d'emails en vue de spam) s'en tapent.
__________________
-> Ne pas me contacter pour le forum et je ne répondrai à aucune question technique -> Comment nous contacter -> Pour partenariat ou publicité : Mon Email |
|
00
|
|
|
#7 |
|
Membre à l'essai
![]() Inscription : mars 2006 Messages : 68 ![]() |
je souhaiterais programmer un moteur de recherche spécialisé, orienté sur mes centres d'intérêts. Je pourrais commencer par lui fournir en entrée une liste de site (celle de mes favoris IE), et ensuite rechercher des sites pertinents qui contiennent les mots clefs qui m'intéresse.
|
|
|
00
|
Copyright © 2000-2012 - www.developpez.com