IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Shell et Google


Sujet :

Shell et commandes GNU

  1. #1
    Candidat au Club
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Janvier 2020
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 54
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Janvier 2020
    Messages : 4
    Points : 2
    Points
    2
    Par défaut Shell et Google
    Hello tout le monde
    Mon problème est simple (à expliquer)
    J'ai développé un script SHELL qui effectue des recherches automatiques sur Google
    Ce n'est pas du spam, ce sont bien des recherches faites par ma machine. Ce script envoi quelques fois 10 requêtes dans un laps de temps de 1 mn sur google grâce à un programme que j'ai trouvé qui se nomme "googler".
    Problème, au bout de quelques recherches, je recois le message suivant:
    [ERROR] Connection blocked due to unusual activity. THIS IS NOT A BUG, please do NOT report it as a bug unless you have specific information that may lead to the development of a workaround. You IP address is temporarily or permanently blocked by Google and requires reCAPTCHA-solving to use the service, which googler is not capable of. Possible causes include issuing too many queries in a short time frame, or operating from a shared / low reputation IP with a history of abuse. Please do NOT use googler for automated scraping.

    Je suis obligé d'attendre. Je cherche un moyen en ligne de commande de contourner cela. J'ai bien pensé aux proxy, mais avant d'en trouver un qui fonctionne.... et quand bien même, ce proxy pourrait etre aussi bloqué par Google, il faudrait en mettre un autre.
    J'ai mis des temporisations différentes et aléatoires entre chaque requête et idem.

    Que pourriez vous me conseiller pour ne pas être bloqué en ligne de commandes par Google?

    Merci de votre lecture et surtout si vous me trouvez une solution.

    Bon we à tous
      0  0

  2. #2
    Expert éminent sénior Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 280
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 280
    Points : 12 729
    Points
    12 729
    Par défaut
    Je trouve la dernière phrase du message d'erreur assez parlante...
    Il n'y a pas trop de possibilité, à part peut-être faire tes requêtes à une vitesse humaine...

    En tout cas, on n'en sait pas assez de ton besoin pour savoir s'il y a moyen de faire autrement.
    Cordialement.
      3  0

  3. #3
    Candidat au Club
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Janvier 2020
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 54
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Janvier 2020
    Messages : 4
    Points : 2
    Points
    2
    Par défaut
    Avec des interfaces html, il suffit de faire un Captcha mais en ligne de commande je ne vois pas comment faire
      0  0

  4. #4
    Expert éminent sénior Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 243
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 243
    Points : 13 458
    Points
    13 458
    Par défaut
    Bonjour

    Peut-on savoir quel est le besoin réel d'un administrateur réseaux d'harceler 10 fois par minute (litote) le site de Google ?
    Voulez-vous savoir, au dixième de seconde près, s'il est apparu un nouveau site proposant du rouge à lèvre carmin ?
    Ridicule.

    Je rappelle, quand même, que les robots ne sont que tolérés sur les sites, avec un accord de personnes bien élevées, résumé dans le fichier robot.txt.
    Avec des comportements mal-élevés comme le vôtre, tout le monde se crispera et on perdra en liberté. Les uns interdisant les autres, et les autres cherchant tout pour pilonner les uns.

    Enfin, vous attaquez le trésor de Google. Facile de comprendre qu'ils ne vous laisseront pas piller leur plus-value.
    Cette réponse vous apporte quelque chose ? Cliquez sur en bas à droite du message.
      2  0

  5. #5
    Candidat au Club
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Janvier 2020
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 54
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Janvier 2020
    Messages : 4
    Points : 2
    Points
    2
    Par défaut alors que les choses soient claires
    Le fait de prendre un couteau ne veut pas dire qu'on va tuer quelqu'un. Si tu vois ce que je veux dire.
    Ensuite ta question est déplacée, harceler, n'importe quoi non? Un peu du délit d'intention non?

    Est ce que j'ai parlé de requête au dixième de seconde?
    Avant d'accuser, il faut peut être poser des questions simplement non?

    Réel administrateur, oui je suis un réel administrateur mais qui développe aussi des outils, et mon outil qui se trouve ici bloqué sert à effectuer des recherches automatiques sur un sujet entré par un utilisateur. Pour cela, j'ai besoin de connaitre le nombre de page maximum que me sortira Google et en shell je n'ai trouvé d'autre moyen que de passer page par page ma demande. Voilà pour le côté mal intentionné si on peut parler de ça.

    Ton histoire sur les robots, je la connais, inutile de me la préciser, je suis du métier. Et mon objectif n'est pas de fiche le bazars mais bien de connaitre le nombre de pages maximum que me sortira Google sur un sujet donné.

    Un peu n'importe quoi ta réponse.

    Donc voilà, je m'adresse plutôt aux gens qui connaissent, et pas aux petits moralistes en herbe.

    Encore une fois je connais beaucoup de choses mais pas tout c'est pourquoi je demande ici. Et mes intentions sont pacifiques.
    Je veux juste connaitre avec un script shell le nombre de pages maximum sur un sujet donné.
      0  0

  6. #6
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 552
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 552
    Points : 19 387
    Points
    19 387
    Par défaut
    harceler, n'importe quoi non?
    ça dépend où on place les limites. selon Google, 10 requêtes / mn., ou la rapidité avec laquelle certaines sont envoyées, dépassent celles qu'il a fixées.
    .
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.
      2  0

  7. #7
    Expert éminent sénior Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 243
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 243
    Points : 13 458
    Points
    13 458
    Par défaut
    Ayant activé les 100 résultats par page, j'obtiens rarement plus de 3 pages, en tapant:
    • harcèlement
    • haine
    • sexe
    • politique
    • macron (ah ! 5 pages)
    • trump (2 pages, la honte)
    • informatique
    • google (4)
    • mort
    • etc ...


    Il y a donc rarement plus de 5 pages. ("Macron", qui dit mieux ?). De là à froisser Google qui te blackliste, il y a de la marge.

    Tu as ta réponse sur le maximum de pages : 50 pages maximum à raison de 10 par pages
    Cette réponse vous apporte quelque chose ? Cliquez sur en bas à droite du message.
      0  1

  8. #8
    Candidat au Club
    Homme Profil pro
    Administrateur systèmes et réseaux
    Inscrit en
    Janvier 2020
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 54
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Administrateur systèmes et réseaux
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Janvier 2020
    Messages : 4
    Points : 2
    Points
    2
    Par défaut Hola
    Bon, je crois que je vais me désabonner, un peu sans intérêt, peu de réponses utiles mis à part des polémiqueurs
    Et un qui ne ssais pas utiliser au maximum google
    quoi qu'il en soit j'ai trouvé une alternative à mon problème.
    et je ne pense pas revenir ici vu la médiocrité des réponses d'un de vos sujets qui pense avoir raison, je lui laisse sa raison
    Un petit conseil pour mon ami qui agresse au lieu de se rendre utile en réponse, les secrets de google te permettront sans doute d'arriver à avoir plus de résultats dans tes recherches
    Tchao !
      0  0

  9. #9
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 552
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 552
    Points : 19 387
    Points
    19 387
    Par défaut
    qui plus est, ton sujet, qui concerne le contournement d'une sécurité mise en place par le site que tu interroges, est limite hors charte.
    .
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.
      0  0

  10. #10
    Responsable Systèmes


    Homme Profil pro
    Gestion de parcs informatique
    Inscrit en
    Août 2011
    Messages
    17 451
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Gestion de parcs informatique
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Août 2011
    Messages : 17 451
    Points : 43 097
    Points
    43 097
    Par défaut
    Le fait de prendre un couteau ne veut pas dire qu'on va tuer quelqu'un.
    Certes, mais ça ne veut pas dire que tu peux te balader dans la rue avec une lame de 40cm. Tout comme Google impose des limites d'accès à leur serveurs, et qu'ils te bloquent si tu ne les respectes pas.

    et je ne pense pas revenir ici vu la médiocrité des réponses
    A hauteur de la médiocrité de détails de ce que tu veux faire.
    Avant d'accuser, il faut peut être poser des questions simplement non?
    Cela t'as été demandé par Floderalab et Disedorgue.
    Ma page sur developpez.com : http://chrtophe.developpez.com/ (avec mes articles)
    Mon article sur le P2V, mon article sur le cloud
    Consultez nos FAQ : Windows, Linux, Virtualisation
      2  0

Discussions similaires

  1. [VB6] comment savoir si la commande shell est terminée ?
    Par ghyscharlotte dans le forum VB 6 et antérieur
    Réponses: 5
    Dernier message: 30/07/2003, 19h12
  2. Retour de requete postgresql / Shell Script
    Par doohan dans le forum Requêtes
    Réponses: 3
    Dernier message: 26/06/2003, 18h07
  3. [SHELL] Icônes associées à des fichiers
    Par agh dans le forum API, COM et SDKs
    Réponses: 5
    Dernier message: 09/04/2003, 17h04
  4. WebService Google sur builder 5?
    Par billuh dans le forum C++Builder
    Réponses: 3
    Dernier message: 19/11/2002, 19h43
  5. [Kylix] probleme pour lancer le shell
    Par miky dans le forum EDI
    Réponses: 5
    Dernier message: 13/08/2002, 09h39

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo