IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

scraping - pb dans l'enchaînement de procédures


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Mai 2005
    Messages
    465
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 465
    Par défaut scraping - pb dans l'enchaînement de procédures
    Bonjour,

    Je cherche à récupérer une information présente sur un annuaire de football, à savoir le nb de clubs par départements.

    Mon traitement s'applique à autant de pages que de départements

    Mon script buggue variablement à un département ou à un suivant ou à un précédent.

    Je pense qu'il y a un souci dans l'enchaînement des exécutions, et que le pb est relatif au stockage dans la mémoire temporaire, qqch de ce genre..

    Voici l'erreur que j'obtiens:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    [1] "01"
    [1] 70
    [1] "02"
    [1] 84
    [1] "03"
    [1] 119
    [1] "04"
    [1] 9
    [1] "05"
    Erreur dans UseMethod("xmlNamespaceDefinitions") : 
      pas de méthode pour 'xmlNamespaceDefinitions' applicable pour un objet de classe "NULL"
    Une autre fois, le script pourra planter au département "14" ou autre...

    Et voici mon code:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    for (i in deps$CODE_DEPT) {
      print(i)
      html = htmlParse(paste("http://www.le-footballeur.com/clubs_football-departement.php?dept=", i, sep=""), asText=FALSE)
      doc <- xpathSApply(html, "//table//div[preceding-sibling::form]", xmlValue)
      out[[i]] <- as.numeric(sub("^\n([0-9]+)( clubs trouvés).*$", "\\1", doc))
      print(out[[i]])
    }
    deps$CODE_DEPT contient les codes département: de "01" à "95"

  2. #2
    Membre éclairé
    Profil pro
    Inscrit en
    Mai 2005
    Messages
    465
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 465
    Par défaut
    Ce matin, je lance les traitements et aucun ne s'interrompt.
    Il doit se passer des choses étranges sur mon réseau professionnel, c'est tout

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 3
    Dernier message: 15/04/2011, 10h46
  2. Réponses: 6
    Dernier message: 19/10/2010, 17h36
  3. Enchaînement de procédures
    Par knkbru dans le forum Macros et VBA Excel
    Réponses: 1
    Dernier message: 30/07/2010, 12h44
  4. Caractère spéciaux dans l'appel de procédures stockées
    Par ecthelion dans le forum MS SQL Server
    Réponses: 4
    Dernier message: 14/12/2007, 16h00
  5. Passer une valeur Null dans un argument de procédure
    Par preempalver dans le forum VBA Access
    Réponses: 5
    Dernier message: 30/12/2003, 20h52

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo