Bonjour,

Je rencontre actuellement un problème avec un script que j'ai ecrit.

J'ai créé un fichier contenant des adresses de pages web (545). J'ai à partir de là fait une boucle for(i in 1:545) pour parcourir le fichier, recupérer chaque adresse et avec les fonctions mentionnées dans le titre du sujet (package XML) obtenu les informations qui sont dans la page.

Je dois malheureusement faire face à un problème que je n'arrive pas à résoudre.

Je stocke les résultats dans une matrice (545*49) que j'enregistre sur le disque au format txt. A la lecture du fichier, je me suis rendu compte que pour certaines lignes, les informations manquaient. Le problème se produit avec le parse, il n'arrive apparement pas à parser l'url.

Ce qui me gène, c'est que cela est l'exception et qu'à vue d'oeil, 9 lignes sur 10 sont correctes. Par ailleurs, si pour les lignes problématiques, je recupère la valeur de l'indice i, et que je parcours l'intérieur de la boucle manuellement, il recupère sans problème les informations. Il semblerait également que si je lui découpe le for(i in 1:545) en plusieurs for plus petits, cela fonctionne correctement.

Quelqu'un aurait-il une idée de ce qui gène? J'aurais aimé insérer mon script, mais je ne peux malheureusement pas le faire pour l'instant, etant au travail (je le pourrai en revanche ce soir).

Merci d'avance.