IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Regex pour créer fichier CSV


Sujet :

Langage PHP

  1. #1
    Candidat au Club
    Profil pro
    Inscrit en
    Février 2012
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2012
    Messages : 3
    Points : 4
    Points
    4
    Par défaut Regex pour créer fichier CSV
    Bonjour à tous,

    Pour me faciliter le boulot je souhaiterais faire d'un annuaire en ligne (celui de l'éducation nationale pour ne rien cacher) un joli fichier csv que je pourrais travailler dans excel.

    Pour ce faire j'ai "aspiré" cette annuaire en ligne avec un logiciel, rien d'illégal je vous rassure et me retrouve avec pour faire simple un dossier qui contient une page .html par établissement et chacune de ces pages des informations qui m'intéressent sur cette établissement (adresse, tel ...)

    J'ai donc plus de 60.000 pages html dont je souhaiterais extraire des informations.

    Cela se décompose donc en 3 axes pour lesquels je manque de compétence et pour lesquels je compte un peu (beaucoup) sur vos lumières :

    1- parcourir les fichiers html un par un, en fait ceux-ci sont écrits dans un multitude de sous-répertoires.

    2- la partie regex pure, à savoir capturer les contenus qui m'intéressent, je vous met juste après la structure des données et ce que je souhaite récupérer.

    3- l'écriture dans un fichier csv de tous ces résultats.


    Pour le contenu à capturer voici comment cela se présente, fort heureusement toujours de la même manière dans chaque page, j'ai mis en gras les valeurs qui m'intéressent avec des étoiles autour:

    Code html : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    <h2 class="titre-fiche-nom-etab">
    *Le nom de l'établissement*
    </h2>
    <div class="titre-fiche-type-etab">
    *Le type (école, collège...)*
    </div>
     
    <div class="annuaire-etablissement-infos">
    <p>
    *Si etablissement privé ou public* <br/>
    <br/>
    *numéro et nom de rue*<br/>*code postal* <span class="nom-commune">*ville*</span><br/>
    T&eacute;l. *04 74 38 40 77*&nbsp;/&nbsp;Fax. *04 74 38 08 65*<br/><br/>
    /* cela ne me sert pas <a href="/pid24327/formulaire-contacter-etablissement.html?code=0010002X">Contacter l'&eacute;tablissement</a><br/> fin de l'inutile*/ 
    <a target="_blank" href="*url du site*">Consulter le site de l'&eacute;tablissement</a><br/><a target="_blank" href="http://geolocalisation.onisep.fr/moncollege/01-ain/amberieu-en-bugey/college/college-saint-exupery.html">Localiser l'&eacute;tablissement</a><br/><br/>
    Code &eacute;tablissement : *1234567A* <br/></p>
    </div>

    Je ne sais pas trop dans quelle direction partir - quelles fonctions utiliser - à vote bon coeur !

  2. #2
    Expert éminent sénior

    Homme Profil pro
    Développeur Web
    Inscrit en
    Septembre 2010
    Messages
    5 383
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Puy de Dôme (Auvergne)

    Informations professionnelles :
    Activité : Développeur Web
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Septembre 2010
    Messages : 5 383
    Points : 10 411
    Points
    10 411
    Par défaut
    Alors dans l'ordre de ta demande tu peux utiliser les outils suivants :

    1 / RecursiveDirectoryIterator pour lister les fichiers de tous les répertoires et sous répertoires d'un dossier.
    2/ DOMDocument pour extraire des données choisies à partir d'un document html (plus adapté qu'un regex)
    3/ fputcsv pour créer un fichier csv a partir d'un tableau de résultat.

Discussions similaires

  1. Réponses: 3
    Dernier message: 19/05/2007, 17h19
  2. Réponses: 1
    Dernier message: 26/01/2007, 08h15
  3. [SQL] Problème exécution sql pour insertion fichier csv
    Par Kyvin dans le forum PHP & Base de données
    Réponses: 4
    Dernier message: 20/08/2006, 17h47
  4. [CSV] Détecter le séparateur pour les fichiers CSV
    Par JavaEli dans le forum Langage
    Réponses: 1
    Dernier message: 30/11/2005, 23h42
  5. [Excel] séparateur pour les fichiers csv
    Par drinkmilk dans le forum Excel
    Réponses: 2
    Dernier message: 27/08/2005, 14h21

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo