IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

CSV en php et exploitation des données


Sujet :

Langage PHP

  1. #1
    Futur Membre du Club Avatar de randoo88
    Homme Profil pro
    Webmaster
    Inscrit en
    Août 2018
    Messages
    8
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Vosges (Lorraine)

    Informations professionnelles :
    Activité : Webmaster
    Secteur : Santé

    Informations forums :
    Inscription : Août 2018
    Messages : 8
    Points : 7
    Points
    7
    Par défaut CSV en php et exploitation des données
    Bonjour à tous.

    Voilà, je veux pouvoir intégrer mon relevé de compte en CSV dans une base Mysql. Donc j'ai généré un fichier CSV sur le site de ma banque, j'utilise la fonction fgetscsv pour mettre le contenu de mon fichier dans un tableau php.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    <?PHP
    function read($csv){
        $file = fopen($csv, 'r');
        while (!feof($file) ) {
            $line[] = fgetcsv($file, 1024, ";");
        }
        fclose($file);
        return $line;
    }
    // Définir le chemin d'accès au fichier CSV
    $csv = 'fichier.csv';
    $csv = read($csv);
    echo '<pre>';
    print_r($csv);
    echo '</pre>';
    ?>
    Jusque là, tout est ok, j'obtiens ca

    Array (
    [0] => Array
    (
    [0] => Compte
    [1] => Date de comptabilisation
    [2] => Date op�ration
    [3] => Libell�
    [4] => R�f�rence
    [5] => Date valeur
    [6] => Montant
    )

    [1] => Array
    (
    [0] => 002XXXXXXXX
    [1] => 12/01/2022
    [2] => 12/01/2022
    [3] => CHEQUE XXXXXXX XXXXX XXXXX
    [4] => XXXXXX
    [5] => 12/01/2022
    [6] => -220,00
    [7] =>
    )

    [2] => Array
    (
    [0] => XXXXXXX
    [1] => 12/01/2022
    [2] => 12/01/2022
    [3] => VIR M GXXXXXXX SXXXXXXX XXXXXXXX
    [4] => XXXXXX
    [5] => 12/01/2022
    [6] => -179,97
    [7] =>
    )
    Ma question est maintenant, comment je fais pour pouvoir exploiter ces infos dans des variables. L'idée est qu'ensuite, je puisse indiquer que telle valeur d'une colonne de ce tableau va dans telle colonne de ma base Mysql et ensuite, je verifierai si je l'ai déjà pour eviter les doublon, et l'enregistré ou non.
    Ces dernières parties, le traitement avec la base Mysql, il n'y a pas de souci, c'est plutôt comment traiter ce tableau qui me bloque.

    Merci d'avance pour vos réponses
    Cordialement
    Guillaume

  2. #2
    Expert éminent
    Avatar de Séb.
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    5 091
    Détails du profil
    Informations personnelles :
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mars 2005
    Messages : 5 091
    Points : 8 194
    Points
    8 194
    Billets dans le blog
    17
    Par défaut
    D'abord ta fonction :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    function read($csv){
        $file = fopen($csv, 'r');
        while (!feof($file) ) {
            $line[] = fgetcsv($file, 1024, ";");
        }
        fclose($file);
        return $line;
    }
    feof() est vraiment casse-gueule, je te conseille de ne pas l'utiliser, voir les comms de la doc
    Pourquoi donner une limite de longueur à ta ligne ? Que se passe-t-il si ta ligne fait plus de 1024 caractères ? Utilise plutôt 0 pour que ton CSV soit correctement lu, enregistrement par enregistrement, quelque soit sa longueur

    J'aime bien lire la 1re ligne, la mettre dans $header
    Et ensuite pour chaque ligne du fichier faire un $rows = array_combine($header, $line);, ça permet d'obtenir un tableau de tableaux associatifs plus simples à utiliser, plus parlant :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    Array => (
        [0] => Array (
            [Compte] => 002XXXXXXXX
            [Date de comptabilisation] => 12/01/2022
            [Date opération] => 12/01/2022
            [Libellé] => CHEQUE XXXXXXX XXXXX XXXXX
            [Référence] => XXXXXX
            [Date valeur] => 12/01/2022
            [Montant] => -220,00
        )
        ...
    )
    Ma question est maintenant, comment je fais pour pouvoir exploiter ces infos dans des variables.
    Il faut boucler sur le retour de ta fonction, et exploiter chaque enregistrement : convertir les dates d/m/Y en Y-m-d (ou faire ça plus tard avec MySQL STR_TO_DATE()), et décider si tu fais un INSERT ou pas.
    Je suppose que le CSV ne fournit pas d'identifiant unique d'opération, la difficulté sera donc d'avoir une bonne clef primaire et d'éviter les doublons.

    Ces dernières parties, le traitement avec la base Mysql, il n'y a pas de souci, c'est plutôt comment traiter ce tableau qui me bloque.
    Quoi exactement ? Donne-nous tes tentatives.
    Un problème exposé clairement est déjà à moitié résolu
    Keep It Smart and Simple

  3. #3
    Expert confirmé
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 369
    Points : 5 734
    Points
    5 734
    Billets dans le blog
    1
    Par défaut
    Bonsoir,

    je me permets d'intervenir car même si je suis loin d'avoir la compétence de certains (comme séb.), ça fait plus de 2 ans que je travaille sur une appli qui justement a pour but de lire des fichiers CSV puis d'insérer en bdd les lignes correctes au vue de leur analyse et donc j'ai levé un loup que tu vas probablement rencontrer : les tables SQL vont devenir grosses et faire des SELECT dessus va devenir très chronophage. La solution est de stocker toutes les données dans un tableau et ce tableau aura comme nombre de colonnes la somme du nombre de colonnes de chacune de tes tables SQL (y compris l'id car ainsi pour retrouver un id, juste un array_search à la place d'un très chronophage SELECT).
    Il vaut mieux viser la perfection et la manquer que viser l'imperfection et l'atteindre. - Bertrand Russell

    Si la discussion est résolue, merci de cliquer sur le bouton

  4. #4
    Expert éminent
    Avatar de Séb.
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    5 091
    Détails du profil
    Informations personnelles :
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mars 2005
    Messages : 5 091
    Points : 8 194
    Points
    8 194
    Billets dans le blog
    17
    Par défaut
    Faut pas exagérer sur le SELECT "très chronophage"

    Même sur une table de plusieurs gigas, si tes index et ta requête sont bons un SELECT prend 0,05 sec. a être exécuté
    Un problème exposé clairement est déjà à moitié résolu
    Keep It Smart and Simple

  5. #5
    Expert confirmé
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 369
    Points : 5 734
    Points
    5 734
    Billets dans le blog
    1
    Par défaut
    Là, tu m'intéresses. Peux-tu préciser si tes index et ta requête sont bons ? Dans mon cas, c'est certainement pas le cas, vu le temps que ça prend. Cela dit, même 0,05 sec par select, si on traite un fichier CSV de 100 000 lignes, ça fait 0,05x100000 = 5000 secondes = 1h23....(si on fait un select par ligne et moi j'ai pas compté mais il doit y en avoir plusieurs dizaines par lignes)
    Il vaut mieux viser la perfection et la manquer que viser l'imperfection et l'atteindre. - Bertrand Russell

    Si la discussion est résolue, merci de cliquer sur le bouton

  6. #6
    Expert éminent
    Avatar de Séb.
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    5 091
    Détails du profil
    Informations personnelles :
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mars 2005
    Messages : 5 091
    Points : 8 194
    Points
    8 194
    Billets dans le blog
    17
    Par défaut
    100 000 SELECT à exécuter => Tu fais un PREPARE et les délais baissent encore
    Pour optimiser les SELECT => https://dev.mysql.com/doc/refman/8.0...imization.html (23 articles)

    Bon, sinon je crois qu'on est loin du cas de randoo88 qui ne gère pas une multinationale, il me semble
    Un problème exposé clairement est déjà à moitié résolu
    Keep It Smart and Simple

  7. #7
    Futur Membre du Club Avatar de randoo88
    Homme Profil pro
    Webmaster
    Inscrit en
    Août 2018
    Messages
    8
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Vosges (Lorraine)

    Informations professionnelles :
    Activité : Webmaster
    Secteur : Santé

    Informations forums :
    Inscription : Août 2018
    Messages : 8
    Points : 7
    Points
    7
    Par défaut
    Bonjour à tous,

    Merci pour vos réponses.

    Citation Envoyé par Séb. Voir le message
    feof() est vraiment casse-gueule, je te conseille de ne pas l'utiliser, voir les comms de la doc
    Pourquoi donner une limite de longueur à ta ligne ? Que se passe-t-il si ta ligne fait plus de 1024 caractères ? Utilise plutôt 0 pour que ton CSV soit correctement lu, enregistrement par enregistrement, quelque soit sa longueur
    J'avoue que c'est un bout de code que j'ai trouvé sur Internet et vu que ca marche, je n'ai pas été cherché plus loin.

    J'aime bien lire la 1re ligne, la mettre dans $header
    Et ensuite pour chaque ligne du fichier faire un $rows = array_combine($header, $line);, ça permet d'obtenir un tableau de tableaux associatifs plus simples à utiliser, plus parlant :
    Je vais faire ca, en effet, c'est plus présentable.


    Il faut boucler sur le retour de ta fonction, et exploiter chaque enregistrement : convertir les dates d/m/Y en Y-m-d (ou faire ça plus tard avec MySQL STR_TO_DATE()), et décider si tu fais un INSERT ou pas.
    Je suppose que le CSV ne fournit pas d'identifiant unique d'opération, la difficulté sera donc d'avoir une bonne clef primaire et d'éviter les doublons.


    Quoi exactement ? Donne-nous tes tentatives.
    Donc, j'utilise FOR pour faire un boucle, c'est ca ? En fait, c'est là que je rame un peu.

    Convertir les dates, ca, pas de souci, j'ai déjà traité ce genre de pb.
    Pour éviter les doublons, il y a quand même la référence et je pensais faire une recherche avec plusieurs critères pour être sur (date, montant et référence). Sachant bien sur que ma table contient ensuite un ID unique.

    Citation Envoyé par Séb. Voir le message
    100 000 SELECT à exécuter => Tu fais un PREPARE et les délais baissent encore
    Pour optimiser les SELECT => https://dev.mysql.com/doc/refman/8.0...imization.html (23 articles)

    Bon, sinon je crois qu'on est loin du cas de randoo88 qui ne gère pas une multinationale, il me semble
    C'est ca, c'est juste pour importer un fichier CSV dans ma compta d'une petite association, ca fait que quelques lignes à chaque fois. En fait, ca a 2 buts, m'amuser à programmer l'importation du CSV et remplir automatiquement un partie de ma table MySQL.

    Et je n'importe pas directement mon CSV dans ma table, parce que bien entendu, les colonnes ne correspondent pas. Donc, en fait, je cherche un moyen pour importer mon CSV, identifier les colonnes, vérifier que je n'ai pas déjà la ligne et l'enregistrer dans ma table.

  8. #8
    Expert éminent
    Avatar de Séb.
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    5 091
    Détails du profil
    Informations personnelles :
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mars 2005
    Messages : 5 091
    Points : 8 194
    Points
    8 194
    Billets dans le blog
    17
    Par défaut
    Donc, j'utilise FOR pour faire un boucle, c'est ca ? En fait, c'est là que je rame un peu.
    Tu peux faire un foreach() pour parcourir ton tableau enregistrement par enregistrement.
    Un problème exposé clairement est déjà à moitié résolu
    Keep It Smart and Simple

  9. #9
    Expert confirmé
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 369
    Points : 5 734
    Points
    5 734
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par randoo88 Voir le message
    Je vais faire ca, en effet, c'est plus présentable.
    En effet, voici une partie de mon code :
    Code php : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    while (($line_csv = fgetcsv(CSVParser::getHandle(), $buffer, CSVParser::getSeparator(),
            CSVParser::getEnclosure(),"")) !== false) {
        ...
    /*on met les lignes dans la propriété  $this->data
    */
            $this->data = array_combine(CSVParser::getHeader(), $this->data);
            }
    Il vaut mieux viser la perfection et la manquer que viser l'imperfection et l'atteindre. - Bertrand Russell

    Si la discussion est résolue, merci de cliquer sur le bouton

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Exploitation des données Ajax and php
    Par shingé dans le forum AJAX
    Réponses: 1
    Dernier message: 09/05/2018, 13h46
  2. Réponses: 4
    Dernier message: 12/06/2006, 17h05
  3. [PHP-JS] afficher des donnée php dans popup javascript
    Par speedylol dans le forum Général JavaScript
    Réponses: 4
    Dernier message: 05/04/2006, 17h05
  4. [PHP-JS] Traitement des données dans une autre page...
    Par sekiryou dans le forum Langage
    Réponses: 5
    Dernier message: 04/03/2006, 09h06
  5. [PHP-JS] validation des données
    Par emma des bois dans le forum Langage
    Réponses: 6
    Dernier message: 10/02/2006, 15h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo