IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Manipulation de structures de données (pandas) [Python 3.X]


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre émérite Avatar de Mathusalem
    Profil pro
    IT moa
    Inscrit en
    Décembre 2003
    Messages
    1 008
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : IT moa

    Informations forums :
    Inscription : Décembre 2003
    Messages : 1 008
    Par défaut Manipulation de structures de données (pandas)
    Hello,

    Je suis en train d'écrire mon premier code Panda depuis... 10 ans, et je bloque honteusement...

    1°) J'ai un web services qui me retourne un json, que je transforme en pandas avec json_normalize()

    2°) J'obtiens qqch comme ça :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    data = [('toto', [{'effect': 'delta', 'value': 0}, {'effect':'gamma', 'value': 1}]),
    		('tata', [{'effect': 'delta', 'value': 1}, {'effect':'gamma', 'value': 2}])
    		]
    Ma question :
    Dans un premier temps, je voudrais obtenir un dataframe avec le même nombre de ligne et 2 colonnes : une nommée "delta" et l'autre "gamma"

    Book delta gamma
    toto 0 1
    tata 1 2

    Ensuite dans un deuxième temps, je vais avoir un nombre d'effets variable en fonction des lignes : il me faut autant de colonnes qu'il y a d'effets différents et des NaN quand la donnée n'est pas dispo...

    Auriez une piste ou deux ?

    Merci !!

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 752
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 752
    Par défaut
    Salut,

    Citation Envoyé par Mathusalem Voir le message
    Auriez une piste ou deux ?
    Vous pouvez toujours transformer votre composite en liste de listes puis en faire un dataframe Pandas.
    Vous pouvez aussi essayer de lire le json directement avec Pandas via .read_json (vos données sont loin d'un tableau mais il y a tellement d'options à cette fonction que peut être que...).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Expert confirmé Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 041
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 041
    Par défaut
    salut,

    Citation Envoyé par Mathusalem Voir le message
    Je suis en train d'écrire mon premier code Panda depuis... 10 ans
    ou encore "le dernier code Pandas que j'ai écrit remonte à moi-même"


    tes données de base ressemblent à un truc dans ce goût là :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    [  (     'toto', [{
                'effect': 'delta',
                'value': 0
             }, {
                'effect': 'gamma',
                'value': 1
             }]
       ), (  'tata', [{
                'effect': 'delta',
                'value': 1
             }, {
                'effect': 'gamma',
                'value': 2
             }]
       )]
    ce pourrait être une bonne idée de se ramener à quelque chose de plus simple comme :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    {
       'toto': { 'delta': 0, 'gamma': 1 },
       'tata' : { 'delta': 1, 'gamma': 2 }
    }
    le tout devient ensuite facilement digeste pour .read_json(), exemple (à la volée) :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    >>> import pandas as pd
    >>> data = [('toto', [{'effect': 'delta', 'value': 0}, {'effect': 'gamma', 'value': 1}]), ('tata', [{'effect': 'delta', 'value': 1}, {'effect': 'gamma', 'value': 2}, {'effect': 'painpita', 'value': 5}])]
    >>> pd.read_json( pd.io.json.dumps( {
    ...    field[0]: {
    ...       column['effect']: column['value'] for column in field[1]
    ...    } for field in data
    ... }), orient='index')
     
          delta  gamma  painpita
    tata      1      2       5.0
    toto      0      1       NaN

  4. #4
    Membre émérite Avatar de Mathusalem
    Profil pro
    IT moa
    Inscrit en
    Décembre 2003
    Messages
    1 008
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : IT moa

    Informations forums :
    Inscription : Décembre 2003
    Messages : 1 008
    Par défaut
    Merci de vos réponses et de l'exemple de code.

    Je n'ai pas pensé à explorer le read_json, c'est trop bête .
    Je me voyais déjà transformer ma structure de données "à la main".

    Je vais chercher un peu et je reviens

  5. #5
    Membre émérite Avatar de Mathusalem
    Profil pro
    IT moa
    Inscrit en
    Décembre 2003
    Messages
    1 008
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : IT moa

    Informations forums :
    Inscription : Décembre 2003
    Messages : 1 008
    Par défaut
    J'ai réussi à m'en sortir.

    d'abord avec un
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    effects = json_normalize(data,'effects','book')
    A ce stade le df est propre mais j'ai toujours mes effets en ligne.

    Alors avec un
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    pd.pivot_table(effects,index='book',columns='effect', aggfunc=np.sum)
    j'obtiens exactement la structure attendue.

    Seul défaut : l'agrégation que j'aurais souhaité éviter, pour éviter tout effet de bord indésirable.
    Mais j'ai pas trouvé comment faire une pivot_table sans agrégation.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Manipulation de données de structure de donnée
    Par phaum dans le forum WinDev
    Réponses: 3
    Dernier message: 02/04/2016, 14h02
  2. Réponses: 9
    Dernier message: 05/04/2013, 11h40
  3. Structure des données en retour d'un DBExtract ?
    Par mikouts dans le forum XMLRAD
    Réponses: 4
    Dernier message: 24/01/2003, 15h15
  4. Structure de données de type "RECORD"
    Par chaours dans le forum VB 6 et antérieur
    Réponses: 2
    Dernier message: 30/09/2002, 17h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo