IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Calcul scientifique Python Discussion :

Pandas Apply DataFrme [Python 3.X]


Sujet :

Calcul scientifique Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2004
    Messages : 30
    Par défaut Pandas Apply DataFrme
    Bonjour,
    je débute en Pandas et j'essaye d'appliquer à priori un calcul assez basique dans une dataframe.
    Dans ma DataFrame je récupère plusieurs ordres 'boursiers' avec les fourchettes de marchés en face.
    Je souhaite calculer l'impact de l'ordre en fonction de son sens.
    Je suis donc parti sur un calcul assez basique pour commencer et 'me tester' tel que le suivant :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
     
    def calc_imp(side, price, bidprice,askprice):
        print(side)
        if(side == 'Buy'):
            return price/askprice-1
        else:
            return price/bidprice-1
     
    df.Side.apply(calc_imp, args =(df.Price, df['Bid Price'], df['Ask Price'],))
    Le shape de la source fait 8265x32.
    Or cela me retourne une matrice avec à priori des calculs croisés dans tous les sens et un shape de 8265x8265.
    Alors qeu ej souhaiterai récupérer une série afin de l'inclure dans cette même DataFrame.
    Manifestement je ne dois pas réussir à avoir le déclique avec apply...

    Pourriez vous m'aider à y voir plus claire svp ?

    Marso

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 741
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 741
    Par défaut
    Salut,

    Citation Envoyé par marso Voir le message
    Pourriez vous m'aider à y voir plus claire svp ?
    Peut être qu'il faudrait commencer avec un Dataframe de quelques lignes et les colonnes significatives pour avoir de quoi reproduire le problème rencontré avec un code complet - le Dataframe pouvant être définit dans le programme.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2004
    Messages : 30
    Par défaut
    Sur un exemple d'échantillon limité :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
     
    def calc_imp(side, price, bidprice,askprice):
         if(side == 'Buy'):
            return price/askprice-1
         else:
            return price/bidprice-1
     
    df = pd.DataFrame( {'Side':['Buy','Buy','Sell','Sell'],
                        'Price' : [10.5, 12 , 7 , 9],
                        'Bid Price': [10.4,11.75,7.1,9.05],
                        'Ask Price': [10.45,11.9,7.15,9.10]} )
     
    df.Side.apply(calc_imp, args =(df.Price, df['Bid Price'], df['Ask Price'],))
    J'obtiens ceci :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
            0	        1	         2	         3
    0	0.004785	0.008403	-0.020979	-0.010989
    1	0.004785	0.008403	-0.020979	-0.010989
    2	0.009615	0.021277	-0.014085	-0.005525
    3	0.009615	0.021277	-0.014085	-0.005525
    Alors que je m'attendais plutôt à cela :
    0 0.004785
    1 0.008403
    2 -0.014085
    3 -0.005525

    Je te remercie pour ton aide.

    Marso

  4. #4
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 741
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 741
    Par défaut
    Salut,

    Je ne comprends pas ce que vous avez cherché à faire via:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
        df.Side.apply(calc_imp, args =(df.Price, df['Bid Price'], df['Ask Price'],))
    Quand vous avez un problème de ce genre, il faut commencer par regarder ce que reçoit la fonction appelée:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    def calc_imp(values):
         print (values)
         return 1
     
    ....
    df.apply(calc_imp)
    Ce qui va afficher des lignes. Si on veut parcourir le truc "par colonnes", ce sera avec "axis": df.apply(calc_imp, axis=1).

    Je vous laisse terminer tout seul.

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2004
    Messages : 30
    Par défaut
    Je voulais entièrement rester sous pandas sans importer numpy. Bon manifestement le traitement sous numpy est bien plus efficace...
    En revanche Apply semble pouvoir gérer des cas plus complexes, donc à arbitrer.
    J'ai modiofié ainsi, les 3 options abouttisant au même résultat attendu
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    def calc_imp(df):
      if(df['Side'] == 'Buy'):
        return df.Price/df['Ask Price']-1
      else:
        return df.Price/df['Bid Price']-1
     
    #Option 1
    df['Impact'] = df.apply(calc_imp, axis = 1)
    #Option 2
    df['Impact'] = np.where(df.Side == 'Buy', df.Price/df['Ask Price']-1, df.Price/df['Bid Price']-1)
    #Option 3
    df['Impact'] = np.select([df.Side == 'Buy', df.Side == 'Sell'],[df.Price/df['Ask Price']-1,df.Price/df['Bid Price']-1],default=0)
    Résultat :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    	Side	Price	Bid Price	Ask Price	Impact
    0	Buy	10.5	10.40	        10.45	     0.004785
    1	Buy	12.0	11.75	        11.90	     0.008403
    2	Sell	7.0	7.10	        7.15	        -0.014085
    3	Sell	9.0	9.05	        9.10	        -0.005525

  6. #6
    Expert confirmé Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 041
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 041
    Par défaut
    salut,

    Citation Envoyé par marso Voir le message
    Je voulais entièrement rester sous pandas sans importer numpy
    Pandas importe directement Numpy, du coup tu peux utiliser pd.np.where() par exemple

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 1
    Dernier message: 25/01/2019, 11h14
  2. [Appli][Autre language]dll-contenant form
    Par flash dans le forum Langage
    Réponses: 6
    Dernier message: 20/09/2002, 14h18
  3. Réponses: 1
    Dernier message: 22/08/2002, 17h00
  4. [Kylix] [cgi] pb déploiement appli avec connexion MySQL [rés
    Par Nepomiachty Olivier dans le forum EDI
    Réponses: 3
    Dernier message: 06/08/2002, 20h09
  5. enregistrer dans un fichier avec une appli mdi
    Par ferrari dans le forum C++Builder
    Réponses: 4
    Dernier message: 05/05/2002, 15h17

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo