IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Calcul scientifique Python Discussion :

[pandas] Définir une var ayant 5 modalités selon une autre var date


Sujet :

Calcul scientifique Python

  1. #1
    Candidat au Club
    Femme Profil pro
    Statisticienne
    Inscrit en
    Août 2016
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 40
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Statisticienne

    Informations forums :
    Inscription : Août 2016
    Messages : 5
    Points : 3
    Points
    3
    Par défaut [pandas] Définir une var ayant 5 modalités selon une autre var date
    Bonjour à tous,

    J'ai un dataframe avec les var:
    JOUR = liste de jour du '2015-01-01' au '2015-12-31' en format string
    JOUR_dt = les mêmes mais convertis en datetime

    Je souhaiterais créer une var JOUR_TYPE qui prendrait les modalités:
    - 'PONT s'il s'agit d'un pont
    - 'VAC' si ce n'est pas un pont mais qu'on est en période de vacances scolaire
    - 'SAM' si ce n'est ni un pont ni un jour de vacance scolaire et que c'est un samedi
    - 'DIM' si ce n'est ni un pont ni un jour de vacance scolaire et que c'est un dimanche
    - 'OTHER' sinon


    J'ai réussit à créer une var 'PONT' qui prend les modalité 'PONT' ou other:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    data2['PONT'] =  data2['JOUR'].map(lambda x: 'PONT' if ((x>='2015-01-01' and x<='2015-01-04') 
                                          or (x>='2015-05-01' and x<='2015-05-03')
                                          or (x>='2015-05-08' and x<='2015-05-10')
                                          or (x>='2015-07-11' and x<='2015-07-14')
                                          or (x=='2015-11-11')
                                          or (x>='2015-04-04' and x<='2015-04-06')
                                          or (x>='2015-05-14' and x<='2015-05-17')
                                          or (x>='2015-05-23' and x<='2015-05-25')
                                          or (x>='2015-08-13' and x<='2015-08-15')
                                          or (x>='2015-12-25-04' and x<='2015-12-27')) else 'OTHER')
    Question1: si j'utilise JOUR_dt python me renvoie une erreur. Il me dit que je ne peux pas comparer un 'datetime' avec un 'str'.
    Du coup j'utilise JOUR. Mais est-ce que Python comprend quand même les opérateur ">=" entre 2 string? Est-ce qu'il comprends quand même que c'est des dates.....?

    Question2: j'ai définie de la même façon data2['VAC']. Ainsi que la var data2['WD'] = 0 si Lundi, 1 si Mardi, 2 si Mercredi.... 5 si Samedi et 6 si Dimanche

    Mais je ne parviens pas à créer ma var JOUR_TYPE....
    J'ai essayé:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    if data2['PONT'] == 'PONT':
        data2['JOUR_TYPE'] = 'PONT'
    elif data2['VAC'] == 'VAC':
        data2['JOUR_TYPE'] = 'VAC'
    elif data2['WD'] == 5:
        data2['JOUR_TYPE'] = 'SAM'
    elif data2['WD'] == 6:
        data2['JOUR_TYPE'] = 'DIM'
    else:
        data2['JOUR_TYPE'] = 'OTHER'

    Mais j'obtiens l'erreur:
    ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

    Est-ce que l'un de vous saurais m'aider...????
    Merci d'avance,
    Anne-Sophie

  2. #2
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2015
    Messages
    27
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Santé

    Informations forums :
    Inscription : Novembre 2015
    Messages : 27
    Points : 9
    Points
    9
    Par défaut
    Pour la question 1, votre problème vient du fait que vos valeurs de comparaison sont en string. Une solution serait d'utiliser la fonction strptime du module datetime, si vous tenez à travaillez en datetime.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    from datetime import datetime
    a=datetime.strptime('2015-05-03','%y-%m-%d')
    Votre code deviendrait, pour la première ligne:

    [CODE]
    data2['PONT'] = data2['JOUR'].map(lambda x: 'PONT' if ((x>=datetime.strptime('2015-01-01','%y-%m-%d') and x<=datetime.strptime('2015-01-04','%y-%m-%d')

    La comparaison devrait normalement être toujours bonne, mais votre code risque de devenir moins lisible.

    En ce qui concerne les opérations de comparaisons, les essais que j'ai fait semble me donner des résultats corrects avec des str, mais j'ai peur que ce ne soit pas généralisable et je n'ai trouvé aucune ressource parlant de l'utilisation de < pour la comparaison de str.

    Pour la question 2, je suis malheureusement dans l'incapacité de vous aider.

    Bonne continuation.

  3. #3
    Candidat au Club
    Femme Profil pro
    Statisticienne
    Inscrit en
    Août 2016
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 40
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Statisticienne

    Informations forums :
    Inscription : Août 2016
    Messages : 5
    Points : 3
    Points
    3
    Par défaut Merci
    Citation Envoyé par bobnolit Voir le message
    Pour la question 1, votre problème vient du fait que vos valeurs de comparaison sont en string. Une solution serait d'utiliser la fonction strptime du module datetime, si vous tenez à travaillez en datetime.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    from datetime import datetime
    a=datetime.strptime('2015-05-03','%y-%m-%d')
    Votre code deviendrait, pour la première ligne:

    [CODE]
    data2['PONT'] = data2['JOUR'].map(lambda x: 'PONT' if ((x>=datetime.strptime('2015-01-01','%y-%m-%d') and x<=datetime.strptime('2015-01-04','%y-%m-%d')

    La comparaison devrait normalement être toujours bonne, mais votre code risque de devenir moins lisible.

    En ce qui concerne les opérations de comparaisons, les essais que j'ai fait semble me donner des résultats corrects avec des str, mais j'ai peur que ce ne soit pas généralisable et je n'ai trouvé aucune ressource parlant de l'utilisation de < pour la comparaison de str.

    Pour la question 2, je suis malheureusement dans l'incapacité de vous aider.

    Bonne continuation.

    Bonjour bobnolit,

    Merci pour ta réponse!

    Pour la question 2 j'ai trouvé une solution.
    La variable PONT prends maintenant les valeur 0 ou 1 au lieu de "AUTRE" ou "PONT"
    La variable VAC prends maintenant les valeur 0 ou 2 au lieu de "AUTRE" ou "VAC"

    La variable TYPE_JOUR est la somme de PONT et VAC.
    Du coup si elle vaut 0 c'est "AUTRE"
    Si elle vaut 1 c'est un PONT
    Si elle vaut 2 c'est des VAC
    Si elle vaut 3 c'est un PONT pendant les VAC :-)

    Mais bon je vais laisser la discussion ouverte car je suis sure qu'il y a une solution moins bricolée pour le faire.... :-)

    Pour la question 1 j'ai aussi fait plusieurs essai et ça semble marcher alors je vais rester comme cela et croiser les doigts ;-)

    Anne--Sophie

Discussions similaires

  1. Supprimer modalités selon une variable
    Par krefkref dans le forum R
    Réponses: 2
    Dernier message: 01/07/2014, 09h03
  2. Réponses: 0
    Dernier message: 22/05/2014, 09h07
  3. Réponses: 0
    Dernier message: 21/05/2014, 17h08
  4. Masquer une partie du code HTML selon une variable ?
    Par ghohm dans le forum Servlets/JSP
    Réponses: 2
    Dernier message: 17/09/2008, 17h51
  5. Déclarer une fonction ayant 2 prototypes dans une DLL
    Par Jayceblaster dans le forum Delphi
    Réponses: 8
    Dernier message: 17/02/2007, 12h00

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo