IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Dataframe : Keyerror mais variable existante


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Mai 2008
    Messages
    147
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2008
    Messages : 147
    Par défaut Dataframe : Keyerror mais variable existante
    Bonjour à tous,

    Je suis actuellement en train de tester le basculement d'un code que j'ai sous SAS sur Python.
    Pour cela, je travaille beaucoup avec des Dataframes.

    Sur l'un de mes dataframes, j'aimerais créer un index sur deux variables 'HHID' et 'TITID'.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    df.set_index(['HHID', 'TITID'], drop=True, append=False, inplace=True, verify_integrity=False)
    mais j'ai l'erreur suivante :
    Ce que je ne comprends pas car si je fais un export en csv de mon dataframe 'df' juste avant mon set_index, j'obtiens la sortie suivante :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    HHID,TITID,Var1,Var2
    48852293,101,1,60
    48852293,109,4,284
    [...]
    et donc avec ma variable présente dans le dataframe

    J'ai le même souci avec 'TITID' si je supprime 'HHID' de l'index...

    Quelqu'un peut-il m'aider?

    Merci d'avance!

  2. #2
    Membre confirmé
    Profil pro
    Inscrit en
    Mai 2008
    Messages
    147
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2008
    Messages : 147
    Par défaut
    Petite avancée : en tapant :
    J'obtiens :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    Index([u'Var1', u'Var2'], dtype='object')
    Malgré la présence des variables HHID et TTID dans mon fichier, python ne les trouve pas

    J'ai oublié de préciser dans mon premier post que j'apprends Python en autodidacte, donc un peu d'indulgence pour mes questions qui peuvent paraître noobesques!

  3. #3
    Expert confirmé

    Homme Profil pro
    Inscrit en
    Octobre 2008
    Messages
    4 307
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Octobre 2008
    Messages : 4 307
    Par défaut
    Salut,

    Qu'est-ce que "df" ?

    Si c'est une instance de classe, tu peux montrer le code de cette classe ? Ça faciliterait les choses.

  4. #4
    Membre confirmé
    Profil pro
    Inscrit en
    Mai 2008
    Messages
    147
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2008
    Messages : 147
    Par défaut
    df est mon dataframe créé de la façon suivante :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    df=df2.groupby(['HHID', 'TITID']).agg({'Var1': np.sum, 'Var2': np.size})
    où df2 est un autre dataframe contenant HHID, TITID, Var1 et Var2
    En sortie de ce code, j'obtiens df, avec, pour un HHID et un TITID, Var1 = somme des Var1 de df2, et Var2, le nombre de Var2.

    J'espère avoir été claire

  5. #5
    Expert confirmé

    Homme Profil pro
    Inscrit en
    Octobre 2008
    Messages
    4 307
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Octobre 2008
    Messages : 4 307
    Par défaut
    J'en avais peur.

    C'est quoi ce dataframe ? Du code ?

  6. #6
    Expert confirmé
    Avatar de tyrtamos
    Homme Profil pro
    Retraité
    Inscrit en
    Décembre 2007
    Messages
    4 486
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : Décembre 2007
    Messages : 4 486
    Billets dans le blog
    6
    Par défaut
    Bonjour,

    Est-ce que c'est le dataframe de pandas? (http://pandas.pydata.org/pandas-docs...DataFrame.html)

Discussions similaires

  1. Utiliser une variable existante dans une fonction
    Par Damien062 dans le forum Langage
    Réponses: 11
    Dernier message: 26/02/2015, 14h53
  2. Réutiliser variable existante dans try
    Par yasinfo dans le forum Général Java
    Réponses: 5
    Dernier message: 14/10/2014, 01h43
  3. [Débutant] Modifier une variable existante en tant que variable dynamique
    Par Sundark dans le forum C#
    Réponses: 5
    Dernier message: 05/02/2013, 17h34
  4. [MooTools] Détection d'une variable existante
    Par drick35 dans le forum Bibliothèques & Frameworks
    Réponses: 10
    Dernier message: 26/11/2012, 09h22
  5. Réponses: 27
    Dernier message: 27/09/2008, 22h56

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo