IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

Analyse fichier excel


Sujet :

Python

  1. #1
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2016
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2016
    Messages : 4
    Par défaut Analyse fichier excel
    Bonjour tout le monde !

    Je vous écris car je suis soumis à un problème. Dans le cadre d’un cours, je dois faire de l’analyse de données avec python. Sauf que je ne suis vraiment pas fort pour faire ça ! Voici le problème
    L’entreprise X cherche à trouver des informations pertinente avec ses données clients, trouvez le plus de métriques possible avec l’ensemble de données fournis
    Donc j’ai pu faire une analyse de base, mais vraiment de base !
    Donc pour cela, j'ai pensé à utiliser la librairie pandas qui apparement permets de gerer facilement de grand ensemble de données
    A l’aide de la fonction data.describe() ,j’ai pu obtenir des informations mais c’est très faible et ensuite j’ai trouvé la fonction :
    data.groupby([Type,Magasin,Periode]).aggregate(np.mean)).
    Grâce à cette fonction, j’obtiens des moyennes sur la quantité en fonction du type de produit, le magasin et la periode. C’est vraiment très fort !

    Donc voilà, j’ai peu de choses finalement et je sais qu’il m’en faut plus. J’essaie de regarder ce que je peux faire mais voilà, je ne mis connait pas, je sais juste ce qu’il faut pour coder un peux en python mais c’est tout… Quelqu’un pourrait-il m’aider ? Je sais que c’est beaucoup demandé mais je suis sûr qu’une âme charitable super skillé en serait capable
    En gros, il me faut plus d’information sur ce tableau, je ne sais pas trop ce qu’il est possible d’en tirer mais je me disais qu’on pouvait obtenir la variable qui est la plus importante hors quantité ?
    Bref, je suis ouvert à toute proposition tout en continuant à chercher de mon côté

    Merci d’avance !
    Yderien
    Fichiers attachés Fichiers attachés

  2. #2
    Membre Expert
    Homme Profil pro
    Enseignant
    Inscrit en
    Juin 2013
    Messages
    1 617
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Enseignant
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2013
    Messages : 1 617
    Par défaut
    Chacun son boulot mais quelqu'un d'inactif ou de motivé pourra peut-être t'aider.
    De mon côté, pour traiter ce genre de fichier, je le convertis en fichier .csv avec oppenoffice avec le ";" comme séparateur (pour éviter les problèmes de virgule).
    Ensuite, je traite les données avec la bibliothèque "csv".
    Bon courage.

  3. #3
    Expert confirmé
    Avatar de tyrtamos
    Homme Profil pro
    Retraité
    Inscrit en
    Décembre 2007
    Messages
    4 486
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : Décembre 2007
    Messages : 4 486
    Billets dans le blog
    6
    Par défaut
    Bonjour,

    C'est ce que je fais aussi: je passe par l'intermédiaire d'un fichier csv. Sous Excel, on fait "enregistrer sous", puis on choisit le format CSV avec un ';'.

    Si on veut que Python lise directement un fichier Excel, il existe une solution ici: http://www.python-excel.org/, mais je ne l'ai jamais utilisée.

  4. #4
    Membre émérite

    Homme Profil pro
    Ingénieur
    Inscrit en
    Août 2010
    Messages
    662
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Août 2010
    Messages : 662
    Par défaut
    Salut,
    Citation Envoyé par tyrtamos Voir le message
    Si on veut que Python lise directement un fichier Excel, il existe une solution ici: http://www.python-excel.org/
    Partir sur l'utilisation de Pandas est une très bonne idée. Couplé à la bibliothèque seaborn on peut faire rapidement et simplement des analyses vraiment chiadées. Pandas propose nativement une méthode pour extraire des données d'Excel. Dans le case de l'exemple fourni:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    import pandas as pd
    fname = 'Exercice 1.xlsx'
    data = pd.read_excel(fname, sheetname='Feuil1', parse_cols='A:F')
    Pour ce qui est de l'analyse du contenu, et bien je ne pense pas que l'on puisse être d'une quelque aide, si ce n'est sur la réalisation technique. C'est à toi de voir ce qui peut t'intéresser: des données statistiques simple (via describe()), produire des histogrammes des quantités de produits vendus, comptabiliser le nombre de ventes par type de produit, la dépense moyenne selon la période, etc... On peut calculer tout et n'importe quoi. L'important c'est ce que l'on veut montrer et là c'est à toi de jouer.

    J

  5. #5
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2016
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2016
    Messages : 4
    Par défaut
    Bonjour,

    Merci à tous de vos réponse ça me fait vraiment plaisir de voir autant de gens aussi sympas

    Alors, pour l’extraction de fichier, justement j’utilise la librairie pandas qui a un outil :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    import pandas as pd
    data = pd.read_csv('Matrice-client-Colisweb.csv', sep=';')
    Ensuite, je place une clé (si j’ai bien compris) avec la commande suivante :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    data.set_index(['client'], inplace=True)
    Et voici quelques lignes que j’ai écrite pour avoir des informations, des métriques

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    print(data.groupby(['Type','Magasin','Periode']).aggregate(np.mean))
    print(data.groupby(['Type']).aggregate(np.mean))
    print(data.groupby(['Magasin']).aggregate(np.mean))
    print(data.groupby(['Periode']).aggregate(np.mean))
    print(data.groupby(['panier moyen']).aggregate(np.mean))

    Donc avec cette fonction, j’obtiens directement des moyennes en fonction de la variable que j’ai choisi.
    Maintenant veux tracer des histogrammes à partir de ces variables, mais la… je coince…

    Je trace l'histograme que je veux avec la fonction suivante :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    CAPM=(data.groupby(['Panier Moyen']).aggregate(np.mean))
    CAPM.hist()
    ou la fonction CAPM est une colonne de mon dataframe. Du coup, j'essaie de rendre ça potable, afficher les noms, mettre de la couleur, mettre une légende... Comment fait on ? Je regarde dans l'aide mais je comprends pas...

    Donc voila, je vais regarder ce que je peux faire avec la bibliothèque seaborn, j’ai jetté un œil, et ça a l’air terrible quand même.

    En tout cas merci beaucoup pour vos réponses !
    Yderien

Discussions similaires

  1. Analyser fichier Excel xls
    Par remail dans le forum Bibliothèques et frameworks
    Réponses: 1
    Dernier message: 17/02/2010, 16h46
  2. Analyser fichier Excel automatiquement
    Par NTeeN dans le forum Développement de jobs
    Réponses: 8
    Dernier message: 25/05/2009, 10h48
  3. analyse d'un fichier excel
    Par jpenja dans le forum Macros et VBA Excel
    Réponses: 2
    Dernier message: 24/06/2008, 16h49
  4. [Excel] Analyse de fichiers Excel
    Par DeFnoX dans le forum Bibliothèques et frameworks
    Réponses: 4
    Dernier message: 05/09/2007, 11h54

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo