IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Calcul scientifique Python Discussion :

Somme-Moyenne glissante en multi facteur ?


Sujet :

Calcul scientifique Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2004
    Messages : 30
    Par défaut Somme-Moyenne glissante en multi facteur ?
    Bonjour ,

    j'ouvre un fil de discussion car avant de rentrer dans des lignes et faire perdre du temps process et me disant que je ne suis pas au point je préfère me retourner vers quelqu'un qui a beaucoup plus d'expérience que moi dans l'utilisation de Pandas.
    Suite à certaines limitations d'excel nombre de lignes et calculs de masses avec formules qui rament, je me suis tourné il y a un mois environ vers Python et l'ouverture que cela pouvait m'offrir en dehors ce que je peux faire pou mon travail.
    j'ai installé anaconda et je me suis intéressé il y a peu à Pandas.

    Mon "problème" est le suivant, sortir des statistiques de type percentiles, min, max, écart type... basés sur la somme et moyenne glissante sur 5 jours ouvrés, par exemple, des Volume et Value et par type d'instrument, en partant d'opérations d'opérations boursières de clients avec un horodatage de type Date-Heure.

    Après avoir effectué des group_by, un resample(1D) un peu de tris et nettoyage (dates vides) j'obtiens ce qu'il y a en pièce jointe.
    Je souhaiterai à partir de là calculer pour chaque 'ISIN' pour chaque 'Compte', tout en gardant l'information du type d'instrument (que j'utiliserai plus tard pour les stats), sa moyenne et sa somme glissante de 5 jours ouvrés, tenant compte qu'il y a des jours non traités.
    J'ai 3 index car je supposais que ce serait peut être plus simple pour faire les calculs mais faire un reset_index() ne me dérange pas du tout.

    Je partais n me disant je parcours les index un à un pour faire les calculs et je concatène tout dans une même base afin de faire mes statistiques, mais je sens bien que ca va mettre une éternité à tourner et j'imagine que tout doit pouvoir se résumer en 2/3 lignes maximum en connaissant bien l'outil...

    J'ose imaginer que l'utilisation de rolling doit être appliqué là dedans mais je ne vois pas du tout comment faire.

    En espérant avoir été clair, je vous remercie pour l'aide que vous pourrez m'apporter

    marso
    Images attachées Images attachées  

  2. #2
    Expert éminent
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 742
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 742
    Par défaut
    Salut,

    Vous avez les méthodes rolling_mean et rolling_sum (et des tas d'autres).

    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    30
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2004
    Messages : 30
    Par défaut
    Bonjour,

    Merci pour ta réponse. Oui tout à fait les fonctions mean et sum me conviennent avec rolling pour faire ce calcul. Mon soucis est que je dois effectuer un rolling.mean pour chaque jeu de 'Compte'/'ISIN' qui a ses propres dates, hors des dates identiques sont dans chaque jeu, par conséquent je ne pense pas pouvoir utiliser un rolling.mean aussi simplement.
    Ce que j'allais faire avec mes faibles connaissance, était d'isoler tous les couples 'Compte'/'Isin' avec date en index, de faire rolling.mean et rolling.sum, puis d'aggréger dans une unique table. Mais cela me semble hyper consommateur et qu'il existe peut être un moyen plus simple de le faire et sûrement moins consommateur.

    Merci

    Marso

Discussions similaires

  1. BO XIR2 Moyenne glissante
    Par mleonetti dans le forum Webi
    Réponses: 6
    Dernier message: 05/10/2009, 14h21
  2. [AC-2007] créer une moyenne glissante
    Par triaguae dans le forum Requêtes et SQL.
    Réponses: 6
    Dernier message: 28/04/2009, 12h54
  3. Requete Moyenne Glissante
    Par richardprod dans le forum Requêtes et SQL.
    Réponses: 1
    Dernier message: 01/06/2008, 22h04
  4. somme, moyenne etc
    Par penguin50 dans le forum Ruby on Rails
    Réponses: 2
    Dernier message: 07/04/2008, 11h15
  5. Moyenne Glissante et moyenne 2ⁿ
    Par webinfo dans le forum Algorithmes et structures de données
    Réponses: 6
    Dernier message: 04/04/2008, 13h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo