IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

échantillonnage sur la valeur mini


Sujet :

Python

  1. #1
    Candidat au Club
    Homme Profil pro
    Technicien réseau
    Inscrit en
    Novembre 2020
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Pas de Calais (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Technicien réseau
    Secteur : Service public

    Informations forums :
    Inscription : Novembre 2020
    Messages : 2
    Points : 2
    Points
    2
    Par défaut échantillonnage sur la valeur mini
    Bonjour,

    j'aimerai dans un DataFrame(pandas) (beaucoup plus grand que l’exemple) ,dans une colonne trouvé le minimum par lot de 5 valeur (une sorte échantillonnage sur la valeur mini)

    je ne trouve pas de solution ,merci de votre aide

    volume_nappe_min_hor valeur_final
    2019-02-01 236.182 236.182
    2019-02-02 2169.59
    2019-02-03 831.993
    2019-02-04 358.897
    2019-02-05 318.064
    2019-02-06 284.661 284.6
    2019-02-07 501.12
    2019-02-08 367.595
    2019-02-09 306.555
    2019-02-10 838.952
    2019-02-11 390.737
    2019-02-12 326.779
    2019-02-13 243.793
    2019-02-14 183.42 183.42
    2019-02-15 241.558
    2019-02-16 221.979
    2019-02-17 169.057
    2019-02-18 228.134
    2019-02-19 180.55
    2019-02-20 138.609 138.609
    2019-02-21 142.635
    2019-02-22 122.321
    2019-02-23 124.902
    2019-02-24 112.064
    2019-02-25 101.883 101.883
    2019-02-26 122.155
    2019-02-27 122.149
    2019-02-28 101.846

  2. #2
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 689
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 689
    Points : 30 983
    Points
    30 983
    Billets dans le blog
    1
    Par défaut
    Bonjour
    Qu'entends-tu par "lot de 5" ? Est-ce le minimum de chaque groupe de 5 lignes ?

    Voici par exemple comment obtenir le minimum de chaque "5 nombres" dans un tableau
    Code python : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    tab=tuple(range(17))
    print(tuple(min(tab[i:i+5]) for i in range(0, len(tab), 5)))
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  3. #3
    Candidat au Club
    Homme Profil pro
    Technicien réseau
    Inscrit en
    Novembre 2020
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Pas de Calais (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Technicien réseau
    Secteur : Service public

    Informations forums :
    Inscription : Novembre 2020
    Messages : 2
    Points : 2
    Points
    2
    Par défaut
    bonjour,

    Je n'ai pas été très claire.

    dans la colonne volume_nappe_min_hor par série de 5 lignes on chercher la valeur minimum que l'on met dans la colonne valeur final

    date volume_nappe_min_hor valeur_final
    2019-02-01 236.182 236.182
    2019-02-02 2169.59
    2019-02-03 831.993
    2019-02-04 358.897
    2019-02-05 318.064
    --------------- -------------------------------- ------------------
    2019-02-06 284.661 284.6
    2019-02-07 501.12
    2019-02-08 367.595
    2019-02-09 306.555
    2019-02-10 838.952
    --------------- -------------------------------- ------------------
    2019-02-11 390.737
    2019-02-12 326.779
    2019-02-13 243.793
    2019-02-14 183.42 183.42
    2019-02-15 241.558

  4. #4
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 689
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 689
    Points : 30 983
    Points
    30 983
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par pans2020 Voir le message
    dans la colonne volume_nappe_min_hor par série de 5 lignes on chercher la valeur minimum que l'on met dans la colonne valeur final
    Ok. Cela présuppose donc que au départ, pour toutes les lignes, la 3° colonne n'existe pas.
    Il faut donc
    1. lire les lignes par groupe de 5 et les spliter en colonnes
    2. récupérer le min de la 2° colonne
    3. réécrire ces lignes en rajoutant ce min pour la ligne contenant ce min en 3° colonne

    Et recommencer tant qu'il y a des lignes.
    Code python : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    lignes=[
    	"2019-02-01 236.182",
    	"2019-02-02 2169.59",
    	"2019-02-03 831.993",
    	"2019-02-04 358.897",
    	"2019-02-05 318.064",
    	"2019-02-06 284.661",
    	"2019-02-07 501.12",
    	"2019-02-08 367.595",
    	"2019-02-09 306.555",
    	"2019-02-10 838.952",
    	"2019-02-11 390.737",
    	"2019-02-12 326.779",
    	"2019-02-13 243.793",
    	"2019-02-14 183.42",
    	"2019-02-15 241.558",
    ]
    data=[[x[0], float(x[1])] for x in (l.split() for l in lignes)]
     
    for i in range(0, len(data), 5):
    	m=min(x[1] for x in data[i:i+5])
    	for d in data[i:i+5]:
    		if d[1] == m:
    			d.append(m)
    			break
    		# if
    	# for
    # for
     
    for d in data: print(d)
    Voilà. Quand on décrit clairement les étapes, c'est toujours plus facile à coder ensuite...
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  5. #5
    Expert éminent Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 035
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 035
    Points : 8 400
    Points
    8 400
    Par défaut
    salut,

    perso j'aurai tendance à faire un truc dans ce genre là :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    import pandas as pd
     
    timestamps = ['2019-02-01', '2019-02-02', '2019-02-03', '2019-02-04', '2019-02-05', '2019-02-06', '2019-02-07', '2019-02-08', '2019-02-09', '2019-02-10', '2019-02-11', '2019-02-12', '2019-02-13', '2019-02-14', '2019-02-15', '2019-02-16', '2019-02-17', '2019-02-18', '2019-02-19', '2019-02-20', '2019-02-21', '2019-02-22', '2019-02-23', '2019-02-24', '2019-02-25', '2019-02-26', '2019-02-27', '2019-02-28']
    datas = [236.182, 2169.59, 831.993, 358.897, 318.064, 284.661, 501.12, 367.595, 306.555, 838.952, 390.737, 326.779, 243.793, 183.42, 241.558, 221.979, 169.057, 228.134, 180.55, 138.609, 142.635, 122.321, 124.902, 112.064, 101.883, 122.155, 122.149, 101.846]
     
    df = pd.DataFrame({'volume_nappe_min_hor' : datas}, index=pd.to_datetime(timestamps))
    df['valeur_final'] = df.groupby(pd.np.arange(len(df))//5).transform('min')
    et le résultat :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
                volume_nappe_min_hor  valeur_final
    2019-02-01               236.182       236.182
    2019-02-02              2169.590       236.182
    2019-02-03               831.993       236.182
    2019-02-04               358.897       236.182
    2019-02-05               318.064       236.182
    2019-02-06               284.661       284.661
    2019-02-07               501.120       284.661
    2019-02-08               367.595       284.661
    2019-02-09               306.555       284.661
    2019-02-10               838.952       284.661
    2019-02-11               390.737       183.420
    2019-02-12               326.779       183.420
    2019-02-13               243.793       183.420
    2019-02-14               183.420       183.420
    2019-02-15               241.558       183.420
    2019-02-16               221.979       138.609
    2019-02-17               169.057       138.609
    2019-02-18               228.134       138.609
    2019-02-19               180.550       138.609
    2019-02-20               138.609       138.609
    2019-02-21               142.635       101.883
    2019-02-22               122.321       101.883
    2019-02-23               124.902       101.883
    2019-02-24               112.064       101.883
    2019-02-25               101.883       101.883
    2019-02-26               122.155       101.846
    2019-02-27               122.149       101.846
    2019-02-28               101.846       101.846

  6. #6
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 689
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 689
    Points : 30 983
    Points
    30 983
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par BufferBob Voir le message
    perso j'aurai tendance à faire un truc dans ce genre là ... et le résultat
    Ben oui mais... ce résultat (tout magnifique qu'il soit avec tes formules pandas auxquelle je ne pige absolument rien ) ne correspond pas à l'exemple montré par le PO (lequel ne place le min que sur la ligne contenant ce min)...
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  7. #7
    Expert éminent Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 035
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 035
    Points : 8 400
    Points
    8 400
    Par défaut
    Citation Envoyé par Sve@r Voir le message
    (...) formules pandas (...)
    oui, ça semble faire partie des contraintes également d'après ce qu'indique le PO dans son premier post

    Citation Envoyé par Sve@r Voir le message
    (...) ne place le min que sur la ligne contenant ce min (...)
    ah oui tiens, j'avais pas fait gaffe à ça, bien vu.

    mais je me demande si ça a vraiment du sens, et même si on peut vraiment le faire à part en remplissant avec des NaN le reste de la colonne... à voir si quelqu'un peut proposer une solution plus exacte.

  8. #8
    Expert éminent sénior
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 689
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 689
    Points : 30 983
    Points
    30 983
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par BufferBob Voir le message
    oui, ça semble faire partie des contraintes également d'après ce qu'indique le PO dans son premier post
    Mouais je sais. Mais comme je connais pas Panda j'ai fait sans. Ensuite nul doute que le PO, voyant la technique utilisée, pourra très certainement la retraduire en pd. Sinon ben il pourra toujours le faire en méthode classique.
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

Discussions similaires

  1. Trier une Map sur les valeurs de façon décroissante
    Par ddams dans le forum Collection et Stream
    Réponses: 13
    Dernier message: 27/12/2011, 18h33
  2. [Math]Problème troncage ou arrondi sur des valeurs
    Par Carrel dans le forum Général Java
    Réponses: 6
    Dernier message: 07/10/2009, 15h11
  3. [SELECT] Valeur mini sur cle externe
    Par Olif dans le forum Langage SQL
    Réponses: 6
    Dernier message: 23/10/2008, 15h33
  4. Condition IF sur plusieurs valeurs
    Par davelop dans le forum ASP
    Réponses: 5
    Dernier message: 10/06/2005, 11h10
  5. "Order by" sur des valeurs spécifiques
    Par damienTrax dans le forum Requêtes
    Réponses: 2
    Dernier message: 23/11/2004, 09h20

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo