Python : variable incrémentation

**batmu** · 24/08/2022, 15h46

Bonjour,

Je viens de commencé le python, j'arrive pas créer une variable de comptage par contrat. Je vous joins mon code.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
from pyspark.sql import functions as F
from pyspark.sql.functions import col, when,ltrim,sum,mean
from pyspark.sql.functions import *
 
df = spark.createDataFrame([("232340024", "Philippe"),
                                ("232340024", "Jean"),
                                ("304435353", "Louis" ),
                                ("304435353",  "Marie"),
                                ("304435353",  "Ernesto"),
                                ("304435353",  "Adel"),
                                ("723320533",  "Remy"),
                                ("723320533",  "Franck")],
 
                           ("CONTRAT", "PRENOM"))
 
df.groupBy(F.col("CONTRAT"),F.col("PRENOM"))\
.agg(F.count(F.col("PRENOM"))).sort(["CONTRAT"],descending=True).filter(F.col("CONTRAT")=="304435353").display()

Par exemple pour le contrat 304435353 je veux une variable de comptage 1, 2 , 3, pour 723320533 je veux 1,2 et pour 232340024 je veux 1,2

Merci d'avance de votre aide.

**popo** · 24/08/2022, 17h20

Recherche du coté du module pyspark.sql.window, notamment Window.partitionBy.
Et également la routine row_number dans le module pyspark.sql.functionsUn exemple basique ici :
https://stackoverflow.com/questions/...row-in-a-group

Python : variable incrémentation

Python

Discussions similaires

Partager

Partager