Bonjour,
je cherche à faire un TCD d'un fichier csv sur Python, d'habitude je le fais sur Excel mais je cherche à l'automatiser.
j'ai commencé avec ce code
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
school=df.groupby('domain+country').school.nunique()
title=df.groupby('domain+country').title.nunique()
 
tcddomcount=pandas.merge(school, title, on="domain+country")
 
tcddomcount.columns = ['schooldomain+country','titledomain+country',]
 
 
school2=df.groupby('email').school.nunique()
title2=df.groupby('email').title.nunique()
 
tcdmail=pandas.merge(school2, title2, on="email")
tcdmail.columns = ['schoolmail','titlemail',]
Dans ce code j'ai essayé de traduire de ce que je fais sur Excel d'habitude
premièrement en prenant des mails en ligne et des écoles et des offres d'emploi en valeur
deuxièmement en prenant des domain+country en ligne et des écoles et des offres d'emploi en valeur

sauf que je n'obtiens pas le même résultat avec mon code
input

Nom : 612889.png
Affichages : 1975
Taille : 397,6 Ko

ce que je dois avoir (avec Excel)

Nom : 612890.png
Affichages : 2082
Taille : 60,2 Ko

ce que j'obtiens (avec python)

Nom : 612891.png
Affichages : 1942
Taille : 22,0 Ko

Je ne peux pas utiliser pd.crosstab non plus parce que ça exige obligatoirement des colonnes, sauf que j'en utilise pas avec Excel, c'est juste des lignes et des valeurs dans ce logiciel
Avez-vous une idée de pourquoi ça fonctionne pas?