3 pièce(s) jointe(s)
faire un tableau croisé dynamique sur Python
Bonjour,
je cherche à faire un TCD d'un fichier csv sur Python, d'habitude je le fais sur Excel mais je cherche à l'automatiser.
j'ai commencé avec ce code
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13
| school=df.groupby('domain+country').school.nunique()
title=df.groupby('domain+country').title.nunique()
tcddomcount=pandas.merge(school, title, on="domain+country")
tcddomcount.columns = ['schooldomain+country','titledomain+country',]
school2=df.groupby('email').school.nunique()
title2=df.groupby('email').title.nunique()
tcdmail=pandas.merge(school2, title2, on="email")
tcdmail.columns = ['schoolmail','titlemail',] |
Dans ce code j'ai essayé de traduire de ce que je fais sur Excel d'habitude
premièrement en prenant des mails en ligne et des écoles et des offres d'emploi en valeur
deuxièmement en prenant des domain+country en ligne et des écoles et des offres d'emploi en valeur
sauf que je n'obtiens pas le même résultat avec mon code
input
Pièce jointe 612898
ce que je dois avoir (avec Excel)
Pièce jointe 612899
ce que j'obtiens (avec python)
Pièce jointe 612900
Je ne peux pas utiliser pd.crosstab non plus parce que ça exige obligatoirement des colonnes, sauf que j'en utilise pas avec Excel, c'est juste des lignes et des valeurs dans ce logiciel
Avez-vous une idée de pourquoi ça fonctionne pas?