Bonjour,
je cherche à faire un TCD d'un fichier csv sur Python, d'habitude je le fais sur Excel mais je cherche à l'automatiser.
j'ai commencé avec ce code
Dans ce code j'ai essayé de traduire de ce que je fais sur Excel d'habitude
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13 school=df.groupby('domain+country').school.nunique() title=df.groupby('domain+country').title.nunique() tcddomcount=pandas.merge(school, title, on="domain+country") tcddomcount.columns = ['schooldomain+country','titledomain+country',] school2=df.groupby('email').school.nunique() title2=df.groupby('email').title.nunique() tcdmail=pandas.merge(school2, title2, on="email") tcdmail.columns = ['schoolmail','titlemail',]
premièrement en prenant des mails en ligne et des écoles et des offres d'emploi en valeur
deuxièmement en prenant des domain+country en ligne et des écoles et des offres d'emploi en valeur
sauf que je n'obtiens pas le même résultat avec mon code
input
ce que je dois avoir (avec Excel)
ce que j'obtiens (avec python)
Je ne peux pas utiliser pd.crosstab non plus parce que ça exige obligatoirement des colonnes, sauf que j'en utilise pas avec Excel, c'est juste des lignes et des valeurs dans ce logiciel
Avez-vous une idée de pourquoi ça fonctionne pas?
Partager