Bonjour à tous,
Je bloque sur une manipulation dans R. J'ai un dataframe (nommé ici data) avec plusieurs colonnes, par ex :
colonne 1 = ID colonne 2 = Année colonne 3 = secteur ....
A1 2018 France
A2 2017 France
A2 2022 Afrique
A2 2022 France
Je souhaiterai avoir le nombre de valeurs uniques selon chaque colonne. Par exemple, le nombre de valeurs uniques en 2022 pour tous les secteurs, pour chaque secteur et le nombre de valeurs uniques par secteur quelque soit l'année.
Il s'agit de données de comptages, si je me suis mal exprimée : le but final est d'avoir la proportion de carrés échantillonnés pour chaque année, chaque secteur etc.
Je ne trouve pas de solution au problème.
Pour le moment, j'ai comme données sous r :
- le nombre de valeurs uniques, avec : sapply(data, n_distinct)
- le nombre d'identifiants par année et par secteur avec : aggregate(ID~ Secteur, data, function(x) length(unique(x)))
Merci![]()
Partager