Bonjour,

J'ai ici un jeu de données très gros avec pas mal de colonnes ou j'ai très peu de données. Les valeurs négatives correspondent à "NA". En gros je voudrais supprimer toutes les colonnes où j'ai moins de 10% de réponses.

J'ai donc créé une boucle comme ci-après, mais ça ne semble pas fonctionner.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
for(i in 1:ncol(d))
{if ((length(which(d[,i]<0)))< nrow(d)-nrow(d)*(1/100))
d<-d[,-i]
}
Quelqu'un sait-il quel est le problème ici?
Merci beaucoup!