Bonjour,
Je me suis mis à R , j'ai quelques connaissances mais je ne suis pas un expert.
J'ai une petite question sur la manipulation de données.
J'ai un fichier avec 88 colonnes et.....555 000 lignes (non non je ne me suis pas trompé! ).
Il y a beaucoup beaucoup de lignes que je veux faire sauter.
je fais donc le code suivant :
J'attribue à ma nouvelle variable a_DEP les lignes de mon ancienne variable "a" dont les valeurs de la colonne DEP sont : 04 ou 05 .
Code : Sélectionner tout - Visualiser dans une fenêtre à part a_DEP <- a[a$DEP%in%c('04','05'),]
Ouf je passe de 555000 lignes à 15000! (toujours 88 colonnes)
Bon jusquelà tout fonctionne !
Par contre ensuite, si je fais un :
histoire de voir le nombre de valeurs pour les variables 04 et 05, il me sort toute la liste de 01 à 95 (ce sont des departements...vous l'aurez compris) avec que des 0 sauf pour 04 et 05.
Code : Sélectionner tout - Visualiser dans une fenêtre à part table(a_DEP$DEP)
Mais le plus embétant c'est quand je veux faire un tableau croisé dynamique pour une analyse de mes colonnes en fonction de mes départements 04 et 05, idem, il me sort bien mon analyse mais avec TOUS les département de 01 à 95 !
Ca fait beaucoup de lignes, c'est illisible et en plus forcement l'affichage ne peut tout afficher !
Donc mes questions:
- N'ayant selectionné que les lignes que je veux dans ma nouvelle variable, pourquoi il m’analyse des valeurs dont je n'ai rien à faire ?
- Comment créer une matrice /tableau qui ne prennent en compte que les lignes voulues et être sur que les lignes non retenues ne viennent pas perturber mes analyses ?
Merci d'avance pour votre aide !
Partager