Voici mes variables :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
 
> summary(don)
 Frais.Mensuels Quantité.Actes                Region       Surcomp     
 1:413634       1:473934       Ile de France     :211595   NON:987242  
 2:413175       2:366151       Bretagne          :164672   OUI:252888  
 3:413321       3:400045       Nord Pas de Calais:113707               
                               Pays de Loire     :106965               
                               Rhône Alpes       : 96173               
                               Alsace            : 73314               
                               (Other)           :473704               
                       Type             Age                Ancienneté    
 Famille * 2enfants      :312310   42 à 47:216243   21 à 24 mois:602213  
 Isolé                   :276494   37 à 42:210649   9 à 12 mois :223997  
 Famille * 1enfant       :203437   47 à 52:191793   3 à 6 mois  : 88493  
 Famille * 3 ou + enfants:178646   32 à 37:168549   6 à 9 mois  : 67601  
 Couple                  :168477   52 à 57:152201   - 1 mois    : 60700  
 Isolé * 1enfant         : 45079   27 à 32:136518   18 à 21 mois: 60460  
 (Other)                 : 55687   (Other):164177   (Other)     :136666  
         Code.activité              Regroup.Poste.soins
 Distribution   :255928   Consultations       :144488  
 Agroalimentaire:136628   Pharmacie           :140375  
 Services       :120693   Actes de radiologie :108509  
 Informatique   : 73800   Auxiliaires médicaux: 98754  
 Transport      : 71024   Analyses médicales  : 92544  
 (Other)        :532592   (Other)             :655440  
 NA's           : 49465   NA's                :    20
Et ci-joint, le code qui pose problème :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
don$Region[don$Region %in% c("Aquitaine","Midi Pyrénées","Languedoc Roussillon","Provence Alpes Cote d'Azur","Rhône Alpes","Centre","Auvergne","Limousin")]<- "CENTRE_SUD"


Warning message:
In `[<-.factor`(`*tmp*`, don$Region %in% c("Aquitaine", "Midi Pyrénées",  :
invalid factor level, NA generated
J'effectue ce regroupement de modalités dans le but de réaliser une ACM, mais je n'arrive pas à regrouper ces fichues modalités entre-elles sous une nouvelle.

Le problème vient d'erreurs codées "NA" ? La présence d'autres modalités ?

Bref, le summary de ma variable Region en guise d'exemple :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
 
> levels(Region)
 [1] "Alsace"                     "Aquitaine"                 
 [3] "Auvergne"                   "Auvergne  "                
 [5] "Bourgogne"                  "Bretagne"                  
 [7] "Centre"                     "Champagne Ardennes"        
 [9] "DOM TOM ou autres"          "Franche Comté"             
[11] "Ile de France"              "Languedoc Roussillon"      
[13] "Limousin"                   "Lorraine"                  
[15] "Midi Pyrénées"              "Nord Pas de Calais"        
[17] "Normandie ( Basse )"        "Normandie ( Haute )"       
[19] "Pays de Loire"              "Picardie"                  
[21] "Poitou Charentes"           "Provence Alpes Cote d'Azur"
[23] "Rhône Alpes"
Merci d'avance !