Salut tout le monde,
la base représente le trafic réseau dans chaque diapositif observée de la date 2019-03-01 jusqu'à 2019-04-01 exportée du logiciel Netflow,4661 observations.
les variables sont:
Source : adresses source ; variable quali
Destination : adresses de destination ; variable quali
Application : application ; variable quali
pdf.SrcPort : port source ; variable quali
Protocol : ensemble de règles et de procédures de communication utilisées de part et d’autre par toutes les stations qui échangent des données sur le réseau. ; variable quali
DSCP : Differentiated Services est une architecture de réseau qui spécifie un mécanisme pour classer et contrôler le trafic tout en fournissant de la qualité de service (QoS), en différenciant les services des données. ; variable quali
Dev : (Device) Diapositif ; variable quali
Con : (Conversation) le type de la conversation: In ou Out ; variable quali
Qualite_du_flux: variable binaire : non_defaut ou defaut
Mon objectif est d'appliquer 3 modèles de prédictions (régression logistique, arbre de décision 'CHAID'..) la variable à expliquer Qualite_du_flux est mais les variables 'Source' et 'Destination' n'ont plus categories du coup j'ai du mal à appliquer ces modèles.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
 
str(netflow)
'data.frame':	4661 obs. of  10 variables:
 $ Source         : Factor w/ 844 levels "0.0.0.0","10.1.101.1",..: 200 196 194 193 194 198 192 194 206 194 ...
 $ Destination    : Factor w/ 663 levels "10.1.103.14",..: 583 458 455 113 149 136 142 148 138 145 ...
 $ Application    : Factor w/ 122 levels "aeroflight-ret",..: 107 15 38 45 38 60 60 38 38 38 ...
 $ pdf.SrcPort    : Factor w/ 116 levels "*","0","1026",..: 88 56 84 6 84 83 83 84 84 84 ...
 $ Protocol       : Factor w/ 8 levels "ESP","GRE","ICMP",..: 6 5 5 5 5 5 5 5 5 5 ...
 $ DSCP           : Factor w/ 9 levels "10","100","11011",..: 9 9 9 9 9 9 9 9 9 9 ...
 $ Dev            : Factor w/ 24 levels "benarous","BP_hbib_42D603",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ Con            : Factor w/ 2 levels "In","Out": 1 1 1 1 1 1 1 1 1 1 ...
 $ Qualite_de_Flux: Factor w/ 2 levels "Default","NonDefault": 2 2 2 2 2 2 2 2 2 2 ...