Bonjour,
J'ai une base de données qui contient des éléments logs. J'aimerais effectuer un k-means ou bien Knn clustering pour avoir un modèle permettant de détecter les intrusions dans mes logs. Pour ce faire, j'ai effectué quelques modifications sur ma dataset en calculant le nombre de connexions de chaques clients en dehors des heures de travail, celui qui a un nombre de connexions élevé, représente une tentative d'intrusion(niveau d'attaque élevé). Voici ma dataset en pièce jointe.
Mon problème c'est que je suis débutant en R et je ne sais pas comment effectuer ce clustering !! quelqu'un peut aider sur ce coup peut être !!
Merci :-)
Partager