Bonjour,
J'envisage de faire du Data Mining sur des enregistrements téléphoniques. J'ai pris l'option de calcul du TF.IDF (produit de la fréquence d'un mot (TF) dans un document et de l'IDF, (log Nombre de documents total / nombre de documents contenant le mot)
Je suis développeur R, quels seraient selon vous la meilleur méthode à utiliser pour séparer les concepts et les individus présents dans ces enregistrements ?
Merci d'avance de vos idées.
Bonne journée.