Bonjour tout le monde,
Je dois classifier des articles (qui ont des labels textes que j'ai convertis en facteurs) en différentes catégories. La difficulté est qu'il y a 100 000 articles uniques et 800 catégories uniques.
J'étais sur le point d'utiliser un algorithme Random Forest mais il est limité à 32 niveaux de facteur dans R.
Quel serait selon vous le meilleur modèle/approche pour faire ce type de classification massive?
Merci beaucoup pour votre aide !
Data_Cruncher
Partager