Bonjour tout le monde,

Je dois classifier des articles (qui ont des labels textes que j'ai convertis en facteurs) en différentes catégories. La difficulté est qu'il y a 100 000 articles uniques et 800 catégories uniques.

J'étais sur le point d'utiliser un algorithme Random Forest mais il est limité à 32 niveaux de facteur dans R.

Quel serait selon vous le meilleur modèle/approche pour faire ce type de classification massive?

Merci beaucoup pour votre aide !

Data_Cruncher