Bonsoir,
Je cherche un peu d'aide sur un sujet.
Voici le sujet sur le quel je bloque :
Décrivez algorithmiquement ( ou en s'appuyant sur la syntaxe d'un langage évolué tel Java ) le processus de constitution d'un arbre de décision tel que décrit dans le cours.
Cet arbre:
• Pourra être binaire ou n-aire.
• Utiliser un outil de discrimination des attributs étudiés en cours ( test du chi2, entropie, indice de Gini ).
• Mettre en œuvre un processus de pré-élagage ( conseillé ) ou de post-élagage ( complexe à implémenter ).
On laisse de coté le cas trivial d'une base d'exemples ne contenant que des attributs de type binaire.
On suppose, pour simplifier, que les données exemples ont déjà été prétraitées (discrétisations ou binarisation éventuelles) et que la base d'exemples, chargée en mémoire pour permettre la constitution de l'arbre, est donc constituée d'articles dont les attributs sont directement exploitables.
En général une base d'exemples est fournie sous forme de fichier texte à délimiteur ( chaque attribut constituant un des champs texte de la ligne constitutive d'un exemple ).
On dispose par ailleurs d'une information complémentaire ( par exemple sous forme de tableau ) indiquant le type des différents attributs ( par exemple : 0 = binaire, 1 = catégorique, 2 = continu ).
Il y aurai t-il une ame charitable pour m'aiguiller sur le sujet .
D'avance merci. Cdt
Partager