Bonjour,
Je vous prie de me repondre à ces question.
Quels sont les principaux traitements qu'on peut être amené à faire sur des données fournies, pour qu'elles soient exploitables pour faire du data mining, selon la technique de data mining visée.
Arbres de décision
Il existe divers algorithmes pour déterminer, à un noeud donné de l'arbre, quelle information est la plus pertinente pour poursuivre le développement de l'arbre. L'un des critères distinguant ces algorithmes est le nombre de branches engendrées à chaque noeud. Expliquer les principales différences entre un algorithme produisant un arbre binaire et un algorithme produisant un arbre n-aire (n étant variable) ; comparer la forme et la taille de l'arbre produit, les traitements sur les variables, etc.
Réseaux bayésiens
Expliquer moi en quoi les réseaux bayésiens ne sont pas juste des calculs de probabilités conditionnelles.
Réseaux de neurones
Dans toute construction de modèle, il est important de décomposer les données utilisées en une base d'apprentissage et une base de test. Expliquer pourquoi c'est encore plus vrai pour la construction d'un réseau de neurones, et quels sont les critères qui déterminent si cette décomposition est a priori bien faite ou pas.
Merci de votre aide.
Partager