Bonjour,
j'ai des données dont les attributs sont binaires. Puis-je appliquer des techniques de classification classiques telles que
KNN, SVM etc? (j'utilise les fonctions de sklearn)
merci
Bonjour,
j'ai des données dont les attributs sont binaires. Puis-je appliquer des techniques de classification classiques telles que
KNN, SVM etc? (j'utilise les fonctions de sklearn)
merci
Bonjour,
Il me semble que le cadre générale pour appliquer sur un jeu de données des algorithmes comme SVM ou régression logistique par exemple, il faut que les données soient binaires. Dans le cas de données non binaires, il est nécessaire de s'y ramener en transformant les données qualitatives en autant de données binaires que de facteurs.
Au plaisir de te lire.
Non, pas besoin de transformer en discret pour du kNN (il suffit d'utiliser une distance euclidienne ou quelque chose de classique du genre) ou en SVM (c'est une régression linéaire un peu améliorée, en gros). Ces mêmes algos fonctionnent aussi bien en discret qu'en continu, ils ne tiendront juste pas compte de la spécificité des données discrètes. Pour ça, regarde plutôt des arbres de décision ou des forêts d'arbres, mais tu n'auras pas forcément de meilleurs résultats.
Vous souhaitez participer aux rubriques Qt (tutoriels, FAQ, traductions) ou HPC ? Contactez-moi par MP.
Créer des applications graphiques en Python avec PyQt5
Créer des applications avec Qt 5.
Pas de question d'ordre technique par MP !
Merci pour vos réponses.
Précisément j'ai fait des tests avec les algorihtmes tels que:
KNeighborsClassifier
GaussianNB
svm.SVC
DecisionTreeClassifier
disponibles sous skleran et ça fonctionne bien mais comme vous me l'avez dit ça ne tient pas nécessairement compte de la spécifié des données et c'est ce point là qui me dérange. Est-ce que je peux considérer donc que e résultat est fiable?
merci![]()
Vous souhaitez participer aux rubriques Qt (tutoriels, FAQ, traductions) ou HPC ? Contactez-moi par MP.
Créer des applications graphiques en Python avec PyQt5
Créer des applications avec Qt 5.
Pas de question d'ordre technique par MP !
oui c'est ce que j'ai fait. Je calcule le score de classification avec une validation croisée mais malgré çà je doute de la fiabilité du résultat tant que l'algo ne prends pas en considération la nature de mes données!!!
Partager