|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Membre régulier
![]() Inscription : septembre 2008 Messages : 298 ![]() |
Bonjour
Mon probleme se trouve dans la classification des échantillons de classes non équilibrées, pour ce faire j'utilise un sur-échantillonnage des données, par exemple si j'ai le vecteur de données de dimension (5) a=[1 0 1 1 1] et de taille 500, est ce qu'il suffit de produire ce vecteur par exemple 3500 fois dans la base de données si l'autre classe a 4000 échantillons ?????????? s'il vous plait, pourriez vous m'aider a résoudre ce probleme?????????? Cordialement |
|
|
00
|
|
|
#2 |
|
Membre chevronné
![]() Alexis Doctorant en informatique Inscription : juin 2009 Messages : 428 ![]() |
L'explication de ton problème n'est pas très claire: qu'appelles-tu 'taille' et 'dimension'.
Quel algorithme de classification utilises-tu ? Pour compenser un jeu de données désiquilibré il y a deux méthodes principalement utilisées:
|
|
|
00
|
|
|
#3 |
|
Membre régulier
![]() Inscription : septembre 2008 Messages : 298 ![]() |
Bonjour
Merci pour ta réponse clairvoyante. La dimension du vecteur est 5. La taille est le nombre d’échantillons de départ 500 contre 4000. L'algorithme est k-PPV (k-plus-proches voisins). J'aimerai savoir plus sur le sur-échantillonnage qui est la démarche opposée du sous-échantillonnage. Merci. Cordialement |
|
|
00
|
|
|
#4 | ||
![]() ![]() Guillaume Ingénieur de Recherche Inscription : janvier 2006 Messages : 4 780 ![]() |
Citation:
C'est un des algorithmes de classement qui gère plutôt bien les classes déséquilibrées :-) Si tu souhaites faire un 1-PPV, alors il est inutile d'équilibre tes classes. si k est différent de 1, tu peux simplement pondérer les voisins que tu trouves. C'est-à-dire dans ton cas, lorsque tu trouves un voisin de la classe minoritaire tu attributs un poids de 8 et si c'est un voisin de la classe majoritaire tu mets 1. La classe d'appartenance est alors celle qui a le plus grand score à la fin. Citation:
- sur-échantillonnage (souvent préféré afin d'éviter la perte de données) => dupliquer les individus de la classe minoritaire jusqu'à ce que les classes soient équilibrées. - sous-échantillonnage => supprimer aléatoirement des individus de la classe majoritaire jusqu'à ce que les deux classes soient équilibrées.
__________________
Consignes aux jeunes padawans : une image vaut 1000 mots ! - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe correcteur orthographique pour FiReFox), mettre les ACCENTS et les BALISES => ECRIRE clairement et en Français tu DOIS. - Le coté obscur je sens dans le MP => Tous tes MP je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci) - ton poste tu dois marquer quand la bonne réponse tu as obtenu.
|
||
|
|
00
|
|
|
#5 |
|
Membre régulier
![]() Inscription : septembre 2008 Messages : 298 ![]() |
Merci Beaucoup
.Problème résolu. Cordialement |
|
|
00
|
Copyright © 2000-2013 - www.developpez.com