IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Intelligence artificielle Discussion :

Problème de classes déséquilibrées


Sujet :

Intelligence artificielle

  1. #1
    Membre habitué Avatar de abidineb
    Inscrit en
    Septembre 2008
    Messages
    298
    Détails du profil
    Informations forums :
    Inscription : Septembre 2008
    Messages : 298
    Points : 132
    Points
    132
    Par défaut Problème de classes déséquilibrées
    Bonjour

    Mon probleme se trouve dans la classification des échantillons de classes non équilibrées, pour ce faire j'utilise un sur-échantillonnage des données, par exemple si j'ai le vecteur de données de dimension (5) a=[1 0 1 1 1] et de taille 500, est ce qu'il suffit de produire ce vecteur par exemple 3500 fois dans la base de données si l'autre classe a 4000 échantillons ?????????? s'il vous plait, pourriez vous m'aider a résoudre ce probleme??????????

    Cordialement

  2. #2
    Membre éclairé
    Homme Profil pro
    Ingénieur R&D en apprentissage statistique
    Inscrit en
    Juin 2009
    Messages
    447
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur R&D en apprentissage statistique

    Informations forums :
    Inscription : Juin 2009
    Messages : 447
    Points : 752
    Points
    752
    Par défaut
    L'explication de ton problème n'est pas très claire: qu'appelles-tu 'taille' et 'dimension'.

    Quel algorithme de classification utilises-tu ?

    Pour compenser un jeu de données désiquilibré il y a deux méthodes principalement utilisées:
    1. Sous-échantillonner la classe ayant le plus gros effectif
    2. utiliser un coefficient pour pondérer les échantillons en fonction de l'effectif de leur classe

  3. #3
    Membre habitué Avatar de abidineb
    Inscrit en
    Septembre 2008
    Messages
    298
    Détails du profil
    Informations forums :
    Inscription : Septembre 2008
    Messages : 298
    Points : 132
    Points
    132
    Par défaut
    Bonjour

    Merci pour ta réponse clairvoyante. La dimension du vecteur est 5. La taille est le nombre d’échantillons de départ 500 contre 4000.

    L'algorithme est k-PPV (k-plus-proches voisins).
    J'aimerai savoir plus sur le sur-échantillonnage qui est la démarche opposée du sous-échantillonnage.

    Merci.

    Cordialement

  4. #4
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Points : 9 860
    Points
    9 860
    Par défaut
    Citation Envoyé par abidineb Voir le message
    La dimension du vecteur est 5. La taille est le nombre d’échantillons de départ 500 contre 4000.
    On parle aussi souvent d'"individus", donc dans ce cas tu aurais 500 individus contre 4000.



    Citation Envoyé par abidineb Voir le message
    L'algorithme est k-PPV (k-plus-proches voisins).
    C'est un des algorithmes de classement qui gère plutôt bien les classes déséquilibrées :-)
    Si tu souhaites faire un 1-PPV, alors il est inutile d'équilibre tes classes.
    si k est différent de 1, tu peux simplement pondérer les voisins que tu trouves. C'est-à-dire dans ton cas, lorsque tu trouves un voisin de la classe minoritaire tu attributs un poids de 8 et si c'est un voisin de la classe majoritaire tu mets 1. La classe d'appartenance est alors celle qui a le plus grand score à la fin.



    Citation Envoyé par abidineb Voir le message
    J'aimerai savoir plus sur le sur-échantillonnage qui est la démarche opposée du sous-échantillonnage.
    C'est cela :
    - sur-échantillonnage (souvent préféré afin d'éviter la perte de données) => dupliquer les individus de la classe minoritaire jusqu'à ce que les classes soient équilibrées.
    - sous-échantillonnage => supprimer aléatoirement des individus de la classe majoritaire jusqu'à ce que les deux classes soient équilibrées.
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  5. #5
    Membre habitué Avatar de abidineb
    Inscrit en
    Septembre 2008
    Messages
    298
    Détails du profil
    Informations forums :
    Inscription : Septembre 2008
    Messages : 298
    Points : 132
    Points
    132
    Par défaut
    Merci Beaucoup .

    Problème résolu.

    Cordialement

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Problème de classe.
    Par maminova77 dans le forum Langage
    Réponses: 5
    Dernier message: 30/01/2006, 21h39
  2. Problème sur classe Transformer avec les <!--
    Par tykool dans le forum Format d'échange (XML, JSON...)
    Réponses: 1
    Dernier message: 10/01/2006, 10h20
  3. Problème de classe
    Par DeusXL dans le forum DirectX
    Réponses: 15
    Dernier message: 04/12/2005, 14h37
  4. Problème de classe
    Par tidou dans le forum Balisage (X)HTML et validation W3C
    Réponses: 6
    Dernier message: 14/10/2005, 17h49
  5. [FLASH MX2004] Problème de classe
    Par JulPoWeR dans le forum Flash
    Réponses: 1
    Dernier message: 10/07/2005, 22h51

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo