IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

Probleme de Normalisation


Sujet :

Algorithmes et structures de données

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre émérite Avatar de jkofr
    Homme Profil pro
    Senior Consultant DBA (Trivadis SA)
    Inscrit en
    Octobre 2006
    Messages
    484
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 56
    Localisation : Suisse

    Informations professionnelles :
    Activité : Senior Consultant DBA (Trivadis SA)
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 484
    Par défaut Probleme de Normalisation
    Bonjour,

    Voici le problème.

    J'ai 4 champs calculés qui représentent 4 classifications de sportifs selon une formule différente à chaque fois.

    Ch1 = Nombre de courses / nombres de places dans les 3
    Ch2 = Nombre de courses / nombres de victoires
    Ch3 = Somme de ses gains / Moyennes de ses gains
    Ch4 = Nombre de concurents / Concurents battus

    Ces champs sont calculés pour chaques sportifs.
    Disons que sur 1 année, nous avons pu constaté les minima et maxima suivants:
    Ch1 les valeurs vont de 0 a 50
    Ch2 les valeurs vont de 0 a 15
    Ch3 les valeurs vont de 0 a 150000
    Ch4 les valeurs vont de 0 a 5

    Comment normaliser ces valeurs sur une échelle de 100?

    On pourait par exemple dire que
    La valeur = Valeur / Max * 100
    Ca serait assez correct pour Ch1, Ch2, Ch4.

    Par contre pour Ch3, supposons que nous avons de gros écarts entre les valeurs :
    Qlq valeurs > à 140000, qlq entre 1000000 et 110000 et beaucoup < 20000

    Comment rendre ça homogène?
    En fait il faudrait redistribuer...
    qlqun une idée?

    Merci
    jko

  2. #2
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Par défaut
    Citation Envoyé par jkofr Voir le message
    Par contre pour Ch3, supposons que nous avons de gros ecarts entre les valeurs:
    Qlq valeurs > a 140000, qlq entre 1000000 et 110000 et beaucoup < 20000

    Comment rendre ca homogene?
    Si tu connais la répartition de tes valeurs (ou du moins que tu ais une bonne estimation), tu peux egaliser les valeurs. C'est à dire rendre la fonction de répartition linéaire.

    Tu peux regarder les techniques d' "égalisation d'histogramme" pour avoir une idée de ce dont je parle.
    ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.

  3. #3
    Membre émérite Avatar de jkofr
    Homme Profil pro
    Senior Consultant DBA (Trivadis SA)
    Inscrit en
    Octobre 2006
    Messages
    484
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 56
    Localisation : Suisse

    Informations professionnelles :
    Activité : Senior Consultant DBA (Trivadis SA)
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 484
    Par défaut
    J'ai regarde mias pas trouve grand chose. En fait ya qlq truc sur le traitement d'images.

    jko

  4. #4
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Par défaut
    essaye deja la méthode de Toto13... Si tes données sont réparties suivant une loi normale, ca devrait fonctionner.

    Sinon, on verra plus en detail l'égalisation.
    ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.

  5. #5
    Membre émérite Avatar de jkofr
    Homme Profil pro
    Senior Consultant DBA (Trivadis SA)
    Inscrit en
    Octobre 2006
    Messages
    484
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 56
    Localisation : Suisse

    Informations professionnelles :
    Activité : Senior Consultant DBA (Trivadis SA)
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 484
    Par défaut
    La methode donne:

    Valeur

    Sp Old Normalise
    Sp1 8,5 -,81818134
    Sp2 11,3 -,68604535
    Sp3 13 -,60581993
    Sp4 14,8 -,52087536
    Sp5 17 -,41705423
    Sp6 29,3 ,163400312
    Sp7 42,5 ,786327132
    Sp8 70,3 2,09824877

    Moyenne = 25.83
    Ecart type = 21.19
    Normalise = (Old - Moyenne) / Ecart Type

    C'est ca ?
    jko

  6. #6
    Membre émérite Avatar de jkofr
    Homme Profil pro
    Senior Consultant DBA (Trivadis SA)
    Inscrit en
    Octobre 2006
    Messages
    484
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 56
    Localisation : Suisse

    Informations professionnelles :
    Activité : Senior Consultant DBA (Trivadis SA)
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 484
    Par défaut
    Ok ca fonctionne, en fait faut faire la moyenne et l'ecart type sur toutes les donnes pour avoir le resultat correct.

    Merci a vous
    jko

  7. #7
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Citation Envoyé par jkofr Voir le message
    La methode donne:

    Valeur

    Sp Old Normalise
    Sp1 8,5 -,81818134
    Sp2 11,3 -,68604535
    Sp3 13 -,60581993
    Sp4 14,8 -,52087536
    Sp5 17 -,41705423
    Sp6 29,3 ,163400312
    Sp7 42,5 ,786327132
    Sp8 70,3 2,09824877

    Moyenne = 25.83
    Ecart type = 21.19
    Normalise = (Old - Moyenne) / Ecart Type

    C'est ca ?
    Je reviens alors que la discussion a pas mal avancé, mais c'est pour corriger quelques erreurs :
    - la dernières valeur est fausse (2,09...), les valeurs après passage dans ma méthode sont normalisées, donc elles sont obligatoirement dans [-1,1].
    - la méthode que je donne (qui est une des plus utilisée en statistiques) s'applique colonne par colonne. Donc l'écart type et la moyenne doivent être calculés sur une colonne, puis on fait la transformation sur les valeurs de la colonne et on réitère sur les colonnes suivantes...
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  8. #8
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Bonjour,

    la méthode classique de normalisation des données en classification c'est de retrancher la moyenne et de diviser par l'écart type.
    Donc pour une colonne C et un individu I :
    T(I,C) = ( T(I,C) - Moyenne(C) ) / EcartType(C) ;

    Tu auras ainsi des valeurs normalisées sur [-1,1]. Il est alors inutile de les convertir sur [0,100].
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [W3C] Probleme de normalisation
    Par solp dans le forum Balisage (X)HTML et validation W3C
    Réponses: 5
    Dernier message: 11/04/2006, 16h41
  2. probleme de normalisation
    Par k_boy dans le forum Décisions SGBD
    Réponses: 1
    Dernier message: 30/01/2005, 16h10
  3. Probleme sur les chaines de caractere
    Par scorpiwolf dans le forum C
    Réponses: 8
    Dernier message: 06/05/2002, 19h01
  4. [Kylix] Probleme d'execution de programmes...
    Par yopziggy dans le forum EDI
    Réponses: 19
    Dernier message: 03/05/2002, 14h50
  5. [Kylix] Probleme de nombre flottant!!
    Par yopziggy dans le forum EDI
    Réponses: 5
    Dernier message: 02/05/2002, 10h13

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo