IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Points hors bornes et diagramme de Pareto


Sujet :

R

  1. #1
    Nouveau membre du Club
    Inscrit en
    Juillet 2009
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2009
    Messages : 51
    Points : 29
    Points
    29
    Par défaut Points hors bornes et diagramme de Pareto
    Bonjour, j'ai une nouvelle question a vous poser:

    Je dispose de n graphiques (n étant un nombre de paramètres) sur lesquels j'ai tracé:

    - un nuage de points (valeurs du paramètre pour differents lots)
    - une droite horizontale (appelée UCL -> borne supérieure)
    - une droite horizontale (appelée LCL -> borne inférieure)

    Je souhaiterais pour chaque paramètre (donc pour chaque graphe) recenser le nombre de points qui sortent des bornes (c'est à dire valeurs > UCL ou valeurs < LCL) puis afficher un diagramme de Pareto affichant les effectifs cumulés des paramètres hors contrôle (hors des bornes), du plus grand au plus petit.


    A vos neurones, je compte sur vous

    Merci
    Did

  2. #2
    Nouveau membre du Club
    Inscrit en
    Juillet 2009
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2009
    Messages : 51
    Points : 29
    Points
    29
    Par défaut
    Je vais essayer d'être un peu plus précis. Je dispose d'une base de données appelé "Data_Base" contenant 3 variables: LOT, PARAMETER, AVERAGE.

    Considerons qu'il y a n paramètres, alors chacun de ces paramètres possède une valeur (AVERAGE) en fonction du numéro de lot (LOT).

    D'autre part, j'ai calculé préalablement pour chaque paramètre, une borne superieure (UCL qui renvoie une valeur pour chaque paramètre, c'est a dire UCL[1]=... pour le paramètre 1, ....., UCL[n]=... pour le paramètre n) et une borne inferieure (LCL de la meme maniere que UCL).

    J'ai ensuite tracé pour chaque paramètre un graphique, avec pour abscisse: le numero du lot et pour ordonnée la valeur (AVERAGE) correspondante. (cf figure exemple courbe orange avec les points) et UCL (droite superieure orange) et LCL (droite inférieure orange).

    On peut s'apercevoir que des points (ici un seul) sortent de ces limites orange.

    J'aimerais ainsi pour chaque graphique (chaque PARAMETER) pouvoir récuperer dans un premier temps le nombre de points qui sortent de ces limites, puis dans un deuxieme temps pouvoir afficher un diagramme de Pareto
    affichant le nombre de ces points pour chaque paramètre (uniquement si ce nombre different de 0).

    J'espere avoir été le plus clair possible

    Je compte sur vous
    Cordialement
    Did
    Images attachées Images attachées  

  3. #3
    Nouveau membre du Club
    Homme Profil pro
    Développeur Web
    Inscrit en
    Mai 2009
    Messages
    22
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Mai 2009
    Messages : 22
    Points : 28
    Points
    28
    Par défaut
    Je peux juste te donner des pistes...
    Il vaut mieux compter les points avant de faire le graphique avec sum(x>n), x étant la colonne de ton data.frames que tu plot.
    Pour le diagramme de Pareto aucune idée, mais il existe des fonctions pour ordonner les données, et sum permet de cumuler des nombres.
    En mettant ça dans une boucle, peut être que ça peut marcher.

  4. #4
    Membre expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Points : 3 378
    Points
    3 378
    Par défaut
    Bonjour,

    Comment est codée la colonne PARAMETER ? Sont-ce des entiers, des facteurs, des caractères ?
    Ça a son importance pour utiliser des <quelque chose>apply, qui sont tout indiqués pour ce genre de calcul.
    Forum LaTeX : pour des réponses rapides et appropriées, pensez à poster un
    ECM = Exemple (reproduit le problème) Complet (document compilable) Minimal (ne postez pas votre thèse !)

    Une solution vous convient ? N'oubliez pas le tag


    )><))))°>

  5. #5
    Nouveau membre du Club
    Inscrit en
    Juillet 2009
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2009
    Messages : 51
    Points : 29
    Points
    29
    Par défaut
    Bonjour,

    La colonne PARAMETER désigne le nom des differents paramètres, ce sont des chaines de caractère, idem pour la variable LOT, seule la variable AVERAGE possède des valeurs numériques.


    Cdlt
    Did

  6. #6
    Membre expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Points : 3 378
    Points
    3 378
    Par défaut
    OK, dans ce cas, tu as intérêt à ce que tes bornes soient dans des vecteurs dont les valeurs sont nommées. Tu peux ensuite faire une "boucle" sur les noms de paramètres :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    UCL <- c("nom_para_1"=<valeur>, "nom_para_2"=<valeur>,...)
    ## Pareil pour LCL, les noms correspondent aux valeurs dans la colonne PARAMETER
    
    sapply(unique(data$PARAMETER),          # ! levels(data$PARAMETER) s'il s'agit d'un factor
           function(x)
       {
           with(data[data$PARAMETER == x, ], # sélection des données pour le paramètre x
                sum(AVERAGE > UCL[x] | AVERAGE < LCL[x])) # comptage
       })
    Forum LaTeX : pour des réponses rapides et appropriées, pensez à poster un
    ECM = Exemple (reproduit le problème) Complet (document compilable) Minimal (ne postez pas votre thèse !)

    Une solution vous convient ? N'oubliez pas le tag


    )><))))°>

  7. #7
    Nouveau membre du Club
    Inscrit en
    Juillet 2009
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2009
    Messages : 51
    Points : 29
    Points
    29
    Par défaut
    Re, merci pour ta réponse, il y a un problème: ça me retourne NA pour chaque paramètre ... pourtant tout a l'air bon

  8. #8
    Membre expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Points : 3 378
    Points
    3 378
    Par défaut
    Es-tu certain que les valeurs de UCL et LCL sont bien nommées comme dans la colonne PARAMETER ?

    Si ça plante toujours envoie nous un exemple un peu plus complet (avec chargement des donnée + extrait).
    Forum LaTeX : pour des réponses rapides et appropriées, pensez à poster un
    ECM = Exemple (reproduit le problème) Complet (document compilable) Minimal (ne postez pas votre thèse !)

    Une solution vous convient ? N'oubliez pas le tag


    )><))))°>

  9. #9
    Nouveau membre du Club
    Inscrit en
    Juillet 2009
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2009
    Messages : 51
    Points : 29
    Points
    29
    Par défaut
    Voici l'allure de mon UCL (meme forme pour LCL):

    > UCL
    Param1 Param2 Param3 Param4
    11.52 3.23 6.12 23.67
    Param5 Param6 Param7 .....
    43.78 17.32 26.10 .....

  10. #10
    Nouveau membre du Club
    Inscrit en
    Juillet 2009
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2009
    Messages : 51
    Points : 29
    Points
    29
    Par défaut
    C'est bon, problème résolu, erreur de frappe de ma part.
    Merci Pitipoisson.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XL-2007] Demande sur un diagramme de Pareto
    Par Walkomedia dans le forum Excel
    Réponses: 3
    Dernier message: 02/03/2011, 17h04
  2. Construire un Diagramme de Pareto
    Par Jimy6000 dans le forum Excel
    Réponses: 9
    Dernier message: 19/01/2011, 08h28
  3. Aboutir à un diagramme de Pareto
    Par Ariane66 dans le forum Excel
    Réponses: 6
    Dernier message: 17/06/2009, 16h00
  4. Trouver le pourcentage de valeurs hors borne.
    Par Ptinéwik dans le forum MATLAB
    Réponses: 7
    Dernier message: 17/01/2008, 14h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo