IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

mystère autour de which( ) et unique( )


Sujet :

R

  1. #1
    Membre averti
    Femme Profil pro
    Inscrit en
    Septembre 2009
    Messages
    272
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations forums :
    Inscription : Septembre 2009
    Messages : 272
    Points : 417
    Points
    417
    Par défaut mystère autour de which( ) et unique( )
    Bonsoir,

    je suis confrontée depuis plusieurs jours à un casse-tête et j'espère que l'une ou l'un d'entre vous aura la gentillesse de m'aider.

    J'ai un -long- programme où j'utilise which( ) et unique( ). Jusqu'ici, rien d'original.
    J'ai testé mon programme sur de petits jeux de données: tout a l'air ok. Le problème se pose quand j'utilise which( ) et unique( ) sur un vecteur de longueur 5000 (environ).
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    which(MonVecteur == MaValeur)
    ne me renvoie pas le ou les indices que je retrouve à l'affichage: il ne retrouve pas la valeur...
    renvoie un vecteur plus court mais il reste des doublons ou des triplés

    Le premier problème semble être résolu avec:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    which(abs(MonVecteur - MaValeur) < 0.01)
    Pour unique( ), je suis perdue: vecteur "trop long" ou problème sous-jacent (similaire à la différence entre == et all.equal)?

    J'ai testé différents jeux de données, le problème persiste.

    Toutes vos idées seront les bienvenues!

    Merci d'avance
    Lilly.

  2. #2
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 016
    Points : 23 705
    Points
    23 705
    Par défaut
    Bonjour,

    Sans avoir le vecteur sous les yeux, c'est difficile à dire, mais ça sent à plein nez le problème de virgule flottante, ça...
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  3. #3
    Membre averti
    Femme Profil pro
    Inscrit en
    Septembre 2009
    Messages
    272
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations forums :
    Inscription : Septembre 2009
    Messages : 272
    Points : 417
    Points
    417
    Par défaut
    Citation Envoyé par ced Voir le message
    Bonjour,

    Sans avoir le vecteur sous les yeux, c'est difficile à dire, mais ça sent à plein nez le problème de virgule flottante, ça...
    Bonjour et merci pour votre réponse.

    Je sais, par expérience, qu'il est difficile de répondre sans code reproductible.
    Mon programme étant une grosse moulinette codée en "orienté objet", je ne peux malheureusement pas mettre des bouts de code.

    Pour le vecteur, je fais tourner un jeu pour faire un copier-coller de la sortie en espérant que cela vous oriente vers quelque chose.
    De mémoire, j'avais des choses du style:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    "2.5" "2.5" "3" "3.33333336" "3.33333336" "4" "4.5" "4.6" "5" "5" "5"
    En attendant les sorties de "la moulinette", pourriez-vous m'expliquer ce que vous entendez par
    problème de virgule flottante
    svp?
    Je n'ai jamais entendu parler de cela, ni de problème concernant la fonction unique( )

    Merci d'avance.
    Lilly.

  4. #4
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 016
    Points : 23 705
    Points
    23 705
    Par défaut
    Voici l'article de wikipédia qui expliquera ce qu'est la virgule flottante bien mieux que moi : http://fr.wikipedia.org/wiki/Virgule_flottante
    Pour tester si c'est ça, le mieux serait de faire un unique() sur un arrondi de la valeur (par round, floor...).
    Et même avec ça, on a parfois des petites surprises.

    A tester pour voir si c'est la bonne piste à creuser ou pas (et alors, le problème vient d'ailleurs...).
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  5. #5
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 016
    Points : 23 705
    Points
    23 705
    Par défaut
    Voici un lien dans la FAQ de R sur le sujet :
    http://cran.r-project.org/doc/FAQ/R-...are-equal_003f
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  6. #6
    Membre averti
    Femme Profil pro
    Inscrit en
    Septembre 2009
    Messages
    272
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations forums :
    Inscription : Septembre 2009
    Messages : 272
    Points : 417
    Points
    417
    Par défaut
    Merci Ced pour vos réponses.

    En fait, je manipule des coordonnées que je simulais par des lignes du genre:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    x[i] <- round(runif(1, min=3, max=5), digits=1)
    Puis, je calcule des pentes à partir de ces coordonnées.
    Après quelques calculs (je passe les détails de la moulinette...), mon code est censé:
    1/ retrouver l'indice d'une pente dans un vecteur regroupant toutes les pentes
    2/ lever les doublons dans ce vecteur

    Après avoir lu votre premier commentaire, j'ai fait tourner mon code en générant les coordonnées sans le round( ) et cela semble fonctionner!

    Avant de clore le sujet, je voudrais vous demander comment parer à ce problème en gardant les round( ).
    Je connais les "astuces" avec all.equal ou, comme je l'ai mis dans mon premier post:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    which(abs(MonVecteur - MaValeur) < 0.01)
    .

    Auriez-vous une idée pour unique( ) svp?
    J'ai fait des tests mais rien ne semble fonctionner et je ne trouve pas de doc là-dessus.

    Encore merci
    Lilly.

  7. #7
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 016
    Points : 23 705
    Points
    23 705
    Par défaut
    Je n'arrive pas à reproduire le problème.
    Pour moi, quand je génère un vecteur avec des valeurs arrondies, unique() renvoie bien les valeurs uniques...
    Difficile de trouver ce qui cloche.
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  8. #8
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    En se basant sur l'exemple de la FAQ cité par ced, j'arrive à reproduire ce que je pense être le problème (même si je n'y apporte pas de réponse, désolée ) :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    a<-sqrt(2)
     
    a*a
    [1] 2
     
    a*a-2
    [1] 4.440892e-16
     
    #####
     
    w<-c(round(a*a,digits=5),2)
    w
    [1] 2 2
    unique(w)
    [1] 2
     
    z<-c(round(a*a,digits=17),2)
    z
    [1] 2 2
    unique(z)
    [1] 2 2
    Cela semble donc se jouer au niveau du nombre de décimales retenues...

    Bonne continuation


    Cordialement,

    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  9. #9
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 016
    Points : 23 705
    Points
    23 705
    Par défaut
    Tout simplement parce que pour R, ces 2 chiffres sont différents.
    Pour s'en convaincre, il suffit de changer l'option d'affichage pour passer à 17 chiffres significatifs :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    > options(digits=17)
    > a<-sqrt(2)
    >  a*a
    [1] 2.0000000000000004
    > a*a-2
    [1] 4.4408920985006262e-16
    > #####
    >  w<-c(round(a*a,digits=5),2)
    > w
    [1] 2 2
    > unique(w)
    [1] 2
    > z<-c(round(a*a,digits=17),2)
    > z
    [1] 2.0000000000000004 2.0000000000000000
    > unique(z)
    [1] 2.0000000000000004 2.0000000000000000
    >
    ced
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

Discussions similaires

  1. Uniquement dans le systray
    Par atmaniak dans le forum Composants VCL
    Réponses: 5
    Dernier message: 31/10/2003, 17h49
  2. [VB6] [DLL] DLL à instance unique
    Par HPJ dans le forum VB 6 et antérieur
    Réponses: 9
    Dernier message: 19/09/2003, 08h07
  3. Unique + valeur par défaut
    Par ketalie dans le forum Outils
    Réponses: 4
    Dernier message: 02/07/2003, 15h29
  4. Réponses: 4
    Dernier message: 22/05/2003, 11h15
  5. Suppression de la contrainte unique
    Par mika dans le forum SQL
    Réponses: 3
    Dernier message: 20/02/2003, 17h56

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo