IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

[Call For Data]Appel à données


Sujet :

Algorithmes et structures de données

  1. #1
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut [Call For Data]Appel à données
    Bonjour à tous

    Comme certains d'entre vous le savent, je suis en train de finaliser un article sur les contours concaves de nuages de points (2D).

    Arrivant, lors d'un des derniers points, à quelque chose d'assez surprenant, bien que pas totalement innattendu (ce qui est assez innatendu est la corrélation et donc la loi - trouvée ), j'aurais besoin de votre aide afin de compléter mes jeux de données.

    Je fais donc appel à vous afin d'avoir des jeux de données 2D de nuages de points. Les miens sont tous issus d'un seul type de phénomène physique, et je me demande si le point surprenant que j'ai trouvé est dû à cette origine commune ou non..

    Conditions :

    • plus de 100 points
    • si possible plusieurs jeux, couvrant plusieurs échelles de nombre (à l'heure actuelle, moi j'en ai de 5 à 95 000 points)
    • sous formes de fichiers (X,Y) du style texte (style pouvant être lu par gnuplot)
    • en entiers ou réels, peu importe
    • avec un (éventuel) commentaire sur l'origine et/ou l'usage (quelques mots en commenaires dans le fichier)



    Si vous disposez de tels jeux, envoyez-moi un MP, je vous donnerais mon adresse mail, et vous pourrez me les envoyer direct.

    Evidemment je préférerait des jeux "naturels", provenant de la nature ou d'analyse d'images, ou "random".. Les cas particuliers artificiels créés ne me sont pas d'un grand intérêt.

    Je vous remercie par avance..


    PS: autre petit point: si l'un de vous a connaissance de travaux théoriques portant sur le nombre de sommets d'une enveloppe, qu'elle soit convexe ou concave, par rapport au nombre de points du nuage, je vous remercierais de me pointer dessus..
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  2. #2
    Membre expérimenté Avatar de davcha
    Profil pro
    Inscrit en
    Avril 2004
    Messages
    1 258
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 1 258
    Points : 1 539
    Points
    1 539
    Par défaut
    Essaie ici.

    http://archive.ics.uci.edu/ml/datasets.html

    Pour avoir des points en 2D, tu peux faire une pca, par exemple.

  3. #3
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut
    ouh là là .. Ok je vais regarder..

    Et toi, tu disais que tu faisais de recherches sur le clustering.. Tu n'as pas des exemples de nuages ?

    En fait à l'heure actuele j'ai 765 nuages, couvrant de 5 points à 95000, dont environ 60 entre 10 000 et 100 000 en environ 100 entre 100 et 10 000..

    Sauf que ce sont tous des nuages issus d'impacts de foudre.

    J'aimerais complèter surtout bien évidemment au dessus de 10 000, voire au dessus de 100 000, mais aussi beaucoup entre 1000 et 10 000.. surtout avec d'autres phénomènes ou procédés (silhouettes, crues, ?? batiments, intersections, agglomérations, etc..)..

    Mais bon, merci, je vais essayer avec ça..


    Et pour l'aspect études - et/ou calculs ou preuves - du nombre de sommets / nombre de points (parce que d'après mes graphiques j'ai comme une loi qui en sort), j'aimerais bien si quelqu'un a déjà entendu parlet de quelque chose..
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  4. #4
    Invité
    Invité(e)
    Par défaut
    Bonjour,

    Si tu veux je peux te sortir des points :
    - Bâtiments (cela sera le centroïde) avec découpage par ville, département, etc.
    - Villes (coordonnées du chef lieu)


    Il faut que je réfléchisse mais je pense avoir d'autres données possibles.

  5. #5
    Membre expérimenté Avatar de davcha
    Profil pro
    Inscrit en
    Avril 2004
    Messages
    1 258
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 1 258
    Points : 1 539
    Points
    1 539
    Par défaut
    En effet, j'ai ça, mais pas en 2 dimensions, d'où la PCA. Maintenant c'est vrai que la PCA doit changer un certain nombre de choses dans la validation de ta "loi".

    Mais tu peux essayer de générer des données de diverses formes. Si c'est une loi universelle, tu la retrouveras malgré tout.

    Quelques autres plus gros et plus intéressants pour toi, peut-être, ici : http://cs.joensuu.fi/sipu/datasets/
    Surtout à la fin.

  6. #6
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par _-Slash-_ Voir le message
    Bonjour,

    Si tu veux je peux te sortir des points :
    - Bâtiments (cela sera le centroïde) avec découpage par ville, département, etc.
    - Villes (coordonnées du chef lieu)


    Il faut que je réfléchisse mais je pense avoir d'autres données possibles.
    oui, ce serait super

    Surtout si ça peut être en X,Y plutôt que Lat/lon (je peux convertir, mais il me faurait alors le datum et la projection et ses paramètres). (les figures ou répartions en lat-lon ne sont pas tout à fait similaires aux x,y). Mais enfin de touts façons ce serait une bonne indication, même en lat-lon..


    @davcha : je ne sais pas si c'est universel, mais il y a bien l'air d'y avoir une loi .. Y compris pour une enveloppe convexe.. et assez simple de surcroît..
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  7. #7
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par davcha Voir le message
    Quelques autres plus gros et plus intéressants pour toi, peut-être, ici : http://cs.joensuu.fi/sipu/datasets/
    Surtout à la fin.
    oui c'est bien, j'en ai pris quelques uns..

    Je vais déjà vérifier là-dessus.. Et peut-être avec quelques uns que _-Slash-_ peut éventuellement fournir.. Ce serait super..

    Si ça se confirme, alors soit je met juste une note que ça se confirme dans d'autres domaines, soit je complète - peut-être un article séparé juste là-dessus de quelques pages ..

    Comme quoi, l'approche physique et non-théorique peut réserver des suprises
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  8. #8
    Membre expérimenté Avatar de davcha
    Profil pro
    Inscrit en
    Avril 2004
    Messages
    1 258
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 1 258
    Points : 1 539
    Points
    1 539
    Par défaut
    Citation Envoyé par souviron34 Voir le message
    Comme quoi, l'approche physique et non-théorique peut réserver des suprises
    Ca j'ai jamais dit le contraire. En ce moment, je fais beaucoup de tests empiriques également. Et d'ailleurs, dans le thread juste en dessous du tien (weighted kernel k-means...) j'en parle vaguement, mais bref.

  9. #9
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut
    Bon, alors en fouillant, j'ai trouvé déjà un bon repository d'images médicales assez facilement exploitables et correctes pour mon but :

    National Institue on Aging, avec pleins d'images de mitochondries, d'ADN, etc etc..

    Il va falloir que je me fasse un petit prog pour lire les tiff et dumper les points au dessus d'un seuil en x,y, mais ça devrait marcher.

    J'ai aussi trouvé (mais il n'y a plus rien en ligne, il faut écire au gars, ce que j'ai fait) un site (italien) avec des images de visages.

    Dans le dernier lien que tu as donné, davcha, il y a quelques bons sets (mais ils seront plus à utiliser pour l'algo en lui-même que pour cette loi)

    Je n'a pas encore examiné en détail le premier lien..

    Ensuite, si _-Slash-_ peut me fournir des sets comme il dit, ce serait super..

    Voilà.. Je vous reviens plus tard

    Et merci déjà pour vos efforts..
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  10. #10
    Membre expérimenté Avatar de davcha
    Profil pro
    Inscrit en
    Avril 2004
    Messages
    1 258
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 1 258
    Points : 1 539
    Points
    1 539
    Par défaut
    octave (http://www.gnu.org/software/octave/) peut lire des tifs.

  11. #11
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut
    Merci à tous..

    Avec les lens et autres que vous m'avez fourni, j'ai un échantillon assez divers..

    Je met cette discussion en Résolu, mais je vous tiens au courant des suites..




    @Davcha : avec les jeux de données du deuxième lien que tu as donné (les clusters 2D), ça suit la loi, mais avec des coefficients plus faibles, et il n'ya pas de bruit, et de plus pour les contours convexes ça suit une loi inverse. Je pense que c'est dû à l'artificialité de la fabrication des jeux de données (ils sont synthétiques, et ils sont statistiquement symétriques) . Mais du coup ls donnent une bonne limite inférieure..
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  12. #12
    Membre expérimenté Avatar de davcha
    Profil pro
    Inscrit en
    Avril 2004
    Messages
    1 258
    Détails du profil
    Informations personnelles :
    Âge : 42
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 1 258
    Points : 1 539
    Points
    1 539
    Par défaut
    Quel suspense !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 0
    Dernier message: 13/05/2010, 13h19
  2. Probleme dans une boucle for, faisant appel a une fonction
    Par mapotam dans le forum Shell et commandes GNU
    Réponses: 3
    Dernier message: 22/01/2010, 21h41
  3. multipart/form-data et données textuelles
    Par LDDL dans le forum Langage
    Réponses: 2
    Dernier message: 03/06/2009, 10h16
  4. Réponses: 6
    Dernier message: 04/04/2009, 19h51
  5. QString data(), appel mauvaise fonction
    Par Gulish dans le forum Qt
    Réponses: 9
    Dernier message: 22/07/2008, 11h18

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo