IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

Problème difficile


Sujet :

Algorithmes et structures de données

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre Expert Avatar de Nemerle
    Inscrit en
    Octobre 2003
    Messages
    1 106
    Détails du profil
    Informations personnelles :
    Âge : 55

    Informations forums :
    Inscription : Octobre 2003
    Messages : 1 106
    Par défaut Problème difficile
    Je dispose de 10 000 vecteurs ayant 10 000 composantes chacuns.

    Le but du jeu est d'essayer de les regrouper en paquets de vecteurs "proches". Par exemple, si j'ai 6 vecteurs à une dimension, par xemple 1,2, 11,12,13, 33 j'aimerai avoir 3 paquets [1,2], [11,12,13] et [33].

    La première idée qui vient est d'utiliser la norme quadratique: si V et W sont deux tels vecteurs, N(V,W)=racine_carrée(somme((Vi-Wi)^2)).

    Avec cette norme, on pourrait essayer de recouvrir l'espace R^10000 de sphères englobant nos 10000 vecteurs de façon "intelligentes". Mais attention au temps de calcul...

    Quelqu'un a-t-il déjà travaillé sur un problème similaire??

  2. #2
    Inactif   Avatar de Médiat
    Inscrit en
    Décembre 2003
    Messages
    1 946
    Détails du profil
    Informations forums :
    Inscription : Décembre 2003
    Messages : 1 946
    Par défaut
    Analyse en clusters (en Composantes principales)

  3. #3
    Membre Expert Avatar de Nemerle
    Inscrit en
    Octobre 2003
    Messages
    1 106
    Détails du profil
    Informations personnelles :
    Âge : 55

    Informations forums :
    Inscription : Octobre 2003
    Messages : 1 106
    Par défaut
    tu peux développer?

  4. #4
    Membre chevronné
    Profil pro
    Enseignant
    Inscrit en
    Avril 2004
    Messages
    440
    Détails du profil
    Informations personnelles :
    Localisation : France, Puy de Dôme (Auvergne)

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Avril 2004
    Messages : 440
    Par défaut
    Le principe est de se placer dans l'espace à 10 000 paramètres (cad tes 10 000 composantes), et de voir là où il y a des amas de points...

    Le clustering permet de repérer ces groupements...
    Pour ça plusieurs méthodes, dont l'une des plus efficaces est l'algorithme des k-moyennes : c'est un algo qui récursivement scinde l'espace en K régions...

    On en a déjà parlé il y plusieurs mois sur ce forum, fais une recherche...

    Sinon les mots clés pour Google sont clustering et K-means...

    A+

  5. #5
    Rédacteur

    Avatar de Matthieu Brucher
    Profil pro
    Développeur HPC
    Inscrit en
    Juillet 2005
    Messages
    9 810
    Détails du profil
    Informations personnelles :
    Âge : 43
    Localisation : France, Pyrénées Atlantiques (Aquitaine)

    Informations professionnelles :
    Activité : Développeur HPC
    Secteur : Industrie

    Informations forums :
    Inscription : Juillet 2005
    Messages : 9 810
    Par défaut
    L'ACP te permettra de trouver un espace où tes points "évoluent le plus".
    Autre solution, l'algorithme du mean-shift. C'est un peu comme le K-mean, mais pas vraiment non plus

  6. #6
    Membre Expert Avatar de Nemerle
    Inscrit en
    Octobre 2003
    Messages
    1 106
    Détails du profil
    Informations personnelles :
    Âge : 55

    Informations forums :
    Inscription : Octobre 2003
    Messages : 1 106
    Par défaut
    j'ai trouvé http://www2.unil.ch/imm/MM/MQ2/MQ2_F...chapitre_5.pdf

    c'est du tout bon il me semble

  7. #7
    Inactif   Avatar de Médiat
    Inscrit en
    Décembre 2003
    Messages
    1 946
    Détails du profil
    Informations forums :
    Inscription : Décembre 2003
    Messages : 1 946
    Par défaut
    C'est le site que j'utilise pour tous les problèmes de statistiques multivariés (j'aurais dû te l'indiquer, désolé ).

    Les autres chapitres sont très bien aussi.

  8. #8
    Membre Expert Avatar de Nemerle
    Inscrit en
    Octobre 2003
    Messages
    1 106
    Détails du profil
    Informations personnelles :
    Âge : 55

    Informations forums :
    Inscription : Octobre 2003
    Messages : 1 106
    Par défaut
    Mon bon mediat, tu es pardonné

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Problème difficile à expliquer : temporisation et affichage
    Par moijekikoote dans le forum ASP.NET
    Réponses: 2
    Dernier message: 03/02/2011, 13h23
  2. Un problème difficile de séquençage d'enregistrements.
    Par WinNew dans le forum Langage SQL
    Réponses: 2
    Dernier message: 16/08/2010, 11h49
  3. Etrange problème, difficile solution
    Par Shonagon dans le forum PostgreSQL
    Réponses: 1
    Dernier message: 22/09/2006, 15h38
  4. problème de démarrage et de choix difficiles
    Par averty dans le forum Décisions SGBD
    Réponses: 8
    Dernier message: 04/08/2005, 17h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo