IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Mathématiques Discussion :

Calcul de corrélation


Sujet :

Mathématiques

  1. #1
    Membre habitué Avatar de M.Max
    Homme Profil pro
    Inscrit en
    Décembre 2009
    Messages
    90
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Décembre 2009
    Messages : 90
    Points : 127
    Points
    127
    Par défaut Calcul de corrélation
    Bonjour à tous,

    Dans cet article http://www.cs.ucr.edu/~eamonn/LogicalShapelet.pdf est réalisé un calcul de corrélation entre deux séries temporelles n'ayant pas la même longueur (Page 2, formule 3).

    Après quelques recherches j'ai du mal à me faire une idée de la robustesse de cette approche. Qu'en pensez-vous ?

  2. #2
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut
    en fait, de ce que je comprend, c'est ce qui est expliqué plus bas :

    To achieve this, the shorter time series is slid against the
    longer one to find the best possible alignment between them. We
    call this distance measurement the subsequence distance and define
    it as sdist(x; y) = .... (3)

    In the above definition y and y denote the mean and standard
    deviation of m consecutive values from y starting at position l+1.
    Note that, sdist is not symmetric.
    Pour ce qui est de la robustesse, comme ils introduisent un ouveau concept, relativement difficile à dire comme ça...

    Je suppose (j'ai la flemme de regarder plus précisément) que étant une mesure statistique de distance (somme des min), c'est valable et robuste dans la mesure où on accepte cette notion...

    Maintenant, je laisse à des spécialistes de la question le soin de répondre plus précisément..
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  3. #3
    Membre habitué Avatar de M.Max
    Homme Profil pro
    Inscrit en
    Décembre 2009
    Messages
    90
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Décembre 2009
    Messages : 90
    Points : 127
    Points
    127
    Par défaut
    Citation Envoyé par souviron34 Voir le message
    Pour ce qui est de la robustesse, comme ils introduisent un ouveau concept, relativement difficile à dire comme ça...

    Je suppose (j'ai la flemme de regarder plus précisément) que étant une mesure statistique de distance (somme des min), c'est valable et robuste dans la mesure où on accepte cette notion...
    In fine ça ne me semble pas utilisable tel quel. Ils utilisent cette approche sans aucune démonstration ni test empirique (indépendamment de la méthodo globale).

    Merci pour ta réponse souviron.

  4. #4
    Membre éclairé
    Homme Profil pro
    Ingénieur R&D en apprentissage statistique
    Inscrit en
    Juin 2009
    Messages
    447
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur R&D en apprentissage statistique

    Informations forums :
    Inscription : Juin 2009
    Messages : 447
    Points : 752
    Points
    752
    Par défaut
    Il me semble qu'il y a une petite erreur dans la formule (3) ce devrait être un
    max et non un min.

    En dehors de cela je ne vois pas de problème avec cette mesure de distance (ou de corrélation) hormis le fait qu'elle suppose que les deux séries sont échantillonnée à la même échelle de temps. Et qu'il ne s'agit pas de savoir si
    deux séquences se ressemblent mais plus de savoir à quel point la séquence la plus courte peut être considérée comme une sous séquence de la plus grande.

  5. #5
    Membre expérimenté
    Homme Profil pro
    Chercheur
    Inscrit en
    Mars 2010
    Messages
    1 218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Mars 2010
    Messages : 1 218
    Points : 1 685
    Points
    1 685
    Par défaut
    Bonjour,

    pour commencer la distance définie dans le papier n'est pas une distance. Ensuite, le coefficient de corrélation peut se comprendre comme suit. On dispose de deux séries temporelles X et Y de longueurs respectives n et m avec m<=n. Pour chaque sous-suite X' de X de longueur m au sens de la définition 1, on calcule le coefficient de corrélation C(X',Y) défini par la formule 1. Le coefficient de corrélation C_s(X,Y) est alors défini comme le minimum parmi les valeurs C(X',Y). Ainsi, toute une partie de X est totalement ignorée et Y sera corrélée de la même manière avec toutes les séries qui auront en commun la même sous-suite X' de longueur m qui minimise C(X',Y). A priori, intuitivement, je dirais donc que cette mesure perd d'autant en signification/robustesse que m est petit devant n mais c'est à explorer. A part cela, la définition d'une série temporelle me paraît un peu légère et la notion de continuité évoquée dans la définition 1 n'est pas clair alors que c'est justement les régularités des séries X et Y qui devraient intervenir dans la définition de la corrélation.

Discussions similaires

  1. Calcul de corrélation
    Par Fiabulu dans le forum MATLAB
    Réponses: 2
    Dernier message: 11/12/2010, 12h32
  2. Réponses: 2
    Dernier message: 20/05/2010, 18h35
  3. Réponses: 4
    Dernier message: 31/03/2010, 14h37
  4. Réponses: 1
    Dernier message: 15/06/2008, 20h37
  5. Calcul de corrélation sous VB
    Par oliver75 dans le forum Mathématiques
    Réponses: 1
    Dernier message: 21/06/2007, 10h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo