IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

Calcul de distances (géographiques)


Sujet :

SAS STAT

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 17
    Points : 13
    Points
    13
    Par défaut Calcul de distances (géographiques)
    Bonjour,

    J'ai besoin d'aide pour écrire un programme sur SAS car je ne parviens pas en m'en sortir toute seule.
    En fait, je dispose de 800 bassins de vie (répondant à des critères précis). Pour chaque bassin de vie (i), je dispose de coordonnées géographiques : un bassin de vie (i) est associé à un point (i) ayant les coordonnées {latitude xi ; longitude yi}.
    Je souhaite calculer la distance entre chaque point et son plus proche voisin. NB/ Distance euclidienne donnée par la formule : Dij = RACINE [ (xi – xj)² + (yi – yj)² ].

    Je pense que je dois calculer les distances entre chaque point. Puis, pour chaque point i, identifier le point j avec qui la distance est la plus faible. Mais, je ne sais pas comment m'y prendre sans rentrer dans une usine à gaz!
    Peut-être une personne parmi vous a-t-elle écrit un programme répondant à une telle question?
    En vous remerciant par avance,
    Claudine

    NB/ Je ne suis pas sûre que mon message soit bien placé (sas stat)... mais j'avais un message d'erreur quand j'arrivais sur la page (sas macro).

  2. #2
    Membre expérimenté
    Avatar de MEGAMIND2
    Homme Profil pro
    Paris
    Inscrit en
    Janvier 2011
    Messages
    1 029
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Paris

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 029
    Points : 1 489
    Points
    1 489
    Par défaut
    Salut,
    On peut voir un échantillon de ta donnée?
    ps: C'est de la recherche opérationnelle ça!

  3. #3
    Expert confirmé
    Avatar de olivier.decourt
    Homme Profil pro
    Formateur R/SAS/statistiques
    Inscrit en
    Avril 2008
    Messages
    2 064
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France

    Informations professionnelles :
    Activité : Formateur R/SAS/statistiques
    Secteur : Conseil

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 064
    Points : 4 478
    Points
    4 478
    Par défaut
    Il faudrait regarder du côté de la proc DISTANCE.
    Avant son invention, j'avais dû coder des choses de ce genre pour faire du lissage géographique (donc pas de recherche op, Brice) : a priori c'est plus simple à coder en utilisant les produits cartésiens de la proc SQL.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    DATA work.points ;
      INPUT id x y ;
    DATALINES ;
    1 3 4
    2 3 5
    3 4 3
    4 -2 -1
    5 -3 -3
    6 -2 -2
    ;
    RUN ;
    DATA work.bassins ;
      INPUT id $ x y ;
    DATALINES ;
    A 1.5 1.5
    B 0 0
    C -4 -1
    ;
    RUN ;
    PROC SQL ;
     CREATE TABLE work.rattachements AS
      SELECT a.id AS id_point, b.id AS id_bassin,
                 SQRT((a.x-b.x)**2+(a.y-b.y)**2) AS distance
      FROM work.points AS a,
              work.bassins AS b
      GROUP BY a.id
      HAVING distance=MIN(distance)
      ;
    QUIT ;
    Par contre la solution SQL sera forcément assez lente d'emploi, donc si tu peux optimiser avec une proc DISTANCE (si elle répond à ton besoin) c'est toujours ça de pris.
    Bon courage.
    Olivier

  4. #4
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 17
    Points : 13
    Points
    13
    Par défaut
    Je vais essayer via la proc SQL car j'ai regardé la proc DISTANCE et à ma première lecture (trop rapide cependant), cela me paraissait un peu compliqué...

    Sinon, concernant un extrait :

    _N_ ; BV ; Long ; Lat
    1 ; 10033 ; 0.08168 ; 0.84215
    2 ; 1004 ; 0.094664 ; 0.802987

    Etc.

    Je m'y mets de ce pas...

  5. #5
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 17
    Points : 13
    Points
    13
    Par défaut
    Me-revoici,

    Alors, j'ai tapé la PROC SQL. Par contre, la distance minimale est chaque fois égale à 0. Ce qui est logique car le fichier "points" et le fichier "bassins" contiennent les mêmes informations. Du coup, la distance est minimale entre le bassin de vie et lui-même... (je ne sais pas si je suis très claire).

    Mais bon, j'ai bidouillé. Comme je ne connais pas du tout l'écriture SQL, j'ai juste enlevé la dernière phrase "HAVING distance=MIN(distance)". Et j'ai eu bien sûr un message d'erreur. Cependant, le fichier en sortie contient toutes les distances par bassin. Et je n'ai plus qu'à faire un PROC MEANS pour identifier les distances minimales (non nulles) par bassin.

    En tout cas, merci beaucoup pour votre aide,
    Claudine

  6. #6
    Nouveau membre du Club
    Homme Profil pro
    Inscrit en
    Avril 2011
    Messages
    29
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2011
    Messages : 29
    Points : 32
    Points
    32
    Par défaut
    si les identifiants des "points" et des "bassins" sont les mêmes tu peux simplement rajouter

    avant le GROUP BY de ta proc sql.

  7. #7
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 17
    Points : 13
    Points
    13
    Par défaut
    ... du coup, l'écriture est bien plus propre! Merci!

  8. #8
    Membre expérimenté
    Avatar de MEGAMIND2
    Homme Profil pro
    Paris
    Inscrit en
    Janvier 2011
    Messages
    1 029
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Paris

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 029
    Points : 1 489
    Points
    1 489
    Par défaut
    Une autre approche avec la proc distance:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    data stock; 
          title 'Stock Dividends'; 
          input compname &$26.  Long Lat 
                                ; 
          datalines; 
       Cincinnati                   8.4    8.2 
       Texas                        7.9    8.9 
       Detroit                      9.7   10.7 
       Orange                       6.5    7.2 
       Kentucky                     6.5    6.9 
       Kansas                       5.9    6.4 
       Union                        7.1    7.5 
       Dominion                     6.7    6.9 
       Allegheny               	    6.7    7.3 
       Minnesota       				5.6    6.1 
       Iowa_Ill       				7.1    7.5 
       Pennsylvania     			7.2    7.6 
       Oklahoma        				6.1    6.7 
       Wisconsin               		5.1    5.7 
       Green           				7.1    7.4 
       ; 
     
    run;
     
     
       proc distance data=stock method=EUCLID out=dist_euclidienne; 
          var interval(Long Lat); 
          id compname; 
       run; 
     
       proc sql;
       select compname into:l separated by " " from dist_euclidienne;
       quit;
     
       DATA dist_euclidienne;
       SET dist_euclidienne;
       array vect(*) &l.;  
       do i=1 to dim(vect);
       if vect(i)=0 then vect(i)=.;
       end;
       distance_minimale=min(of &l.);
       if  missing(distance_minimale) then  distance_minimale=0;
       drop i;
     
       run;

  9. #9
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    20
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2011
    Messages : 20
    Points : 14
    Points
    14
    Par défaut
    Bonjour, je ne pense pas que tu puisses appliquer une distance euclidienne à des coordonnées longitudes et Latitudes.

    essaye ce code : cela créé la distance 2 a 2 et retient tous les individus (id!!)ayant une distance < à 50km.

    Attention c'est tres long...

    Tu peux verifier apres tes reponses avec google map (il y a une option distance)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
     
    %let R = 6378;
    %let Pi = 3.14159265358979;
     
     
    data coord; set coord 
    if Latitude ne . ;
    bool=1;
    rang = _N_;
    nX=(2/360)*&pi.*Latitude;
    nY=(2/360)*&pi.*Longitude;
    run;
     
     
    data coord_b; set coord; 
    if Latitude ne . ;
    bool=1;
    nbx = (2/360)*&pi.*Latitude;
    nby = (2/360)*&pi.*Longitude;
    run;
     
     
     
    options compress=yes;
     
    %macro distance;
     
    %do i=1 %to xxxxx;   /* indiquer ici le nombre d'observation totale */
     
    		proc sql; create table coord&i. as select a.id, b.id as idb,
    		(&R. * (&Pi./2 - arsin( sin(nbx) * sin(nX) + cos(nby - nY) * cos(nbx) * cos(nX)))) as distance
    		from coord as a, coord_b as b
    		where a.bool = b.bool
    		and rang = &i.
    		order by 1,3;
    		quit;
    		run;
     
    proc append base=coord data=coord&i.(where=((distance lt 50) and (id ne idb)));
    run;
     
    proc delete data=coord&i.; run;
    %end;
    %mend;
     
    %distance;

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 2
    Dernier message: 11/03/2010, 14h53
  2. Problème et questions sur un calcul de distance
    Par ale2000 dans le forum Traitement d'images
    Réponses: 7
    Dernier message: 11/09/2007, 20h33
  3. Calculer des distances géodésiques
    Par ToTo13 dans le forum Algorithmes et structures de données
    Réponses: 2
    Dernier message: 30/11/2006, 08h59
  4. Calcul de distance entre deux points en WGS84
    Par marieR dans le forum Langage
    Réponses: 5
    Dernier message: 03/08/2006, 17h07
  5. [GEOMETRIE] calcul de distance dans un triangle
    Par gronaze dans le forum Mathématiques
    Réponses: 10
    Dernier message: 29/06/2006, 10h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo