Bonjour à tous et à toutes,
Je vais tâcher d'être le plus clair possible quand au problème que je rencontre actuellement. N'hésitez surtout pas à me demander plus de précisions si jamais je ne le serais pas !
Mon objectif est d'arriver à créer un tableau de fonctionnements de stations sismologiques en fonctions du temps. En gros, j'aimerais réaliser un tableau qui me dira pour une date donnée quelles sont les stations où des données sont disponibles, par exemple avec un code couleur vert=présence de données et rouge= absence de données.
Ce qu'il faut savoir :
- Les données sont classées par directory de la forme suivante : AAAA(année) / NETWORK(nom du réseau de sismomètre) / STATION(identifiant du sismomètre) / CHANNEL(autre identifiants) / Nom du fichier. (exemple : " /2010 / FR / ANTF / HHZ.D / nom du fichier")
- Le nom du fichier est toujours de la forme suivante : NETWORK . STATION . LOC(autres identifiants) . CHANNEL . AAAA . JJJ(jour julien de l'année) ( exemple: " FR . ANTF . 00 . HHZ.D . 2010 . 001 ")
- J'ai donc un fichier par jour de l'année correspondant à un sismomètre identifié selon son nom STATION.
Sachant cela, j'aimerais réussir a créer une matrice dont chaques lignes correspondra aux stations et chaques colonnes à une date. L'idée de base serait de remplir cette matrice avec des 1 et des 0. le 1 pour la présence de données à cette date et le 0 pour l'absence.
J'ai commencer à écrire un petit bout de code, mais étant débutant en python je me suis rapidement retrouvé coincé..
Voilà à quoi ressemble mon script :
Le résultat du code me donne un vecteur que j'ai appellé list_presence dont la taille est égale à mon nombre de stations mais qui est remplis que de 0...
Merci d'avance pour toute aide ou conseils que vous pourriez me donner.
Partager