Bonjour,
J’aimerais créer un script pour lire et faire des combinaisons de plusieurs fichiers xls en un seul csv final, puis ajouter des données à partir d’un autre fichier et enfin faire des calculs. Voici les explications pas à pas de ce que j’aimerais faire avec des fichiers exemples, est-ce que quelqu’un pourrait m’aider svp ?
Un grand merci par avance ,
M.
Étapes (tous les fichiers mentionnés dessous sont joints à mon message):
1- J’ai plusieurs fichiers de base construits de la manière suivante : un fichier par année et par lieu, les fichiers sont nommés comme ceci : especeAnnee_Cplieu_NomEssai_typeEssai
Donc pour les 4 fichiers de base exemples ici ça donne par exemple : « cm2019_1250_20_type1 », « cm2019_1600_20_type1 », « cm2020_1250_20_type1 », « cm2020_1600_20_type1 ».
Dans chacun des 4 fichiers il y a pour une année et un lieu donné : 2 variétés et 3 réplicats et la donnée mesurée qui est le rendement.
On a en plus l’info d’une station correspondante et les colonnes dates de plantation et dates de récolte.
La première chose que je veux faire c’est réunir ces 4 fichiers en un seul sur base des entêtes comme dans le fichier final exemple « setFinal ».
2- Ensuite j’aimerais dans le fichier « setFinal » modifier des infos dans la colonne « station », càd : pour le lieu « Cplieu» = 1250 on a station = stn1 et j’aimerais remplacer par stn3 ; puis pour le lieu Cplieu = 1600 on à stn 2 et j’aimerais remplacer par stn 4.
Puis j’aimerais ajouter des colonnes à partir d’un autre fichier « date2 » dans ce fichier « setFinal » ; j’aimerais récupérer les 3 colonnes du fichier date2 «datePlantation2 », « dateRecolte2 » et « infoEssai » et les ajouter dans setFinal pour les lignes qui ont la même année « annee » et le meme lieu « lieuID » entre les 2 fichiers « date2 » et « setFinal »
Ça donne le fichier exemple « setFinal2 »
3- Enfin ; j’aimerais dans le fichier « setFinal 2 », pour les colonnes « datePlantation2 » et « dateRecolte2 » si il y a « NA » dans les 2, alors calculer une date moyenne et la remplacer dans la case pour chacune des 2 colonnes basée sur la moyenne de « datePlantation2 » et « dateRecolte2 » du reste du fichier pour lesquelles on a des données.
Ça donne « setFinal3 ».
cm2020_1250_20_type1.xlsx cm2019_1600_20_type1.xlsx cm2019_1250_20_type1.xlsx cm2020_1600_20_type1.xlsx dates2.xlsx setFinal.xlsxsetFinal2.xlsx setFinal3.xlsx
Partager