Bonjour à tous,
Je suis étudiant et je travaille sur l’analyse des données d’un parc éolien. Pour le moment, je ne suis qu’à l’importation des données et je rencontre déjà des problèmes.
Vous trouverez les données en pièces-joints: fichier csv, code R et imprime écran d'un soucis d'encodage de mon fichier .R
Lors de l’acquisition, je me rend compte que colonne « Puissance active » est reconnue comme étant faite de « character ».
J’ai donc cherché encore et encore pourquoi R ne reconnaissait pas cette variable comme étant un « numeric ».
A première vue je croyais à un problème de séparateur de milliers car aux alentours de la ligne 536 on remarque que espace sépare le chiffre des milliers des centaines.
J’ai donc essayé d’utiliser la fonction « gsub » pour retirer l’espace, mais à ce moment la fonction n’a pas eu d’effets…
En extrayant la valeur de production de la ligne 536 j’ai aussi pu constater que R ne reconnait pas l’espace et me sort le caractère suivant : �
Par un bête copier/coller, j’ai donc aussi essayé de substituer le � par rien avec gsub et comme je m’y attendais erreur…
Donc là je sèche et sollicite l’expérience des membres de ce forum.
Auriez-vous une idée du problème et une solution à celui-ci ? Est-ce un problème d’encodage du fichier initial ?
Please Help.
En vous remerciant par avance
Partager