Publicité
+ Répondre à la discussion
Affichage des résultats 1 à 4 sur 4
  1. #1
    Candidat au titre de Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    janvier 2012
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Services à domicile

    Informations forums :
    Inscription : janvier 2012
    Messages : 57
    Points : 12
    Points
    12

    Par défaut expressions regulieres en perl

    Bonjour,

    je veux parse un fichier csv ou les champs sont separer par \t avec les expressions regulieres, mais j'ai un probleme avec un champs.

    Voila un exemple de ligne que jèai dans mon fichier:


    AAGASWIQFDEPLLVMDLDSHK 3 AAGASWIQFDEPLLVM[Oxidation (M)]DLDSHK 0 0

    AAFDEAEK 2 0 0 0

    je parse comme suite:
    Code :
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
     
     
    while (<F>){
    		if ($_ =~/^(\w+)\t(\d+)\t(\w+)\t(\d+)\t*/){
    		$sequence = "$1";
    		$charge = "$2";
    		$modification = "$3";
     
    		print OUT "$sequence\t$charge\t$modification\n";
    	}
    }
    Mon probleme c'est que j'arrive pas à recupere jute le champs modification, car ce champs parfois j'ai un truc comme cela :
    AAGASWIQFDEPLLVM[Oxidation (M)]DLDS
    parfois
    AAGASWIQFDEPLLVM
    et parfois j'ai rien

  2. #2
    Membre chevronné Avatar de Gardyen
    Profil pro
    Inscrit en
    août 2005
    Messages
    578
    Détails du profil
    Informations personnelles :
    Âge : 34
    Localisation : France

    Informations forums :
    Inscription : août 2005
    Messages : 578
    Points : 758
    Points
    758

    Par défaut

    ce n'est pas plus simple d'utiliser split ?
    Code :
    1
    2
    3
    4
    5
    while (<IN>){
    	chomp;
    	my ($sequence, $charge, $modification) = split /\t/;
    	print "$sequence\t$charge\t$modification\n";
    }
    avec juste un test sur l'une des valeurs si besoin est
    Nous les geeks, c'est pas qu'on a une case en moins, c'est juste qu'on compte à partir de zéro.
    Plus les choses changent, plus elles restent les mêmes

  3. #3
    Membre régulier Avatar de elvivo
    Inscrit en
    mai 2002
    Messages
    105
    Détails du profil
    Informations forums :
    Inscription : mai 2002
    Messages : 105
    Points : 71
    Points
    71

    Par défaut

    Sinon pour repondre a la question initiale, ta regex matche le 3e champ par \t(\w+)\t, or dans ton example, AAGASWIQFDEPLLVM[Oxidation (M)]DLDSHK ne contient pas que des \w. Il y a les [] et les () qui empeche la regex de fonctionner.

    Mais je suis d'accord avec Gardyen. Un split sera plus simple si tu es certain que les champs ne peuvent pas contenir le separateur.
    In code we trust !!

  4. #4
    Candidat au titre de Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    janvier 2012
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Services à domicile

    Informations forums :
    Inscription : janvier 2012
    Messages : 57
    Points : 12
    Points
    12

    Par défaut

    Oui C plus simple!!!

    Merci

+ Répondre à la discussion
Cette discussion est résolue.

Liens sociaux

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •