expressions regulieres en perl

**hajarita** · 05/12/2012, 15h35

Bonjour,

je veux parse un fichier csv ou les champs sont separer par \t avec les expressions regulieres, mais j'ai un probleme avec un champs.

Voila un exemple de ligne que jèai dans mon fichier:

AAGASWIQFDEPLLVMDLDSHK 3 AAGASWIQFDEPLLVM[Oxidation (M)]DLDSHK 0 0

AAFDEAEK 2 0 0 0

je parse comme suite:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
 
 
while (<F>){
		if ($_ =~/^(\w+)\t(\d+)\t(\w+)\t(\d+)\t*/){
		$sequence = "$1";
		$charge = "$2";
		$modification = "$3";
 
		print OUT "$sequence\t$charge\t$modification\n";
	}
}

Mon probleme c'est que j'arrive pas à recupere jute le champs modification, car ce champs parfois j'ai un truc comme cela :
AAGASWIQFDEPLLVM[Oxidation (M)]DLDS
parfois
AAGASWIQFDEPLLVM
et parfois j'ai rien

**Gardyen** · 05/12/2012, 16h21

ce n'est pas plus simple d'utiliser split ?

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
while (<IN>){
	chomp;
	my ($sequence, $charge, $modification) = split /\t/;
	print "$sequence\t$charge\t$modification\n";
}

avec juste un test sur l'une des valeurs si besoin est

**elvivo** · 05/12/2012, 17h42

Sinon pour repondre a la question initiale, ta regex matche le 3e champ par \t(\w+)\t, or dans ton example, AAGASWIQFDEPLLVM[Oxidation (M)]DLDSHK ne contient pas que des \w. Il y a les [] et les () qui empeche la regex de fonctionner.

Mais je suis d'accord avec Gardyen. Un split sera plus simple si tu es certain que les champs ne peuvent pas contenir le separateur.

**hajarita** · 05/12/2012, 18h44

Oui C plus simple!!!

Merci

expressions regulieres en perl

Langage Perl

Discussions similaires

Partager

Partager