Question avec un GREP

**kanabzh29** · 19/05/2009, 14h38

Bonjour,

Dans un fichier je récupére toutes les lignes d'un fichier log contenant le mot 'ERROR' .

Dans chacune des lignes récupérées il y a la date, plusieurs mots, ainsi que le chemin absolue du fichier ayant causé l'erreur.

J'aimerais pour chacune des lignes récupéré uniquement le fin de la ligne a partir du mot ERROR, mais je n'y arrive pas.

Voila mon code :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
 
#!/bin/bash
clear
 
if [ $# != 2 ] 
then
	echo "SYNTAXE : ./searchError.sh fichierSource fichierDestination"
	exit 2
else
	if [ -f "$2" ]
	then
		touch "$2"
	else
		sed -n '/ERROR /p' "$1" > "$2" | grep "^ERROR"
	fi
fi

**matafan** · 19/05/2009, 15h00

Pas besoin de grep :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -n 's/^ERROR //p'

**lennelei** · 19/05/2009, 19h19

ou alors

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

grep "^ERROR " $1 | cut -c 7-

sans doute plus rapide que sed... mais bon, c'est pour chipoter =) sur des fichiers de quelques mégas, ça ne se verra pas...

**jmelyn** · 19/05/2009, 19h41

Bonjour,

Le problème n'est pas très clair. Je suppose que:

le mot "ERROR" peut apparaître n'importe où,
il faut écrire tout ce qu'il y a après le mot "ERROR"

Une commande qui marche:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

awk '{gsub(".*ERROR ", ""); print}' fichier_entree > fichier_sortie

**jmelyn** · 19/05/2009, 19h47

Avec les mêmes hypothèses et en utilisant sed:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed 's/.*ERROR \(.*\)/\1/' fichier_entree > fichier_sortie

**lennelei** · 25/05/2009, 10h32

mmhh, bonne remarque, j'étais parti sur l'exemple donné par l'auteur de la question :p

Cela étant, ta commande avec sed ne va pas virer les lignes qui ne contiennent pas ERROR ! Il faut au moins ça :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -n 's/.*ERROR \(.*\)/\1/p'

En revanche, pas la peine d'avoir les parenthèses et le \1:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -n 's/.*ERROR //p'

C'est quand même plus rapide !

De plus, j'aurais tendance à sécuriser un peu la chose pour éviter de retourner des mots comme SYSERROR ou ERRORTOTAL ou autres (bien que le problème initial n'en tienne pas compte) :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -n 's/.*\bERROR\W//p' $1

Par exemple...

Mais encore une fois, grep sera plus rapide :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

grep -o "\bERROR\W.*" test |cut -c 7-

Les \W étant à adapter en fonction du format des erreurs possibles...

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
$ wc -l test
10000000 test
$ time grep -o "\bERROR\W.*" test |cut -c 7- > test_grep
real    0m26.637s
user    0m4.860s
sys     0m19.270s
$ time sed -n 's/.*\bERROR\W\(.*\)/\1/p' test > test_sed1
real    1m45.931s
user    1m4.990s
sys     0m39.000s
$ time sed -n 's/.*\bERROR\W//p' test > test_sed2
real    1m37.064s
user    0m53.720s
sys     0m38.950s
$ diff test_sed2 test_sed1
$ diff test_sed2 test_grep
$ wc -l test_*
 1428571 test_grep
 1428571 test_sed1
 1428571 test_sed2
 4285713 total

Question avec un GREP

Shell et commandes GNU

Discussions similaires

Partager

Partager