Filtrer un fichier avec grep

**julien terrier** · 12/12/2016, 15h40

Bonjour,

je souhaiterais filtrer un fichier via une analyse syntaxique ou autre. A l'issue je souhaite intégrer le traitement dans un script tcsh.

Je vous pose le problème:

J'ai un fichier texte avec des patterns qui se répètent:

-----------My.TXT----------
CELL alpha_1
toto a.1
toto a.2
toto a.3
CELL giga_2
toto a.1
toto a.2
toto a.3
CELL misc_3
toto b.1
toto b.2
toto c.4
toto e.8
toto j.1
---------------------------

Donc les patterns qui se répètent sont CELL et toto mais le reste est variable.

Dans une boucle foreach au premier passage je souhaiterais partiellement rediriger le contenue de My.TXT de CELL alpha_1 a CELL giga_2(non inclu) dans un fichier temporaire puis au deuxième tour de CELL giga_2 a CELL misc_3(non inclu) etc...

Avec WC je peux savoir combien il y a de fois CELL dans mon fichier My.TXT ce qui me permet de me donner la longueur de ma boucle mais je bute avec les expressions régulière dans le grep afin de rediriger le nombre exact de ligne après CELL xxx_x

Je regardes activement les option de grep ==> grep -AB ou grep -C, grep -m avec le nbre de CELL, je suis dans l'exploratoire...

En premier lieu je me suis dit j'affiche (parcours le fichier) de CELL alpha_1 a CELL giga_2 soit des que je rencontre une deuxième fois CELL j'arrète de parcourir le fichier...

Merci pour votre aide

**frp31** · 12/12/2016, 16h39

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
francois@h2g2:/tmp/mozilla_francois0$ cat > oto
-----------My.TXT----------
CELL alpha_1
toto a.1
toto a.2
toto a.3
CELL giga_2
toto a.1
toto a.2
toto a.3
CELL misc_3
toto b.1
toto b.2
toto c.4
toto e.8
toto j.1
---------------------------
francois@h2g2:/tmp/mozilla_francois0$ i=0 ; while read; do sed '/CELL alpha_'$i'/,/CELL/ !d;$d' oto >r$i ; echo $?; export i=$(( $i + 1)) ; echo $i ; done < oto  #selection de CELL.*compteur a cell suivant ne pas supprimer -> copie dans fichier rnumero_compte et enfin compteur=luimeme+1
francois@h2g2:/tmp/mozilla_francois0$ ls -l r{1,2,3}
-rw-r--r-- 1 francois francois 52 Dec 12 16:34 r1
-rw-r--r-- 1 francois francois 51 Dec 12 16:34 r2
-rw-r--r-- 1 francois francois 57 Dec 12 16:34 r3
francois@h2g2:/tmp/mozilla_francois0$ cat r3
CELL misc_3
toto b.1
toto b.2
toto c.4
toto e.8
toto j.1
francois@h2g2:/tmp/mozilla_francois0$ cat r1
CELL alpha_1
toto a.1
toto a.2
toto a.3
CELL giga_2
francois@h2g2:/tmp/mozilla_francois0$ cat r2
CELL giga_2
toto a.1
toto a.2
toto a.3
CELL misc_3
francois@h2g2:/tmp/mozilla_francois0$

une deuxieme boucle seh pour virer la last line dans chaue fichier si elle contient CELL et c est fini
je te laisse tester comprendre et mettre en script mais je pense que tu as tout la

**julien terrier** · 12/12/2016, 21h48

Bonsoir et merci pour la réponse, je vais tenter de restituer ce que j'ai compris:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

i=0 ;

==> assignation de la valeur 0 a la variable i

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

while read; do ... done < oto

==> on entre dans une boucle tant que avec lecture d'un paramètre en entré. les exemples que j'ai vu ont toujours un paramètre après read et pourquoi le ; (passage a la ligne) ? pas très bien compris le done < oto ?

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed '/CELL alpha_'$i'/,/CELL/ !d;$d'

==> je ne connais sed que pour la substitution la je devine que sed sequence le texte entre chaque CELL (vu la redirection et ton commentaire) mais je ne comprends pas vraiment le mécanisme trop de lacune !d;$d' !? j'ai commencé a lire le grymoire il y a une grosse partie sur sed...

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

oto >r$i ;

==> Redirection du bornage CELL ... CELL dans un fichier r1 puis r2 et r3 , voir incrémentation plus loin

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

echo $?;

==> code retour du dernier echo

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

export i=$(( $i + 1)) ;

==> incrémentation de la variable $i (compteur)

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

echo $i ;

on affiche $i (compteur)

Merci pour ton aide je vais tenter de le faire fonctionner.

Nb: pour les balise CODE je ne connais que CODE=C pour le c, existe t-il une page qui indique ce qu'il faut mettre selon le langage utilisé ?

Encore merci.

Invité · 12/12/2016, 22h45

ce n'est pas du tcsh.

t'as décidé de changer de shell ?

**julien terrier** · 13/12/2016, 21h25

Envoyé par N_BaH

ce n'est pas du tcsh.

t'as décidé de changer de shell ?

Non c'est bien du tcsh que je souhaite utiliser, il faut vraiment que je me tourne vers le bash j'ai fais quelques script en bash mais c'était vraiment dans un but pédagogique...

Sinon pour reprendre le fil du sujet, awk déjà un peu manipuler mais vraiment je ne suis pas expert, après sed autres outils a mettre dans la liste a "a apprendre et vite" la liste s'allonge....

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

awk '/^CELL/ {C++} {print >> "fichier" C ".txt"}' My.TXT

==> Dès que l'on rencontre CELL / on incrémente c { on redirige std_out dans fichierC.txt } fichier source = My.TXT

C'est a peu près ce qui se passe ou me gourge ?

**BufferBob** · 13/12/2016, 21h36

Envoyé par julien terrier

C'est a peu près ce qui se passe ou me gourge ?

non c'est cela même. c'est une structure en bloc {...} comme en C, donc le premier bloc est conditionnel de l'expression /^CELL/, tandis que le deuxième bloc s'exécute pour chaque ligne quoiqu'il arrive

Invité · 13/12/2016, 22h06

Envoyé par julien terrier

Non c'est bien du tcsh que je souhaite utiliser[...]

mais

Code tcsh :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
$ i=0
i=0: Command not found.
$ while read line ; do echo "$line" ; done < $monFichier
while: Expression Syntax.
line: Undefined variable.

**al1_24** · 12/12/2016, 23h08

Envoyé par julien terrier

Nb: pour les balise CODE je ne connais que CODE=C pour le c, existe t-il une page qui indique ce qu'il faut mettre selon le langage utilisé ?.

Ici, dans le forum Shell, si tu indiques CODE sans rien préciser, la coloration syntaxique sera automatiquement celle de sh. Et ceci pour chaque forum avec un langage associé

**julien terrier** · 12/12/2016, 23h29

Merci ca marche mieux, je suis habitué a la section embarqué du coup il n'y a pas de langage par défaut il me semble...

**BufferBob** · 13/12/2016, 13h01

salut,

le sed plus haut je le soupçonne d'avoir été modifié entre le moment où il était dans la console et celui où il s'est retrouvé sur le forum frp31

(/CELL alpha_/ ne pourra match qu'une seule fois)

sinon en attendant la réponse à la question de N_BaH; awk un jour, awk toujours :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
$ awk '/^CELL/ {c++} {print >> "fichier" c ".txt"}' My.TXT
$ cat fichier1.txt
CELL alpha_1
toto a.1
toto a.2
toto a.3
$ cat fichier2.txt
CELL giga_2
toto a.1
toto a.2
toto a.3
$ cat fichier3.txt
CELL misc_3
toto b.1
toto b.2
toto c.4
toto e.8
toto j.1

(c'est comme ça que j'ai compris la problématique en tous cas, header inclus, footer non inclus, quant à mettre dans des fichiers temporaires séparés c'était bien ça l'idée ?)

Filtrer un fichier avec grep

Shell et commandes GNU

Vue hybride

Discussions similaires

Partager

Partager