Script langstat.sh : demande de conseils et propositions de modification

**jakol** · 24/07/2019, 13h36

Bonjour,
j'ai fait un script pour une évaluation. Je souhaiterais savoir si vous pouviez y jeter un coup d'oeil. Pourriez-vous me dire ce qu'il pourrait être amélioré ? Et comment?
Merci pour votre aide.
jakol

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
<code sh>#!/bin/bash
 
# On teste l'existence du premier paramètre (le fichier)
if [ ! $# -ge 1 ] || [ ! -e $1 ]
then
    echo 'Fichier de dictionnaire introuvable'
    exit 1
fi
 
# On fait un boucle sur les lettres. L'option -i de grep ignore la casse, et l'option -c donne le compte des lignes qui contiennent l'expression. Le tri s'effectue sur la sortie standard de la boucle.
for lettre in A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
do
 
 printf "%s - %s\n" $(grep  -ic $lettre $1)  $lettre 
 
done | sort -rn 
 
# On test l'existence d'un deuxième paramètre test
if [ $# -ge 2 ] && [ $2 = 'test' ]
then
 shift
 
# on affiche le message dans la console 
    echo " j'ai testé un deuxième paramètre "
 
# on affiche le message dans le fichier test.txt
    echo " j'ai testé un deuxième paramètre" >> test.txt
 
    echo " Nombre de lignes dans test.txt : `wc -l test.txt` "
 
fi 
 
# On demande si l'on veut supprimer le fichier test.text
read -p "on supprime test.text ?  oui/non : " reponse
if [ $reponse =  'oui' ] 
then
 echo "on supprime le fichier test.txt"
 rm test.txt
 
else
 echo "on garde le fichier test.txt"
 
fi</code>
 
<config>Windows / Chrome 75.0.3770.142</config>

**disedorgue** · 24/07/2019, 15h07

Alors, grep n'est pas l'idéal ici, car tu dois lire 25 fois ton fichier "$1" pour ton décompte du nombre de fois que l'on rencontre la lettre en question.

La première chose à faire (et surtout en scripting), c'est de voir à optimiser au maximum le parcours d'un fichier afin de ne le faire au plus qu'une fois quand c'est possible (ce qui est très souvent le cas comme ici).

Invité · 24/07/2019, 15h27

Bonjour,

je pourrais améliorer tellement de choses, mais alors ce ne serait plus ton script !

tu peux déjà, dans les comparaisons lexicales, mettre les variables entre guillemets.
et mettre de la cohérence dans les Substitutions de commandes.

écrire test au lieu de [, -a ou -o au lieu de && et ||...

**disedorgue** · 24/07/2019, 15h41

Si tu veux un exemple, toute ta boucle for .... | sort -rn est remplaçable par:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

printf "%s - %s\n" $(LC_ALL=C sed -z 's/[^[:alpha:]\s]//g;s/./\l&\n/g' $1 | sort | uniq -c | sort -rn)

**jakol** · 25/07/2019, 10h08

Merci pour le code mais je ne comprends pas bien le

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

sed -z 's/[^[:alpha:]\s]//g;s/./\l&\n/g' $1

sed va filtrer le paramètre $1. il remplace tous les lettres en début de ligne après ...je ne sais pas...Puis on trie les données dans le fichier, on enlève les doublon et on refait un tri dans un ordre inverse

Après, si vous avez un peu de temps, ce serait cool de me donner des détails sur cette commande.

Merci encore

**disedorgue** · 25/07/2019, 10h31

En fait, je viens de voir une erreur dans mon sed, le \s est de trop dans [^[:alpha:]\s].

Et j'ai peut-être aussi mal lu ton script:

Doit il compter le nombre d’occurrences de chaque lettres dans le fichier (ce que fait mon code) ou doit il compter pour chaque lettre le nombre de ligne où elle apparaît (ce que fait ton code) ?

**disedorgue** · 25/07/2019, 10h45

Ma commande sed fait:
-z ==> spécifique gnu sed (le retour à la ligne n'est plus la fin de ligne mais le caractère NUL ou en écriture standard \0 )
s/[^[:alpha:]]//g ==> supprime tout les caractères qui ne sont pas de la classe ALPHA (A à Z sans tenir compte de la casse) et comme j'ai forcé la locale à C ( LC_ALL=C ), celle_ci ne prend pas en compte les caractères accentués
s/./\l&\n/g ==> change les caractères en minuscules et retourne à la ligne pour chacun des caractères.

**jakol** · 25/07/2019, 11h45

Envoyé par disedorgue

En fait, je viens de voir une erreur dans mon sed, le \s est de trop dans [^[:alpha:]\s].

Et j'ai peut-être aussi mal lu ton script:

Doit il compter le nombre d’occurrences de chaque lettres dans le fichier (ce que fait mon code) ou doit il compter pour chaque lettre le nombre de ligne où elle apparaît (ce que fait ton code) ?

(en ce qui concerne le SED) Il doit compter le nombre d’occurrences de chaque lettres dans le fichier

Script langstat.sh : demande de conseils et propositions de modification

Shell et commandes GNU

Vue hybride

Discussions similaires

Partager

Partager