IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Récupération de valeur


Sujet :

Shell et commandes GNU

  1. #1
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2013
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2013
    Messages : 12
    Par défaut Récupération de valeur
    Bonsoir,

    je suis novice en programmation Shell.

    Je souhaiterais récupérer le contenu d'une balise XML, mais je ne sais pas comment faire.

    Par exemple je voudrais récupérer la valeur 55 et la mettre dans une variable i.

    La seconde question étant presque la même sauf la balise a une valeur différente je veux récupérer le 35 et le AA .

    puis faire une concaténation exemple j=35AA. Merci de votre aide.

  2. #2
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 677
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 677
    Par défaut
    Bonjour,

    la concaténation, c'est tout con :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    a="35"
    b="AA"
    c="$a$b"
    pour ton problème, il faudrait savoir
    • de quelles balises tu veux récupérer le "contenu"
    • l'ordre dans lequel elle apparaissent
    donne, stp, un échantillon représentatif de ton fichier.


    Il existe des programmes spécialisés pour la manipulation des fichiers XML : xsltproc, xmlstarlet
    ...
    ?
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.

  3. #3
    Expert confirmé Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 376
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 376
    Par défaut
    Bonjour,

    L'une des méthodes la plus simple, serait dans un premier temps de récupérer uniquement la balise:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    grep -o '<head>[^<]*</head>'
    ceci récupérera toutes les balises '<head>?????</head>'
    ensuite, il ne faut garder que ce qu'il y a dans cette balise:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed -e 's/[^>]*>\([^<]*\).*$/\1/g'
    plus qu'a assembler ces commandes comme dans l'exemple suivant:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    $ i=`echo 'tata<head>55</head>toto' | grep -o '<head>[^<]*</head>' | sed -e 's/[^>]*>\([^<]*\).*$/\1/g'`
    $ echo $i
    55
    Pour le second cas, c'est dans la même continuité...

    Cordialement.

  4. #4
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 677
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 677
    Par défaut
    bof.
    grep | sed, c'est comme grep | awk : sed et awk savent identifier des regex, grep devient superflu s'il faut y avoir recours.
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.

  5. #5
    Expert confirmé Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 376
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 376
    Par défaut
    C'est pour ça que je dis que c'est une methode simple, pour un débutant, la regex de parsing peut devenir rébarbative, là, comme tu le sais, 'grep -o' ressort juste le pattern recherché, pas toute la ligne ou bien tout le fichier dans le cas du xml pour qui le retour à la ligne n'est pas du tout obligatoire.


    Cordialement.

  6. #6
    Expert confirmé
    Homme Profil pro
    Développeur informatique en retraite
    Inscrit en
    Avril 2008
    Messages
    2 103
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Côtes d'Armor (Bretagne)

    Informations professionnelles :
    Activité : Développeur informatique en retraite

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 103
    Par défaut
    Citation Envoyé par disedorgue Voir le message
    C'est pour ça que je dis que c'est une methode simple, pour un débutant, la regex de parsing peut devenir rébarbative, là,
    +1

    comme tu le sais, 'grep -o' ressort juste le pattern recherché,
    à la condition, bien évidemment, d'être sous linux et pas sous AIX...

  7. #7
    Expert confirmé Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 376
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 376
    Par défaut
    Citation Envoyé par jack-ft Voir le message
    +1



    à la condition, bien évidemment, d'être sous linux et pas sous AIX...
    On est d'accord, mais comme on est dans le forum linux, cela fonctionne

  8. #8
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2013
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2013
    Messages : 12
    Par défaut
    Bonjour, merci pour vos réponse.

    J'ai un fichier xml à modifier, mais j'ai des bug dans mon script. En fait je veux lire le fichier xml (voici un extrait du fichier). l'objectif est de remplacer le contenu
    de la balise <EUROPE>UE</EUROPE> par la concatenation de la balise BERLIN, Paris, madrid et une variable AlEA sachant que pour madride il récupère que les deux premiers chiffres (le 19 par exemple).
    Il récupere le contenu de ces balises et concatène puis remplace la le résultat concaténé dans la balise EUROPE. et il passe au second test. le contenu du fichier xml sera envoyé dans le fichier Result.xml
    avec la nouvelle valeur de la balise EUROPE.

    le problème est que mon script ne récupere que le contenu de la balise BERLIN et les autres leurs variables sont nuls.

    merci de votre aide.



    fichier xml :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    <?xml version="1.0"?>
    <Tests>
      <Test TestId="0001" TestType="CMD">
        <Name>EURO</Name>
        <CommandLine>Examp1</CommandLine>
        <Input>1</Input>
        <EUROPE>UE</EUROPE>
    	<Berlin>5</Berlin>
        <Paris>1980</Paris>
        <madrid>19-20</madrid>	
        <Output>2</Output>	
      </Test>
    <Test TestId="0002" TestType="CMD">
        <Name>EURO</Name>
        <CommandLine>Examp1</CommandLine>
        <Input>1</Input>
        <EUROPE>UE</EUROPE>
    	<Berlin>6</Berlin>
        <Paris>1980</Paris>
        <madrid>19-21</madrid>	
        <Output>2</Output>	
      </Test>
    </Tests>
    Script Shell :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
     
    #!/bin/sh
    set -x
    i=0
    Union=""
    AlEA="10"
    > FXT
    while read line
    do
       echo $line >FXT
     
       EU=$(grep EUROPE FXT | wc -l)
       if [[ ${EU} -ne 0 ]]
       then
    		EU_Value=$EU
    		echo ${EU_Value}
       BER=$(grep -o '<Berlin>[^<]*</Berlin>' | sed -e 's/[^>]*>\([^<]*\).*$/\1/g')
       elif [[ ${BER} -ne 0 ]]
       then
            BER_Value=$BER
    		echo ${BER_Value}
     
    	PAR=$(grep -o '<Paris>[^<]*</Paris>' | sed -e 's/[^>]*>\([^<]*\).*$/\1/g')	
    	elif [[ ${PAR} -ne 0 ]]
    	then
            Paris_Value=$PAR
    		echo ${Paris_Value}
    	MAD=$(grep -o '<madrid>[^<]*</madrid>' | sed -e 's/[^>]*>\([^<]*\).*$/\1/g')			
    	elif [[ ${MAD} -ne 0 ]]
    	then
    		MAD_Value=$MAD
    		echo ${MAD_Value}		
     
    	else
            echo $line	
       fi
    	let i=$i+1
       	Union="$BER_Value$Paris_Value$MAD_Value$[$AlEA+$i]"
    	echo "<EUROPE>"$Union"</EUROPE>" >>Result.xml
    done <text.xml

  9. #9
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 677
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 677
    Par défaut
    [[ n'est pas POSIX.
    cela signifie que /bin/sh pointe vers bash; tous les grep, et l'emploi d'un fichier temporaire pour y écrire chaque ligne, alourdissent le script alors, car bash sait identifier des regex, justement entre double-crochets, avec l'opérateur =~.

    ce que tu récupérer peut l'être en mettant le motif (à récupérer) entre parenthèses, et en utilisant le tableau BASH_REMATCH.
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.

  10. #10
    Expert confirmé Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 297
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 297
    Par défaut
    2 versions: une flemmarde et une moins flemmarde.

    commande:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed 's@UE</EUROPE>@@g;s@</Output>@</Output></EUROPE>@g;s@\(<madrid>..\).*\(</madrid>\)@\1\2@g' initial.txt
    Résultat:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    <?xml version="1.0"?>
     <Tests>
       <Test TestId="0001" TestType="CMD">
         <Name>EURO</Name>
         <CommandLine>Examp1</CommandLine>
         <Input>1</Input>
         <EUROPE>
             <Berlin>5</Berlin>
         <Paris>1980</Paris>
         <madrid>19</madrid>
         <Output>2</Output></EUROPE>
       </Test> <Test TestId="0002" TestType="CMD">
         <Name>EURO</Name>
         <CommandLine>Examp1</CommandLine>
         <Input>1</Input>
         <EUROPE>
             <Berlin>6</Berlin>
         <Paris>1980</Paris>
         <madrid>19</madrid>
         <Output>2</Output></EUROPE>
       </Test>
     </Tests>
    Deuxième version:

    transfo.sed:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    #!/bin/sed -f
     
    :chargement
    N
    $!b chargement
     
    s@UE</EUROPE>[^<]*<Berlin>@@g
    s@</Berlin>[^<]*<Paris>@@g
    s@</Paris>[^<]*<madrid>\(..\)[^<]*@\1@g
    s@</madrid>[^<]*<Output>@@g
    s@</Output>@</EUROPE>@g
    Commande: (après chmod +x transfo.sed)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    ./transfo.sed initial.txt
    Résultat:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    <?xml version="1.0"?>
     <Tests>
       <Test TestId="0001" TestType="CMD">
         <Name>EURO</Name>
         <CommandLine>Examp1</CommandLine>
         <Input>1</Input>
         <EUROPE>51980192</EUROPE>
       </Test> <Test TestId="0002" TestType="CMD">
         <Name>EURO</Name>
         <CommandLine>Examp1</CommandLine>
         <Input>1</Input>
         <EUROPE>61980192</EUROPE>
       </Test>
     </Tests>

  11. #11
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2013
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2013
    Messages : 12
    Par défaut
    Bonjour merci pour vos réponses !

    N_BAH, l'utilisation d'un tableau me parais très intéressante comme solution. Par contre l'utilisation de BASH_REMATCH est complete et je ne sais pas comment l'adapter avec mon script.
    Merci de votre aide sur ce point !


    Cordialement,

    Jalons.

  12. #12
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 677
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 677
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    $ var="<balise>valeur</balise>"
    $ regex=">([^<]*)<"
    $ [[ $var =~ $regex ]] && echo "${BASH_REMATCH[1]}"
    valeur
    pour la description :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    man bash
    /^ *Variables de l'interpréteur
    /^ *BASH_REMATCH
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.

  13. #13
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2013
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2013
    Messages : 12
    Par défaut
    Monsieur N_BAH, j'ai modifié mon script le voici.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
     
    #!/bin/sh
    i=0
    Union=""
    EU_Value=""
    BER_Value=""
    PAR_Value=""
    MAD_Value=""
    AlEA="10"
    > FXT
    while read line
    do
       echo $line >FXT
       EU=$(grep EUROPE FXT | wc -l)
       EU=">([^<]*)<"
       if [[ ${EU} -ne 0 ]]
       then
    		[[ $EU =~ $regex ]] && echo "${BASH_REMATCH[1]}"
    		EU_Value=$EU
    		echo ${EU_Value}
     
       BER=$(grep Berlin FXT | wc -l)
       BER=">([^<]*)<"
       elif [[ ${BER} -ne 0 ]]
       then
    		[[ $BER =~ $regex ]] && echo "${BASH_REMATCH[2]}"
    		BER_Value=$BER
    		echo ${BER_Value}
     
       PAR=$(grep Paris FXT | wc -l)
       PAR=">([^<]*)<"
       elif [[ ${PAR} -ne 0 ]]
       then
    		[[ $PAR =~ $regex ]] && echo "${BASH_REMATCH[3]}"
    		PAR_Value=$PAR
    		echo ${PAR_Value}
     
       MAD=$(grep madrid FXT | wc -l)
       MAD=">([^<]*)<"
       elif [[ ${MAD} -ne 0 ]]
       then
    		[[ $MAD =~ $regex ]] && echo "${BASH_REMATCH[4]}"
    		MAD_Value=$MAD
    		echo ${MAD_Value}
     
    	else
            echo $line	
       fi
    	let i=$i+1
       	Union="$BER_Value$PAR_Value$MAD_Value$[$AlEA+$i]"  >>Result.xml
    	echo "<EUROPE>"$Union"</EUROPE>" >>Result.xml
    done <text.xml
    J'ai encore des bugs dans mon script. merci de votre aide !

  14. #14
    Modérateur
    Avatar de N_BaH
    Profil pro
    Inscrit en
    Février 2008
    Messages
    7 677
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2008
    Messages : 7 677
    Par défaut
    meu, non
    tu n'as pas lu le man : l'indice du tableau BASH_REMATCH correspond aux parenthèses de la regex.
    si dans la regex (expr(expr1) expr (expr2) expr), il y a n paires de parenthèses, alors l'indice 1 correspondra à la première paire ((expr1))

    Code pas top : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    while read -r line
    do
       case $line in
       *Europe*) [[ $line =~ $regex ]] && EU_value="${BASH_REMATCH[1]}"
       ;;
    :etc
       esac
    done < tonFichier
    voir aussi : Comment lire un fichier en shell
    N'oubliez pas de consulter les cours shell, la FAQ, et les pages man.

  15. #15
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2013
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2013
    Messages : 12
    Par défaut
    Bonjour N_BAH, merci pour votre aide. je n'ai pas linux sous la main du coup je ne peux pas tester la modification apportée.
    Je le testerai demain à l'école.
    par contre j'ai une inquiétude, la balise à modifier est précédent les trois dont elle dépend. Comme le script
    lit le fichier ligne par ligne donc il ne va pas modifier la balise .
    Il risque également d'écrire la balise dans le fichier résultat mais je souhaiterai qu'il écrive les lignes non modifiées
    dans le fichier résultat. je ne sais pas si j'ai droit d'écrire dans le fichier résultat juste après du case.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    #!/bin/sh
    i=0
    Union=""
    EU_Value=""
    BER_Value=""
    PAR_Value=""
    MAD_Value=""
    AlEA="10"
     
    while read line
    do
      case $line in
       *Europe*) [[ $line =~ $regex ]] && EU_value="${BASH_REMATCH[1]}" 
    	echo ${EU_value};;
       *Berlin*) [[ $line =~ $regex ]] && BER_Value="${BASH_REMATCH[2]}" 
    	echo ${BER_Value};;
       *Paris*) [[ $line =~ $regex ]] && PAR_Value="${BASH_REMATCH[3]}" 
    	echo ${PAR_Value};;
       *madrid*) [[ $line =~ $regex ]] && MAD_Value="${BASH_REMATCH[4]}" 
       	echo ${MAD_Value};;
    esac >> Result.xml
       let i=$i+1
       Union="$BER_Value$PAR_Value$MAD_Value$[$AlEA+$i]"
       echo "<EUROPE>"$Union"</EUROPE>" >>Result.xml
    done <text.xml
    have a nice day !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [checkbox] Récupération des valeurs de checkbox
    Par chng001 dans le forum Struts 1
    Réponses: 13
    Dernier message: 07/09/2009, 20h31
  2. [struts] [checkbox] récupération des valeurs cochées
    Par abourell dans le forum Struts 1
    Réponses: 16
    Dernier message: 10/06/2005, 20h58
  3. Réponses: 8
    Dernier message: 09/03/2005, 10h47
  4. récupération de valeur de lien
    Par sex-sansbol dans le forum ASP
    Réponses: 3
    Dernier message: 07/06/2004, 10h43
  5. Récupération de valeurs d'un tableau
    Par leeloo076 dans le forum ASP
    Réponses: 12
    Dernier message: 25/03/2004, 10h59

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo