Replace pour un mot seul

**Azerty32** · 24/09/2010, 15h33

Bonjour a tous.
Alors voila j'utilise la fonction:
data = data.replace(x, y)

qui me permet de remplacer les variables x de data par les variables y. Jusque la aucun souci, ca marche. Mais apres etude de mes resultats je me rend compte que des expressions comme :
while ( (pThrParams->bRunning)
sont devenues
while ( (pThrParams->b_running)

Or dans ma replace list il n'y a que bRun a modifier. Je vois donc qu'il modifie la chaine de caractere partout (ce qui est logique puisque je lui demande)
Je voulais donc savoir si il existait une option ou une fonction ne permettant de modifier que le mot complet. Merci d'avance de vos reponses

**josmiley** · 24/09/2010, 15h37

salut,
tu peux poster le code ?

**Azerty32** · 24/09/2010, 15h51

Voila le code de ma fonction search&replace

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
 
def searchandreplace(x, y, setpath):
 
   for root, dirs, files in os.walk(setpath):
      fname = files
      for fname in files:
         if ('.c' in fname or '.h' in fname) and not '.csv' in fname:
            inputFile = file(os.path.join(root,fname), 'r')
            data = inputFile.read()
            inputFile.close()
            search = string.find(data, x)
            if search >=1:
               data = data.replace(x, y)
               outputFile = file(os.path.join(root,fname), 'w')
               outputFile.write(data)
               outputFile.close()
               #print "Replacing", x, "with", y, "in", fname

**sopsag** · 24/09/2010, 16h39

Il va falloir chercher du coté des expressions régulières (ici).
En particulier le pattern "\w" qui permet de matcher un identifiant à la C/C++.

**wiztricks** · 24/09/2010, 17h36

Salut,
J'ai compris que vous ne vouliez remplacez que les identifiants "bRun" par... et non les identifiants pouvant contenir "bRun"

Je ne vois pas trop comment faire cela sans passer par regexp.
Par contre, la construction '\bMOT\b' me semble plus aisée que de passer par attraper les mots, les comparer à..., les remplacer si.

Le code, ci dessous, mange un texte et un dict donnant la correspondante quoi => par. i.e. çà remplace "plusieurs mots" - tant qu'à faire!!!

J'ai fait cela pour jouer: il ne traite peut être pas tous les cas de figures.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
import re
 
def replace_words(text, words_dict):
    rg = re.compile(r'|'.join([r'\b%s\b' % w for w in words_dict]))
    def translate(match):
        return words_dict[match.group(0)]
    return rg.sub(translate, text)
 
if __name__ == '__main__':
    wd = { 'ab': 'xy', 'ABC' : 'YYZ' }
    test = "ab- abc *ab ABC ab"
    print replace_words(test, wd)

- W

**eyquem** · 26/09/2010, 15h07

J'ai compris que vous ne vouliez remplacez que les identifiants "bRun" par... et non les identifiants pouvant contenir "bRun"

Moi aussi.

Je ne vois pas trop comment faire cela sans passer par regexp.

Moi non plus.

Par contre, la construction '\bMOT\b' me semble plus aisée que de passer par attraper les mots, les comparer à..., les remplacer si.

Certes

Le code, ci dessous, mange un texte et un dict donnant la correspondante quoi => par. i.e. çà remplace "plusieurs mots" - tant qu'à faire!!!

Les identifiants ne peuvent être écrits qu’avec les caractères suivants: lettres ’a’ à ’z’ minuscules et majuscules, chiffres 0 à 9, underscore ’_’
http://docs.python.org/reference/lex...ml#identifiers

Par ailleurs, le symbole spécial \b dans une RE est défini comme la frontière entre les symboles \w et \W ,
et \w est équivalent à la classe [a-A-Z0-9_] en l’absence de drapeau re.LOCALE ou re.UNICODE.

Une regex

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

re.compile(’\\b’ + word + ’\\b’)

avec word ne contenant que des lettres min/MAJ, chiffres et underscore, attrapera donc bien des identifiants.

Donc code de wiztricks = concis et efficace, et répond bien au problème posé.

Personnellement je suis parti sur une autre idée:
détecter toutes les occurences d’un word, aussi bien celles libres c’est à dire entourées seulement de caractères de la “classe blanc“ : \s càd [ \f\n\r\t\v] (je ne sais pas s’il y a aussi les \a , \b et \x, je n’arrive pas à les tester)
que celles noyées dans un autre mot comportant n’importe quel caractère ( y compris des *&<><:“’ etc).
Et demander à l’utilisateur s’il veut remplacer certaines des occurences trouvées à l’intérieur de mots.

Le code suivant peut être utilisé pour remplacer n’importe quelle suite de caractères dans un texte, pas seulement des identifiants.
Mais ce code ne permet de s’occuper que d’un seul mot à la fois.

Ce qui se trouve avant la première ligne ###############....
et après la seconde ligne ############... permet de tester le code.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
from os import makedirs
from os.path import isdir
from shutil import rmtree
 
#if isdir('C:\\ESSAIC\\dedans\\'):
#    rmtree('C:\\ESSAIC\\dedans\\')
#if isdir('C:\\ESSAIC\\'):
#    rmtree('C:\\ESSAIC\\')
 
makedirs('C:\\ESSAIC\\dedans\\')
 
for fnm in ('C:\\ESSAIC\\text un.c.txt',
            'C:\\ESSAIC\\texte deux.c.txt'):
    fu = open(fnm,'w')
    fu.write('le rURDUomain fend,URDU\n'
             'soleil :URDU>> \fURDU URDU URDU\n'
             'URDUPloyer et\tURDU imperator romURDUain\n'
             'prunelles uRDU claires ;\n'
             'le romURDUain sentait\n'
             'Le romaiURDUn est un romURDUain')
    fu.close()
 
fu = open('C:\\ESSAIC\\dedans\\wqer.c.txt','w')    
fu.write('il URDU\nle  \fURDU URDU URDU\n'
         'et\tURDU imperator \nprunelles uRDU claires')
fu.close()
 
fu = open('C:\\ESSAIC\\dedans\\derty.c.txt','w')
fu.write('hhfhfhfhgf kjhkgkgkg\nabcfgedfssubcd')
fu.close()
 
fu = open('C:\\ESSAIC\\dedans\\vide.c.txt','w')
fu.close()
 
###################################################
from os import fsync,walk,path
import re
 
def searchandreplace(x, y, setpath):
    minRE = '(?<=\s)'+x+'(?=\s)'
    pat_others = re.compile('\s[^\s]+'+x+'[^\s]*\s|\s'+x+'[^\s]+\s')
    for root, dirs, files in walk(setpath):
        print 8*'---------'+'\n'\
              +'root  = %r\ndirs  = %r\nfiles = %r\n' % (root,dirs,files)
        gen_fname = (fn for fn in files
                     if ('.c' in fn or '.h' in fn) and not '.csv' in fn )
        for fname in gen_fname:
            print '-*-  Fichier  '+fname+ '   ----------------------'
            inputFile = open(path.join(root,fname), 'r+')
            data = inputFile.read()
            free_chains = re.search(minRE,data)
            autres = set(pat_others.findall(data))
            if autres:
                cles = map(str,xrange(1,len(autres)+1))
                deek_autres = dict(zip(cles,autres))
                bla = "\nJ'ai trouve des occurences de "+x+" a l'interieur de mots.\n"\
                      "Indiquer, au moyen de leur numero, celles que vous voulez substituer aussi:\n"\
                      "   0 :   ~ AUCUNE AUTRE ~\n"\
                      +'\n'.join( num.rjust(4)+' :   '+repr(deek_autres[num]) for num in sorted(deek_autres.keys()))\
                      +"\necrire les nos separes par des blancs : "
                while 1:
                    linums = raw_input(bla).split()
                    if not linums:
                        bla = "\nUne reponse est demandee. Recommencez:\n ==> : "
                    elif '0' in linums and any(z!='0' for z in linums):
                        bla = "\nVous ne pouvez indiquer un autre nombre en sus de 0."\
                              " Recommencez:\n ==> : "
                    elif '0' not in linums and any(w not in cles for w in linums):
                        bla = "\nSeuls les nombres  0  a  " + str(len(autres)+1)\
                              + "  sont autorises. Recommencez:\n ==> : "
                    elif len(set(linums))!=len(linums):
                        bla = "\nVeuillez entrez des nombres tous differents."\
                              " Recommencez:\n ==> : "
                    else:
                        break
                linums.sort()
                if linums!=['0']: # on remplace les x libres et d'autres
                    RENCORE = '|'.join("(?<="+((')'+x+'(?=').join(deek_autres[num].split(x)))+")"
                                   for num in linums )
                    data = re.sub(minRE + '|' + RENCORE,y,data)
                    done = "\nHaving replaced with '" + y + "' in " + fname + ' :\n'\
                           "free '"+x+"' chains , "\
                           + ' , '.join("'"+deek_autres[num]+"'" for num in linums)
                elif free_chains: # on ne remplace que les x libres
                    data = re.sub(minRE,y,data)
                    done = "\nHaving replaced only free '"+x+"' chains with '" + y + "' in " + fname + '\n'
                else:
                    done = "\nHaving replaced no occurence of '" + x + "'\n"\
                          "There was no occurence of free '" + x + " chain to replace in " + fname + '\n'
            elif free_chains:
                data = re.sub(minRE,y,data)
                done = "\nHaving replaced free '"+x+"' chains with '" + y + "' in " + fname + '\n'
            elif not path.getsize(root+'\\'+fname):
                print "\nNo replacement to do: this file is empty.\n"
                done = ''
            else:
                print "\nNo replacement to do: this file isn't empty,"\
                      "\nbut there is no occurence of '"+x+"' to replace in it.\n"
                done = ''
 
            if done:
                inputFile.seek(0)
                inputFile.write(data)
                inputFile.flush()
                fsync(inputFile.fileno())
                print done
 
            inputFile.close()
 
 
setpath = 'C:\\ESSAIC\\'
searchandreplace('URDU', "AGLAGLA", setpath)
 
########################################################################
print 8*'#########'
for fnm in ('C:\\ESSAIC\\text un.c.txt',
            'C:\\ESSAIC\\texte deux.c.txt',
            'C:\\ESSAIC\\dedans\\wqer.c.txt',
            'C:\\ESSAIC\\dedans\\derty.c.txt',
            'C:\\ESSAIC\\dedans\\vide.c.txt'):
    print '\n-*-  '+fnm
    if not path.getsize(fnm):
        print '  Ce fichier est vide.'
    else:
        fu = open(fnm)
        print '\n'.join(repr(ligne) for ligne in fu.readlines())
        fu.close()
 
rmtree('C:\\ESSAIC\\dedans\\')
rmtree('C:\\ESSAIC\\')

.

Replace pour un mot seul

Python

Vue hybride

Discussions similaires

Partager

Partager