1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
| In [1]: aTraiter = []
In [2]: aNePasTraiter = []
In [3]: lenOpen = len("<IgnoreRegex>")
In [4]: lenClose = lenOpen + 1
In [5]: lastIndex = 0
In [6]: txt = "<IgnoreRegex>Ceci ne doit pas être traîté. Les mots qui suivent l
e doivent: </IgnoreRegex>ces mots suivent"
In [7]: pos = txt.find("<IgnoreRegex>")
In [8]: while pos > -1:
...: aTraiter.append(txt[lastIndex : pos])
...: lastIndex = pos + lenOpen
...: pos = txt.find("</IgnoreRegex>", lastIndex)
...:
...: if pos > -1:
...: aNePasTraiter.append(txt[lastIndex : pos])
...: lastIndex = pos + lenClose
...: pos = txt.find("<IgnoreRegex>", lastIndex)
...:
...:
In [9]: aTraiter.append(txt[lastIndex:])
In [10]: aTraiter
Out[10]: ['', 'ces mots suivent']
In [11]: aNePasTraiter
Out[11]: ['Ceci ne doit pas \x88tre tra\x8ct\x82. Les mots qui suivent le doivent: '] |