les expressions régulières

Version imprimable

26/05/2013, 16h04
phpines

les expressions régulières

salut tout le monde,
je veux transformer les mots qui ont deux lettres qui se répètent plus de 2 fois en utilisant les expression régulière. comment faire ça?. pour mieux expliquer voici un exemple:

blablablabla->bla
hahahahaha->ha
27/05/2013, 09h22
__dardanos__
Salut,
Pour les chaines ayant une sous-chaine de longueur indéfinie se répétant plus de 2 fois (en Python 2.X) :
Code:

1 2 3 import re for chaine in (u'blablablabla',u'hahahahaha'): print re.sub( pattern=r'(.+)\1{2,}', repl=r'\1', string=chaine)
qui donne :
Code:

1 2 bla ha
28/05/2013, 15h14
phpines

merci arnoud, mais une fois le nombre de caractères répétés dépasse six caractères, il ne donne pas les résultat attendus.
par exemple : blablablablablablablablablablablabla
et loooooovvvvve. merci d'avance.

Salut,
Une fonction récursive résout le problème :

Code:

1
2
3
4
5
6
7
8
9
10
11
12
13
import re
pattern = re.compile(r'(.+)\1{1,}')
def supprime_doublons(ch1):
    ch2 = re.sub( pattern, repl=r'\1', string=ch1)
    if ch1 == ch2:
        return ch2
    else:
        return supprime_doublons(ch2)
 
if __name__ == '__main__':
    tests = (u'blablablabla',u'hahahahaha',u'blablablablablablablablablablablabla',u'loooooovvvvve')
    for chaine in tests:
        print supprime_doublons(chaine)

Code:

1
2
3
4
bla
ha
bla
love

29/05/2013, 10h16
mont29
Il y a plus simple, il suffit d’utiliser un opérateur non-glouton (donc qui consomme aussi peu de caractères que possible)*:
Code:

1 2 3 import re for chaine in (u'blablablabla', u'hahahahaha', u'loooooovvvvve'): print re.sub(pattern=r'(.+?)\1{2,}', repl=r'\1', string=chaine)
29/05/2013, 11h10
phpines

merci pour vos réponses.
mais dans le cas la chaine 'goooooood', il me donne la résultat 'god', alors que je veux avoir le mot 'good'. merci d'avance.
29/05/2013, 11h24
6ril23

Citation:

Envoyé par phpines

merci pour vos réponses.
mais dans le cas la chaine 'goooooood', il me donne la résultat 'god', alors que je veux avoir le mot 'good'. merci d'avance.

en même temps il peut pas deviner que dans ce cas-là, il ne faut pas enlever toute la redondance :mrgreen:
29/05/2013, 13h54
mont29

Oui, si tu cherches à faire un correcteur orthographique, les regex ne sont pas l’outils idéal*! Regarde plutôt du côté de enchant, par exemple… :mouarf: