|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | ||
|
Membre du Club
![]() Inscription : janvier 2007 Messages : 236 ![]() |
Salut...
Je bosse sur un parseur de fichiers html en ce moment ... j'ai en vue de repérer les expressions répétées dans une page... bon l'idée est de repérer par exemple les expressions à 2 3 ou 4 mots répétés dans une phrase... j'ai pondu un petit script qui fonctionne mais il n'est vraiment pas optimisé ...pour le moment ça détecte les expressions de deux mots ...mais c'est en dur .. alors bof bof .. j'aimerai bien passer par les regex mais j'ai du mal à trouver la méthode ...la regex en commentaires par exemple extraits les mots deux à deux mais en continuant la phrase à chaque fois et non as en partant du mot courant .. je suis passé par un explode mais ça perds beaucoup en dynamisme vu que jaimerai pouvoir envoyer à ma fonction un chiffre qui serait le nombre de mots que l'expression doit comporter ... pour pouvoir facilement détecter les expressions à 2 3 4 ou 5 mots par ex ... je vous livre mon script ..si qq'un a une idée pour rendre cela plus dynamique via regex ce serai super Code :
@++ |
||
|
|
00
|
|
|
#2 |
|
Membre chevronné
![]() Étudiant Inscription : août 2005 Messages : 632 ![]() |
Code php :
preg_match_all('#\b(.*\s+){2,}\s$1\b#', $chaine, $matches); Pas sur du tout de mon coup mais faut essayer ^^ |
|
|
00
|
Copyright © 2000-2012 - www.developpez.com