|
Publicité ' | |||||||||||||||||||||||
|
|
#1 | ||
|
Invité de passage
![]() Inscription : février 2005 Messages : 13 ![]() |
Bonjour à tous,
J'ai besoin de votre aide pour compléter une expression régulière que je suis en train de faire. Le but est de récupérer le contenu d'un flux Rss en supprimant les balises HTML qui sont contenus dans la balise <description> parfois afin de garder la main sur la mise en forme. J'y suis parvenu avec cet regex : "<[^>]*>" Mais si dans cette balise <description> il y a des liens hypertextes (<a href='...'>bla bla</a>) je souhaiterais les conserver. Comment puis-je modifier mon expression régulière ? Merci par avance pour votre aide p.s : exemple d'un flux google utilisé pour mes tests : Code :
|
||
|
|
00
|
|
|
#2 |
|
Membre Expert
![]() Gérald BarréÉtudiant Inscription : avril 2010 Messages : 940 ![]() |
Pour parser du HTML on utilise un parseur HTML pas des expressions rationnelles.
Tu peux utiliser le HtmlAgilityPack
__________________
Pensez à la balise ainsi qu'au petit pouce vert ![]() Mon blog : http://www.meziantou.net WindowManager : Gérer facilement vos différentes fenêtres |
|
00
|
|
|
#3 | |
|
Invité de passage
![]() Inscription : février 2005 Messages : 13 ![]() |
Citation:
Mais pour des raisons indépendantes de ma volonté, je n'ai pas d'autres choix que d'utiliser une regex. Il n'y a pas de solutions pour inclure une clause "sauf les balises <a" dans mon expression ? |
|
|
|
00
|
|
|
#4 |
![]() ![]() Clément LehalleArchitecte Logiciel Inscription : avril 2008 Messages : 1 426 ![]() |
Plutôt que d'essayer de supprimer tout le reste, ça ne serait pas plus simple de récupérer uniquement les balises en question?
__________________
One minute was enough, Tyler said, a person had to work hard for it, but a minute of perfection was worth the effort. A moment was the most you could ever expect from perfection. -- Chuck Palahniuk, Fight Club, Chapter 3 -- |
|
|
00
|
|
|
#5 | |
|
Invité de passage
![]() Inscription : février 2005 Messages : 13 ![]() |
Citation:
J'ai décidé de conserver uniquement les balises <a> et <b> et <br> J'arrive donc à récuperer toutes les balises commençant par a ou b en faisant ceci : <[^a|b][^>]*> mais j'ai désormais du mal à lui dire de conserver également les balises fermantes. |
|
|
|
00
|
|
|
#6 |
![]() ![]() Clément LehalleArchitecte Logiciel Inscription : avril 2008 Messages : 1 426 ![]() |
Un peu de lecture pour t'aider : Expressions régulières et .Net - par David Grellety
__________________
One minute was enough, Tyler said, a person had to work hard for it, but a minute of perfection was worth the effort. A moment was the most you could ever expect from perfection. -- Chuck Palahniuk, Fight Club, Chapter 3 -- |
|
|
00
|
Copyright © 2000-2013 - www.developpez.com