contribution de Patouche (en MP)
Bonjour,
Je suis tombé ce soir (cette nuit) sur ce sujet qui a fortement attiré mon attention puisque je rencontre actuellement un problème assez similaire (réparer du code html non valide pour le transformer en code valide xml). Je connaissais tidy dès le départ, malheureusement, je ne pouvais pas l'utiliser. Il a donc fallu trouver une solution différente.
Après de longues heures de réflexion et de code, je ne suis malheureusement pas parvenu à un résultat satisfaisant...
Alors après des recherches, j'ai testé plusieurs autres solutions. Voici les résultats que j'ai pu retenir de mes recherches :
- Tidy (pour tout ceux qui peuvent l'installer sur leur serveur, sinon tant pis...)
- HTMLPurifier (c'est une vrai usine à gaz mais d'après mes premiers test, il fonctionne pas trop trop mal à condition que...) >> http://htmlpurifier.org/
- htmLawed (c'est la solution que j'ai finalement retenu même si elle n'ai que temporaire) >> http://www.bioinformatics.org/phplab...awed/index.php
Sur le site de HTMLPurifier, il y a un comparatif qui vous orientera vers différents systèmes.
En espérant que ce message pourra servir à d'autre puisque j'ai pu lire que vous souhaitiez y consacrer un nouveau fil.
Cordialement,
Patouche