IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C Discussion :

eliminer les tag html


Sujet :

C

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé Avatar de solawe
    Inscrit en
    Juillet 2006
    Messages
    368
    Détails du profil
    Informations personnelles :
    Âge : 39

    Informations forums :
    Inscription : Juillet 2006
    Messages : 368
    Par défaut eliminer les tag html
    slt,
    je travaille sur un projet d'etude d'un petit compilateur et j'ai besoin d'un programme en langage C qui elimine toutes les balises d'un fichier html cad(<....> et </....>).
    si quelqu'un a deja travaille sur un truc pareille et qui peux m'aider.
    merci d'avance

  2. #2
    Membre éprouvé
    Profil pro
    Inscrit en
    Décembre 2004
    Messages
    1 299
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2004
    Messages : 1 299
    Par défaut
    Salut, à première vue, je te dirais de parcourir toutes les lignes avec fgets() et ensuite avec strstr() tu cherches les caractères que tu veux enlever.

  3. #3
    Expert confirmé

    Avatar de fearyourself
    Homme Profil pro
    Ingénieur Informaticien Senior
    Inscrit en
    Décembre 2005
    Messages
    5 121
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Ingénieur Informaticien Senior
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2005
    Messages : 5 121
    Par défaut
    Citation Envoyé par m@rki
    slt,
    je travaille sur un projet d'etude d'un petit compilateur et j'ai besoin d'un programme en langage C qui elimine toutes les balises d'un fichier html cad(<....> et </....>).
    si quelqu'un a deja travaille sur un truc pareille et qui peux m'aider.
    merci d'avance
    Si tu travaille sur une étude d'un compilateur, lex & yacc serait plus approprié pour faire ton travail.

    Jc

  4. #4
    Membre éclairé Avatar de solawe
    Inscrit en
    Juillet 2006
    Messages
    368
    Détails du profil
    Informations personnelles :
    Âge : 39

    Informations forums :
    Inscription : Juillet 2006
    Messages : 368
    Par défaut
    merci pr le conseil,mais je travail sur un ptt projet et le but c'est faire les traitements en C

  5. #5
    Expert éminent
    Avatar de Emmanuel Delahaye
    Profil pro
    Retraité
    Inscrit en
    Décembre 2003
    Messages
    14 512
    Détails du profil
    Informations personnelles :
    Âge : 68
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : Décembre 2003
    Messages : 14 512
    Par défaut
    Citation Envoyé par m@rki
    merci pr le conseil,mais je travail sur un ptt projet et le but c'est faire les traitements en C
    C'est un simple automate. Il suffit de lire les caractères en séquences.

    Evènements : '<', '>', EOF, reste du monde.
    Etats : in-tag, not-in-tag

    Je ne vois pas trop où est la difficulté...

    Fait de ton mieux et poste ton code.

  6. #6
    Expert éminent
    Avatar de koala01
    Homme Profil pro
    aucun
    Inscrit en
    Octobre 2004
    Messages
    11 644
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : Belgique

    Informations professionnelles :
    Activité : aucun

    Informations forums :
    Inscription : Octobre 2004
    Messages : 11 644
    Par défaut
    salut,
    Citation Envoyé par Emmanuel Delahaye
    C'est un simple automate. Il suffit de lire les caractères en séquences.

    Evènements : '<', '>', EOF, reste du monde.
    Etats : in-tag, not-in-tag

    Je ne vois pas trop où est la difficulté...

    Fait de ton mieux et poste ton code.
    Soit, mais...

    Qu'en est-il d'une chaine du genre de
    Verifiez que a< 35 et que b>40
    (version simple)

    Si tu ne définis pas explicitement au minimum les balises HTML, la partie "35 et que b" sera considérée comme étant une balise, donc retirée ...Alors que ce n'est absolument pas une balise...
    A méditer: La solution la plus simple est toujours la moins compliquée
    Ce qui se conçoit bien s'énonce clairement, et les mots pour le dire vous viennent aisément. Nicolas Boileau
    Compiler Gcc sous windows avec MinGW
    Coder efficacement en C++ : dans les bacs le 17 février 2014
    mon tout nouveau blog

  7. #7
    Expert éminent
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 395
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 395
    Par défaut
    En HTML normal, ce sera considéré comme un balise à moins d'avoir &gt; et &lt; à la place.

    Ce qui m'inquiète plus, ce sont les attributs entre guillemets DANS les balises elles-mêmes. Pour ça, il faudrait donc reconnaitre les guillemets, apostrophes et caractères d'échappement...
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  8. #8
    Expert éminent
    Avatar de Emmanuel Delahaye
    Profil pro
    Retraité
    Inscrit en
    Décembre 2003
    Messages
    14 512
    Détails du profil
    Informations personnelles :
    Âge : 68
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Retraité

    Informations forums :
    Inscription : Décembre 2003
    Messages : 14 512
    Par défaut
    Citation Envoyé par koala01
    Soit, mais...

    Qu'en est-il d'une chaine du genre de
    (version simple)

    Si tu ne définis pas explicitement au minimum les balises HTML, la partie "35 et que b" sera considérée comme étant une balise, donc retirée ...Alors que ce n'est absolument pas une balise...
    Gné ? Pas conforme à W3C ça. '<', ça se code "&lt;" en HTML.

    Exemple de code que j'écris moi même avec mes petits doigts :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
     
     <li><b>Bibliothèque standard</b>
     
      <ul>
       <li>
      <a href="#difftime">&lt;time.h> : bien utiliser difftime()</a>
       </li>
       <li>
      <a href="#rand"> rand(), srand()... j'y comprends rien...</a>
       </li>
     
      </ul>
     </li>
    tiré de http://emmanuel-delahaye.developpez.com/notes.htm

Discussions similaires

  1. Supprimer les TAGs HTML
    Par jfvincent dans le forum Designer
    Réponses: 8
    Dernier message: 25/03/2010, 17h12
  2. Réponses: 4
    Dernier message: 09/04/2009, 17h25
  3. Convertir les tags HTML en entités avant l'ajout dans un document XML et vice versa
    Par JavaEli dans le forum Format d'échange (XML, JSON...)
    Réponses: 2
    Dernier message: 26/09/2006, 11h36
  4. [STRUTS] les tags html: et l'attribut "id"
    Par treivse dans le forum Struts 1
    Réponses: 2
    Dernier message: 01/08/2006, 08h20
  5. Supprimer les tags HTML
    Par Seth77 dans le forum Langage
    Réponses: 6
    Dernier message: 28/02/2006, 16h48

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo