IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Java Discussion :

Parser fichier texte


Sujet :

Langage Java

  1. #1
    Membre averti
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Avril 2010
    Messages
    270
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Argentine

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Avril 2010
    Messages : 270
    Points : 391
    Points
    391
    Par défaut Parser fichier texte
    Bonjour à tous!!

    J'ai un petit soucis avec le parse d'un fichier, je m'explique. Je recupère une page html sous un fichier texte et j'aimerais enlever toutes les balises ou autres "codes" html. Pour cela j'utilise un StringBuilder, je fais un boucle pour lire et le fichier et j'applique
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    resultat.append(value.replaceAll("<[^>]+>",""));
    pour enlever les balises. Lorsqu'à la suite je fais un
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    resultat.append(value.replaceAll("&nbsp;",""));
    pour enlever les nbsp, la première instruction ne fonctionne plus.

    Avez-vous déjà rencontré ce problème?

    Merci d'avance

  2. #2
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 481
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 481
    Points : 48 806
    Points
    48 806
    Par défaut
    là tu ajoute deux fois le contenu (appel à append). Une fois sans balises, et ensuite une fois sans les &nbsp;, mais jamais sans les deux.


    si tu veux appliquer plusieurs regexp, il faut appliquer chaque replace au résultat précédent, pas repartir du texte d'origine.


    PS: on a déjà vu plus fiable que des regexp pour retirer des balises

  3. #3
    Membre averti
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Avril 2010
    Messages
    270
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Argentine

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Avril 2010
    Messages : 270
    Points : 391
    Points
    391
    Par défaut
    Je vais essayer de m'en sortir avec ta remarque.

    Quels sont les autres moyens pour enlever des balises s'il te plaît?

    Merci pour ton aide

  4. #4
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 481
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 481
    Points : 48 806
    Points
    48 806
    Par défaut
    un parseur html en bonne et due forme

  5. #5
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 551
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 551
    Points : 21 607
    Points
    21 607
    Par défaut
    Code HTML : Sélectionner tout - Visualiser dans une fenêtre à part
    <span title="La zone où x > 3y">le bas du plan</span>

    Code HTML : Sélectionner tout - Visualiser dans une fenêtre à part
    <!-- <<< LE MENU PRINCIPAL >>>  -->

    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

  6. #6
    Membre averti
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Avril 2010
    Messages
    270
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Argentine

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Avril 2010
    Messages : 270
    Points : 391
    Points
    391
    Par défaut
    En fait c'est bon j'ai utilisé une expression régulière, c'est pas la façon la plus belle de faire ça mais cela me convient!!

    Merci de votre aide!!

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Parser fichier texte : 1 ligne --> 800 mo!
    Par bigbobby64 dans le forum C#
    Réponses: 3
    Dernier message: 27/11/2012, 09h07
  2. Comment parser un fichier texte en batch ?
    Par arnaudperfect dans le forum Scripts/Batch
    Réponses: 0
    Dernier message: 20/11/2007, 09h07
  3. Parser un petit fichier texte
    Par viscere dans le forum Format d'échange (XML, JSON...)
    Réponses: 5
    Dernier message: 26/04/2006, 09h59
  4. parser fichier texte pour avoir un doc html !!
    Par avogadro dans le forum Débuter
    Réponses: 4
    Dernier message: 30/03/2006, 16h12
  5. Parser de fichier textes >> Logs Apache
    Par gregb34 dans le forum Langage
    Réponses: 2
    Dernier message: 17/02/2006, 18h34

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo