IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

ASP.NET Discussion :

Contenu texte d’une page html


Sujet :

ASP.NET

  1. #1
    Membre confirmé Avatar de yazen
    Profil pro
    Inscrit en
    Août 2007
    Messages
    70
    Détails du profil
    Informations personnelles :
    Localisation : Maroc

    Informations forums :
    Inscription : Août 2007
    Messages : 70
    Par défaut Contenu texte d’une page html
    Bonjour,
    Je cherche à récupérer le contenu texte d’une page html câd le contenu sans du code html.
    J’ai cherché également à transformer mes pages html en des fichiers texte pour les parcourir ensuite et récupérer un contenu texte brut .mais je trouve pas comment.
    Donc si quelqu’un a des idées, merci de bien m’aider

    Asp.net/c#

  2. #2
    Membre Expert
    Homme Profil pro
    Inscrit en
    Juillet 2007
    Messages
    1 277
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Réunion

    Informations forums :
    Inscription : Juillet 2007
    Messages : 1 277
    Par défaut
    Bonjour,

    Il suffit d'utiliser une expression régulière : <[^>]+>

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    string nohtml = Regex.Replace(html, "<[^>]+>", "")
    Bien entendu, il faut peut-être convertir les <br/> en \r\n avant.

  3. #3
    Membre confirmé Avatar de yazen
    Profil pro
    Inscrit en
    Août 2007
    Messages
    70
    Détails du profil
    Informations personnelles :
    Localisation : Maroc

    Informations forums :
    Inscription : Août 2007
    Messages : 70
    Par défaut
    Mais il y a bcp de balise :<h1>, <spane>…et bien autres balises ce qui fait que j’aurai bien des problèmes

  4. #4
    Membre Expert
    Homme Profil pro
    Inscrit en
    Juillet 2007
    Messages
    1 277
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Réunion

    Informations forums :
    Inscription : Juillet 2007
    Messages : 1 277
    Par défaut
    Bonjour,

    Normalement cette expression régulière supprime toutes les balises d'un coup.

  5. #5
    Membre confirmé Avatar de yazen
    Profil pro
    Inscrit en
    Août 2007
    Messages
    70
    Détails du profil
    Informations personnelles :
    Localisation : Maroc

    Informations forums :
    Inscription : Août 2007
    Messages : 70
    Par défaut
    string nohtml = Regex.Replace(html, "<[^>]+>", "")
    Regex:c'est la chaine qui contient du code html??
    de meme pour la variable html??
    parceque j'ai jamais utiliser les exp regulieres !

  6. #6
    Membre confirmé Avatar de yazen
    Profil pro
    Inscrit en
    Août 2007
    Messages
    70
    Détails du profil
    Informations personnelles :
    Localisation : Maroc

    Informations forums :
    Inscription : Août 2007
    Messages : 70
    Par défaut
    string nohtml = Regex.Replace(html, "<[^>]+>", "")
    Regex:c'est la chaine qui contient du code html??
    de meme pour la variable html??
    parceque j'ai jamais utiliser les exp regulieres !
    merci pour votre patience

  7. #7
    Membre Expert
    Homme Profil pro
    Inscrit en
    Juillet 2007
    Messages
    1 277
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Réunion

    Informations forums :
    Inscription : Juillet 2007
    Messages : 1 277
    Par défaut
    Bonjour,

    Regex est une classe de l'espace de nom System.Text.RegularExpressions.
    La méthode Regex.Replace est dans ce cas une méthode statique de la classe Regex.
    Il est également possible de créer une instance de cette classe et d'utiliser la méthode d'instance, ce qui est plus performant lorsqu'il y a des modifications à effectuer sur plusieurs string à la chaîne.

    html est une string qui contient le contenu html. Toutes les balises seront supprimées d'un seul coup.

  8. #8
    Membre confirmé Avatar de yazen
    Profil pro
    Inscrit en
    Août 2007
    Messages
    70
    Détails du profil
    Informations personnelles :
    Localisation : Maroc

    Informations forums :
    Inscription : Août 2007
    Messages : 70
    Par défaut
    marci je vais aesayer ca

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. vb 6 + WebBrowser ,lire le contenu d'un page html
    Par mqsi dans le forum VB 6 et antérieur
    Réponses: 4
    Dernier message: 10/12/2007, 16h34
  2. Réponses: 2
    Dernier message: 24/03/2007, 20h20
  3. [AJAX] Recupérer le contenu d'une page html
    Par tenev911 dans le forum Général JavaScript
    Réponses: 1
    Dernier message: 10/03/2007, 00h25
  4. Récupérer contenu d'une page HTML
    Par ArHacKnIdE dans le forum Langage
    Réponses: 9
    Dernier message: 07/11/2006, 08h56
  5. Réponses: 5
    Dernier message: 30/11/2005, 09h48

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo