IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement Web en Java Discussion :

Récupérer seulement le texte d'une page Web


Sujet :

Développement Web en Java

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Mai 2007
    Messages
    69
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2007
    Messages : 69
    Points : 50
    Points
    50
    Par défaut Récupérer seulement le texte d'une page Web
    Bonjour à tous et merci de prendre la peine de lire mon post!
    Allez à www.google.fr, cliquez droit puis sur "Afficher le code source de la page".
    Vous voyez combien il y a de source pour afficher le peu qu'il y a sur la page d'accueil de Google?
    Ceci, est juste un exemple d'illustration.
    Ce que j'aimerais c'est à partir d'une page Web n'extraire que les informations textuelles. Donc par exemple pour la page de Google ce serait:
    Web, Images, Vidéos, Maps, Actualités, Livres, Gmail, plus, Recherche Google, J'ai de la chance, ... etc.
    Est-ce que ceci est possible?

  2. #2
    Membre extrêmement actif
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    1 418
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 1 418
    Points : 1 658
    Points
    1 658
    Par défaut
    Bonsoir,



    Bien sûr que c’est possible.
    Il y a deux solutions, à ce que je sais:

    - utiliser un parser utilisable pour le langage de construction de page web dans lequel est écrit le code source

    - se faire un programme personnel qui va extraire du texte les données voulues.
    J’ai fait ça encore récemment pour quelqu’un qui se posait le même problème:
    http://www.developpez.net/forums/d87...ees-doc-xhtml/
    Il doit être possible de faire la même chose en n’importe quel langage de programmation.

Discussions similaires

  1. Récupérer un champ texte d'une page web pour l'insérer dans une autre
    Par Cubilot dans le forum Balisage (X)HTML et validation W3C
    Réponses: 2
    Dernier message: 02/06/2014, 10h08
  2. Récupérer le texte d'une page web
    Par claustro dans le forum Langage
    Réponses: 2
    Dernier message: 29/09/2008, 13h18
  3. afficher le contenu d'une zone de texte dans une page WEB
    Par tomman dans le forum Balisage (X)HTML et validation W3C
    Réponses: 6
    Dernier message: 11/06/2007, 14h55
  4. Cacher du texte d' une page web
    Par WELCOMSMAIL dans le forum Mise en page CSS
    Réponses: 6
    Dernier message: 26/10/2006, 11h02
  5. Récupérer le code source d'une page web
    Par glRaZ dans le forum C++Builder
    Réponses: 4
    Dernier message: 08/12/2004, 09h16

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo