IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Format d'échange (XML, JSON...) Java Discussion :

Filtrage des données web


Sujet :

Format d'échange (XML, JSON...) Java

  1. #1
    Membre averti
    Inscrit en
    Juillet 2009
    Messages
    34
    Détails du profil
    Informations forums :
    Inscription : Juillet 2009
    Messages : 34
    Par défaut Filtrage des données web
    Bonjour

    Je cherche des informations qui peuvent m'aider à poursuivre mon projet de fin d'année..
    En fait, je travaille actuellement sur une tâche portant sur le filtrage des pages web.
    Autrement dit, lorsque un utilisateur cherche dans google, au lieu de lui afficher les pages html, on va filtrer ces pages (c'est à dire garder uniquement l'information pertinente recherchée et éliminer tous ce qui est code html et toutes les informations relatives à google) en générant des fichiers XML.
    Je vous prie de me donner des recommandations concernant ce problème.
    Merci d'avance

  2. #2
    Modérateur
    Avatar de dinobogan
    Homme Profil pro
    ingénieur
    Inscrit en
    Juin 2007
    Messages
    4 073
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : ingénieur
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2007
    Messages : 4 073
    Par défaut
    Citation Envoyé par nechalus Voir le message
    Je vous prie de me donner des recommandations concernant ce problème.
    Tu as exposé pleins de problèmes possibles. Dis nous exactement ce qui te pose problème en premier. C'est un sujet à aborder par étape.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java
    Que la force de la puissance soit avec le courage de ta sagesse.

  3. #3
    Membre averti
    Inscrit en
    Juillet 2009
    Messages
    34
    Détails du profil
    Informations forums :
    Inscription : Juillet 2009
    Messages : 34
    Par défaut
    Bonjour,
    En fait, je cherche dans un premier temps de nettoyer un fichier html, en supprimant tous ce qui est code HTML,CSS,PHP ....
    Et je dois avoir en sortie un ficheir xml contenant le contenu brute de fichier html ainsi nettoyé.

  4. #4
    Membre Expert
    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    1 466
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 466
    Par défaut
    T'as des outils open source pour faire une conversion vers XML
    http://sourceforge.net/projects/light-html2xml/
    Tu pourras filtrer ce que tu veux en xml après

    Sinon t'as des parser HTML pour filtrer plus tôt :
    http://nekohtml.sourceforge.net/

Discussions similaires

  1. filtrages des donnéés
    Par Mapokko dans le forum Macros et VBA Excel
    Réponses: 4
    Dernier message: 20/12/2008, 08h25
  2. filtrage des données en local
    Par schwarzy2 dans le forum MS SQL Server
    Réponses: 2
    Dernier message: 18/04/2008, 11h20
  3. Filtrage des données, qui s'en occupe ?
    Par bbmt dans le forum MVC
    Réponses: 36
    Dernier message: 24/12/2007, 16h18
  4. importer des données web sur excel
    Par irouni dans le forum Excel
    Réponses: 3
    Dernier message: 18/12/2007, 11h12
  5. Réponses: 3
    Dernier message: 30/03/2007, 09h53

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo