IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement Web en Java Discussion :

API java pour savoir si une page web peut être affichée


Sujet :

Développement Web en Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éprouvé
    Avatar de stc074
    Homme Profil pro
    Codeur du dimanche
    Inscrit en
    Janvier 2009
    Messages
    1 015
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Lozère (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Codeur du dimanche

    Informations forums :
    Inscription : Janvier 2009
    Messages : 1 015
    Billets dans le blog
    1
    Par défaut API java pour savoir si une page web peut être affichée
    Bonjour, en entrée j'ai du texte pouvant contenir des url, le comportement de mon code doit s'adater à ses url, j'ai du mal à tester si c'est une page web pouvant être affiché (avec du html) ou un lien de chargement, pour l'instant j'utilise JSoup mais ça rame, j'imerais trouver une api qui fait ça plus rapidement ou une autre methode (je dispose du mime mais la pas facile de faire le tri).
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    if (Jsoup.connect(linkUrl).get().hasText()) {
    //je considère que c une page ayant du contenu
    }

  2. #2
    Membre Expert

    Homme Profil pro
    Consultant informatique
    Inscrit en
    Janvier 2004
    Messages
    2 301
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Consultant informatique
    Secteur : Finance

    Informations forums :
    Inscription : Janvier 2004
    Messages : 2 301
    Par défaut
    Tu peux définir "peut être affiché" ?

    Par exemple:
    - Le nom de domaine peut être résolu
    - Le nom de domaine est résolu et un serveur web répond à la racine sur le port 80
    - L'url complète est correctement formatée
    - L'url complète est correcte et un document est accessible en GET
    - L'url complète est correcte et un document est accessible en GET, et son content-type est text/html
    - Etc...

    Quel doit être le comportement si le serveur est temporairement down?
    Quel comportement si la réponse est un redirect?
    Quel comportement si la réponse demande une authentification (401/403)?
    Etc.

  3. #3
    Membre éprouvé
    Avatar de stc074
    Homme Profil pro
    Codeur du dimanche
    Inscrit en
    Janvier 2009
    Messages
    1 015
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Lozère (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Codeur du dimanche

    Informations forums :
    Inscription : Janvier 2009
    Messages : 1 015
    Billets dans le blog
    1
    Par défaut
    peux être affichée veut dire pour moi que si tu cliques sur le lien tu as un document html lisible.
    Merci.

  4. #4
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Billets dans le blog
    2
    Par défaut
    "Lisible", donc du "texte", donc, à priori :

    • du html, statique ou dynamique ;
    • que du texte ;
    • pas d'images, pas de présentations spéciales (pas de tableaux (table, td, tr...), de formulaires (form et tout ce qui s'y trouve)... ignorer objets, tags sémantiques, map, canvas, etc.)) ;


    Donc, du texte donc donc du contenu de p & span, de div, de a, de ul/ol/li, de hn, dd/dl/dt en gros, et tous les tags de style. Je vois mal comment le savoir sans utiliser un accès dynamique (htmlunit serait mieux que jsoup pour le dynamique, mais pas sûr que ça soit mieux en terme de performances. Pour les pages statiques, Jericho ou TagSoup pourrait être plus performant dans la conversion html vers texte, à essayer en tout cas) sans parser le résultat et faire une analyse par sélection de tag (parser en sax ou stax permettrait de gagner du temps et de la mémoire) . Une chose qui peut être longue relativement dans ton traitement, c'est l'accès distant (le parsing en local, sauf pour des pages énormes, ne doit pas être très important). Et c'est difficile d'y couper, à moins que le site d'origine soit le tien. Reste à savoir distinguer ce qui est dynamique de ce qui est static en automatique, sans perdre trop de temps.
    Qu'est-ce qui gêne dans le fait que ça soit lent ? Est-ce que çà te freeze la GUI par exemple, auquel cas, un traitement en tâche de fond pourrait permettre une illusion de meilleur temps de réponse ?
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

  5. #5
    Membre éprouvé
    Avatar de stc074
    Homme Profil pro
    Codeur du dimanche
    Inscrit en
    Janvier 2009
    Messages
    1 015
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Lozère (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Codeur du dimanche

    Informations forums :
    Inscription : Janvier 2009
    Messages : 1 015
    Billets dans le blog
    1
    Par défaut
    oui c important pour moi que ce soit rapide, je fait un mur a la facebook avec les données qui s'affiche dynamiquement faut que ça speed, en gros le but du truc c'est d'afficher un aperçu si il y a bien une page visible, si c'est juste un lien pour dl ou autre chose je zap.
    Merci.

  6. #6
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Billets dans le blog
    2
    Par défaut
    Un aperçu, tu veux dire une image, calculée en fonction du contenu ?
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

Discussions similaires

  1. Réponses: 9
    Dernier message: 07/08/2013, 12h48
  2. Bonne approche pour adaptation d'une page web a un client donne
    Par dclink dans le forum Performance Web
    Réponses: 0
    Dernier message: 08/02/2013, 21h39
  3. Savoir si une page web est totalement chargée (sans onload)
    Par Difré91 dans le forum Général JavaScript
    Réponses: 8
    Dernier message: 17/07/2010, 20h56
  4. Recherche un outil simple pour création d'une page WEB
    Par marcel_kobain dans le forum Général Conception Web
    Réponses: 2
    Dernier message: 29/07/2009, 10h46
  5. lecture d'une cellule excel pour affichage dans une page web
    Par smartbis dans le forum Balisage (X)HTML et validation W3C
    Réponses: 1
    Dernier message: 22/05/2008, 09h33

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo