IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Entrée/Sortie Java Discussion :

[HTTPClient] Caratère non reconus


Sujet :

Entrée/Sortie Java

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Avril 2005
    Messages
    56
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Avril 2005
    Messages : 56
    Points : 43
    Points
    43
    Par défaut [HTTPClient] Caratère non reconus
    Bonjour,

    J'essaye de récupérer le contenu d'une page via une application Java. Mon problème est que certains caractère semble non reconnus lors du traitement de la réponse alors que la page s'affiche correctement dansun bronwser ... pour faire simple, voila en simplifié le code qui pose problème :


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
     
      String response = null;
                try {
                	HttpMethodBase m = new GetMethod(replaceBlanks(chapterURL));
                		m.getParams().setCookiePolicy(CookiePolicy.BROWSER_COMPATIBILITY);
                    client.executeMethod(m);
     
                    response = new String(m.getResponseBodyAsString().getBytes(), "ISO-8859-1");
                    System.out.println(response);
                } catch (IOException e) {
                    e.printStackTrace();  //To change body of catch statement use File | Settings | File Templates.
                    log.inform("error while retreiving paragraph");
                }
    Le Charset de la page est bien ISO-8859-1 (vérifié). Les caractères accentué sont bien traité mais le ' (représenté dans le getResponseBodyAsString() comme un "’" [Edit] le caractère ne passe pas, il s'agit d'un petit carré[/EDIT])se retrouve parsé dans response comme un "?".

    A noter que si un autre encoding est utilisé, non seulement le ' est mal parsé, mais les caractères accentué aussi.

    J'avoue que je ne vois vraiment pas d'ou vient le problème

  2. #2
    Membre du Club
    Profil pro
    Inscrit en
    Avril 2005
    Messages
    56
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Avril 2005
    Messages : 56
    Points : 43
    Points
    43
    Par défaut
    Au cas ou ca en intéresserait certains ... le ' est en fait un caratère venant de word qui "fait plus joli" mais qui n'est pas reconnut par l'ISO ... conclusion, je dois parser mon résultats et replacer tout les caractères qui ont le code hexa de "beautifull quote" (0x92) ... si quelqu'un a une solution plus globale, je suis preneur !

Discussions similaires

  1. Réponses: 2
    Dernier message: 19/11/2014, 14h23
  2. Réponses: 3
    Dernier message: 25/04/2007, 17h57
  3. [HTTPClient] Paramètre non retrouvé aprés un POST
    Par MrEddy dans le forum Entrée/Sortie
    Réponses: 2
    Dernier message: 16/02/2007, 11h32
  4. souris non reconus sous mandriva 2007
    Par RedBlack.Ma dans le forum Mandriva / Mageia
    Réponses: 1
    Dernier message: 03/02/2007, 14h14
  5. Problème d'affichage des caratères non UTF-8
    Par tit_pierre dans le forum Langage
    Réponses: 1
    Dernier message: 08/09/2006, 00h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo