IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Format d'échange (XML, JSON...) Java Discussion :

Construction d'objets à partir de nombreux documents XML -> HEAP SPACE EXCEPTION [DOM]


Sujet :

Format d'échange (XML, JSON...) Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé Avatar de StripMat
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2014
    Messages
    206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Maine et Loire (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2014
    Messages : 206
    Par défaut Construction d'objets à partir de nombreux documents XML -> HEAP SPACE EXCEPTION
    Bonjour à tous,

    Je développe un traitement qui récupère du contenu XML provenant d'un web service pour construire des objets. J'ai développé tous mes traitements pour une dizaine de documents XML, sauf qu'en réalité, je dois en traiter une cinquantaine, et là j'ai un soucis de mémoire (java.lang.OutOfMemoryError: Java heap space).

    Au fur et à mesure des traitements, le processus de ma JVM monte en mémoire jusqu'a plus d'1Go et ça finis toujours par planter...

    J'ai bien vu qu'il existait d'autres moyens pour traiter du XML comme SAX seulement j'ai besoins de parcourir les noeuds de mes documents et de vérifier certaines informations avant d'en extraire le contenu, ce que je trouve plus facile à réaliser avec DOM.

    Y a t-il une ou des mauvaises pratiques à éviter avec DOM pour ménager la mémoire ?

    J'utilise une classe avec des fonctions static pour traiter le XML, je déclare mes InputSource, Document et NodeList comme variables de classe, les instancie au début de mes fonctions et les met à null après les avoirs utilisés.
    Code Java : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    builder = factory.newDocumentBuilder();
    is = new InputSource(new StringReader(xml));
    doc = builder.parse(is);
    Je devrais peut-être faire un vrai singleton ? Et initialiser ces éléments communs à mes fonctions via le getInstance() ?
    J'attend vos conseils, je peux présenter du code mais je ne sais pas où commencer

  2. #2
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Billets dans le blog
    2
    Par défaut
    Salut,

    Utilise un profiler pour répérer les instances qui stagnent en mémoire, ça te permettra de répérer les fuites de mémoires. S'il n'y en a pas, c'est que manifestement ton programme à besoin de plus de heap et il te suffira de l'augmenter (paramètre -Xmx).

    Par ailleurs, d'où viennent les XML ? Je vois que tu utilises un StringReader, donc xml est une String, mais comment est produite cette String ? Si c'est par une lecture de fichier, libères-tu bien les ressources ayant servi à lire les fichiers ?

    Citation Envoyé par StripMat Voir le message
    J'utilise une classe avec des fonctions static pour traiter le XML, je déclare mes InputSource, Document et NodeList comme variables de classe, les instancie au début de mes fonctions et les met à
    Pourquoi ne simplement utiliser des variables locales (à la méthode) ?
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

  3. #3
    Membre confirmé Avatar de StripMat
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2014
    Messages
    206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Maine et Loire (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2014
    Messages : 206
    Par défaut
    Les XML proviennent d'un web service, que je récupère en string comme ceci
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    xmlReponse = EntityUtils.toString(httpResponse.getEntity(), "UTF-8");
    Je vais voir de ce côté là, c'est peut-être ma classe Http qui n'est pas bien conçue mais j'en doute. Je vais voir pour utiliser un profiler.

    Concernant les variables locales, en fait j'avais conçue ma classe comme ça, mais j'ai pensé que ce serait moins lourd en mémoire de n'utiliser qu'un seul objet déclaré en variable de classe et écrasé à chaque nouvel appel de fonction, mais ça n'est visiblement pas le cas

    J'ai essayé d'augmenté la taille du HEAP SPACE à -Xmx1024m mais ça n'est toujours pas suffisant. Je réessaye avec 2048.

    Je vais voir aussi si les XML que je cherche à traiter ne sont pas trop volumineux, j'ai lu quelque part qu'il fallait 12x plus de mémoire que la taille du XML à traiter avec DOM. Mais bon, ce qui est étrange c'est que plus j'ai de documents, plus la mémoire monte...

    Je test tout ça.

  4. #4
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par StripMat Voir le message
    Concernant les variables locales, en fait j'avais conçue ma classe comme ça, mais j'ai pensé que ce serait moins lourd en mémoire de n'utiliser qu'un seul objet déclaré en variable de classe et écrasé à chaque nouvel appel de fonction, mais ça n'est visiblement pas le cas
    Strictement aucune différence dans l'occupation mémoire, sauf qu'il faut juste penser à les mettre à null, et que ta méthode est stateless, donc non utilisable en multi-thread.

    Citation Envoyé par StripMat Voir le message
    J'ai essayé d'augmenté la taille du HEAP SPACE à -Xmx1024m mais ça n'est toujours pas suffisant. Je réessaye avec 2048.
    Oui, ça fait beaucoup. Il faut voir la taille de tes xml (le nombre de nodes). Déjà, si tu peux traiter le plus gros de tes xml, avec une mémoire donnée, mais que tu ne peux pas en traiter plusieurs d'affilée, c'est plutôt côté fuite de mémoire qu'il faut investiger.

    Citation Envoyé par StripMat Voir le message
    Je vais voir aussi si les XML que je cherche à traiter ne sont pas trop volumineux, j'ai lu quelque part qu'il fallait 12x plus de mémoire que la taille du XML à traiter avec DOM.
    Tout dépend déjà de l'API DOM que tu utilises (JavaSE, JDOM...). Bien sûr, utiliser StAX est toujours intéressant avec des gros documents, pas seulement pour l'empreinte mémoire, mais aussi pour les performances (créer plein d'instances de nodes va beaucoup solliciter le GC pour les libérer).

    Citation Envoyé par StripMat Voir le message
    Mais bon, ce qui est étrange c'est que plus j'ai de documents, plus la mémoire monte...
    Un signe qui pourrait confirmer la fuite de mémoire (enfin pas forcément, mais combiné avec l'outofmemory, c'est une hypothèse plus que probable).
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

  5. #5
    Membre confirmé Avatar de StripMat
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2014
    Messages
    206
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 30
    Localisation : France, Maine et Loire (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2014
    Messages : 206
    Par défaut
    Merci beaucoup pour ces indications, j'ai pu installer et réaliser une analyse avec un Profiler, il me reste plus qu'a comprendre ce qu'il me dit. J'en sais un peu plus sur quels éléments porter mon attention.

    PS: Je sais pas si l'indication est bonne, mais avec un String.getBytes("utf-8").length / 8 certains de mes XML feraient plus de 3Go mais sa semble passer, en revanche même avec 2Go d'alloués en Heap Space, sa plante encore au bout de X fichiers traités, certains faisant de 3Mo à +3Go

    To be continued...

  6. #6
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Billets dans le blog
    2
    Par défaut
    Citation Envoyé par StripMat Voir le message
    PS: Je sais pas si l'indication est bonne, mais avec un String.getBytes("utf-8").length / 8 certains de mes XML feraient plus de 3Go
    Pourquoi le / 8 ?
    Attention, en utf-8, un caractère ne donne pas forcément un octet, mais ça peut aller jusqu'à 4 en normalisé (8 en théorie). La plupart des caractères (alphanumérique, symboles standards, y compris de syntaxe xml, les caractères accentués usuels en français), c'est 1 octet, avec certains symboles courants sur 2, et certains caractères spéciaux usuels sur 3 (symbole de l'euro, espaces typographiques...).
    Penser au problème de la fuite de mémoire possible avec String.substring (pour les version anté Java7 update 6 de mémoire).

    Mais même si tes strings faisait "seulement" 400Mchar, je pense qu'il faudrait envisager un traitement en stream/StAX.

    Attention, il y a une taille max de heap (il me semble, 4Gi en 32bits (2Gi sur Windows), 264 en 64bits).
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Débutant] Récupération d'une valeur à partir d'un document xml
    Par samuel44 dans le forum Général Dotnet
    Réponses: 5
    Dernier message: 01/08/2016, 11h13
  2. [SAX] Récupérer des attributs à partir d'un document XML
    Par Keyzounet dans le forum Format d'échange (XML, JSON...)
    Réponses: 6
    Dernier message: 11/01/2013, 09h52
  3. arbre minimal a partir d'un document xml
    Par veerzara dans le forum Débuter
    Réponses: 1
    Dernier message: 31/05/2011, 13h26
  4. Fabriquer des requêtes sql à partir d'un document xml
    Par ktel dans le forum XQUERY/SGBD
    Réponses: 4
    Dernier message: 18/10/2005, 16h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo