Bonjour,
Pour exécuter un algorithme génétique, je lance sur un cluster des milliers d'occurence d'un même jar, chacun avec un jeu de paramètre de configuration qui dépend des résultats de la génération précédente. Pour caricaturer on a :
lancé des milliers de fois sur 256 nodes différents.Code:
1
2 java -jar programme.java fichier_config_###.xml
Chaque fois que je soumets un job sur le cluster, il y a toujours une des simulations qui pète. Mais l'erreur intervient à des moments différents et sur des nodes du cluster différents...
J'ai mis un fichier d'erreur complet en pièce jointe.Code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 # # An unexpected error has been detected by Java Runtime Environment: # # SIGSEGV (0xb) at pc=0x00007fcd8f87c751, pid=11670, tid=140519607047952 # # Java VM: Java HotSpot(TM) 64-Bit Server VM (10.0-b22 mixed mode linux-amd64) # Problematic frame: # V [libjvm.so+0x1d5751] # # If you would like to submit a bug report, please visit: # http://java.sun.com/webapps/bugreport/crash.jsp # The crash happened outside the Java Virtual Machine in native code. # See problematic frame for where to report the bug. #
Je ne connais pas ce genre de message d'erreur. Apparament c'est la JVM qui crashe.
Est-ce que qqn pourrait me dire svp comment il faut interpréter un tel message d'erreur et comment s'y prendre pour trouver la source du problème ?
D'avance merci,
Philippe.