Bonjour,
Dans mon entreprise, un sous-contractant à porté une application de plateformes (redondantes) type "mainframe" à des serveurs bi-processeurs (redondants) Linux.
La version Linux est une distribution "particulière" (je ne révèle pas le nom) qui est sensée être une encapsulation d'une RedHat Enterprise.
Les seveurs sont 100% certifiés RHE.
Le problème, c'est qu'une fois toutes les lunes un des serveurs crash complètement:
* Appli morte (a vérifier, cf autres points)
* plus d'accès aux périphériques (clavier, souris, écran)
* plus de ssh ou autre possible
seul le ping de la machine "répond".
La seule solution est de rebooter la machine, mais évidemment, aucun log de crash d'appli n'est disponible au reboot (pas de core dump de l'appli) ni de core dump du kernel (j'ai l'impression qu'il vivote toujours puisqu'il répond au ping).
Auriez vous des pistes qui me permettrait d'investiguer, un cas similaire, un truc pour essayer de récupérer le serveur, n'importe quelle idée?
Merci pour le coup de main.
A++
JC
Partager