Précédent   Forum des professionnels en informatique > Systèmes > Linux > Système
Système Vos questions autour de l'administration système
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 03/10/2007, 11h33   #1
Membre du Club
 
Inscription : décembre 2002
Messages : 55
Détails du profil
Informations forums :
Inscription : décembre 2002
Messages : 55
Points : 43
Points : 43
Par défaut Crash Total serveur Linux

Bonjour,

Dans mon entreprise, un sous-contractant à porté une application de plateformes (redondantes) type "mainframe" à des serveurs bi-processeurs (redondants) Linux.
La version Linux est une distribution "particulière" (je ne révèle pas le nom) qui est sensée être une encapsulation d'une RedHat Enterprise.
Les seveurs sont 100% certifiés RHE.


Le problème, c'est qu'une fois toutes les lunes un des serveurs crash complètement:
* Appli morte (a vérifier, cf autres points)
* plus d'accès aux périphériques (clavier, souris, écran)
* plus de ssh ou autre possible

seul le ping de la machine "répond".

La seule solution est de rebooter la machine, mais évidemment, aucun log de crash d'appli n'est disponible au reboot (pas de core dump de l'appli) ni de core dump du kernel (j'ai l'impression qu'il vivote toujours puisqu'il répond au ping).

Auriez vous des pistes qui me permettrait d'investiguer, un cas similaire, un truc pour essayer de récupérer le serveur, n'importe quelle idée?

Merci pour le coup de main.

A++
JC
__________________
Far beyond the clouds...
jc_isd est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/10/2007, 11h54   #2
Modérateur
 
Avatar de ggnore
 
Inscription : juillet 2004
Messages : 2 246
Détails du profil
Informations personnelles :
Âge : 33

Informations forums :
Inscription : juillet 2004
Messages : 2 246
Points : 1 903
Points : 1 903
Tu pourrais essayer monit qui peut te permettre d'automatiser la relancement d'un service qui serait tombé.

Tu peux également essayer d'augmenter le niveau de log des applications suspectes.
__________________
Toutes les vertus des hommes se perdent dans l’intérêt comme les fleuves se perdent dans la mer.
ggnore est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 03/10/2007, 19h32   #3
Rédacteur/Modérateur
 
Avatar de gorgonite
 
Homme Nicolas Vallée
Ingénieur Système
Inscription : décembre 2005
Messages : 9 774
Détails du profil
Informations personnelles :
Nom : Homme Nicolas Vallée
Âge : 27
Localisation : France

Informations professionnelles :
Activité : Ingénieur Système
Secteur : Transports

Informations forums :
Inscription : décembre 2005
Messages : 9 774
Points : 14 303
Points : 14 303
petit lien pour monit http://gorgonite.developpez.com/tutoriels/linux/monit/
__________________
Evitez les MP pour les questions techniques... il y a des forums
Contributions sur DVP : Mes Tutos | Mon Blog
gorgonite est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 04/10/2007, 09h29   #4
Membre du Club
 
Inscription : décembre 2002
Messages : 55
Détails du profil
Informations forums :
Inscription : décembre 2002
Messages : 55
Points : 43
Points : 43
Merci pour votre aide.

JC
__________________
Far beyond the clouds...
jc_isd est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 14/12/2007, 11h57   #5
Membre du Club
 
Inscription : décembre 2002
Messages : 55
Détails du profil
Informations forums :
Inscription : décembre 2002
Messages : 55
Points : 43
Points : 43
Pour info, le problème était que l'appli qui tourne sur le serveur est définie en mode scheduleur "sched_fifo" (et non "sched_others"). Du fait de cet autre mode scheduleur, et du fait qu'un bug de l'appli provoquait une boucle infinie, le kernel qui dans ce mode sched_fifo ayant une priorité plus faible que le programme ne reprennait plus la main du tout. Ce qui faisait apparaître ces symptomes.

JC
__________________
Far beyond the clouds...
jc_isd est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 21h40.


 
 
 
 
Partenaires

Hébergement Web