IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Administration système Discussion :

Linux kernel segfault et redémarrage du système.


Sujet :

Administration système

  1. #1
    Membre habitué
    Homme Profil pro
    Ingénieur systèmes et réseaux
    Inscrit en
    Juillet 2009
    Messages
    218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur systèmes et réseaux
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Juillet 2009
    Messages : 218
    Points : 130
    Points
    130
    Par défaut Linux kernel segfault et redémarrage du système.
    Bonjour,

    J'ai un système exécutant un programme spécifique qui segfault en continu et le système redémarre après plusieurs erreurs de segmentation mémoire.

    Voici un petit extrait des messages de logs d'erreur de segmentation. J'ai juste copié un extrait car il ya beaucoup des erreurs de segmentation. Le programme segfault de plusieurs fois, le système redémarre et le programme recommence à segfaulter encore et encore. La dernière erreur de s'est produit se produit hire à 14h59. Le système est physiquement situé aux USA et l'heure ici correspond à l'heure locale aux États-Unis :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
     
        Jan 9 11:13:28 HOSTNAME kernel: prog_name[702]: segfault at a ip 0000000a sp bfdbbf7c error 14 in pro_name[8048000+17000]
        Jan 9 11:13:54 HOSTNAME kernel: prog_name[25261]: segfault at a ip 0000000a sp bfcbc3dc error 14 in prog_name[8048000+17000]
        Jan 9 11:14:19 HOSTNAME kernel: prog_name[25280]: segfault at a ip 0000000a sp bf94216c error 14 in prog_name[8048000+17000]
        Jan 9 11:14:45 HOSTNAME kernel: prog_name[25308]: segfault at a ip 0000000a sp bfc3ca5c error 14 in prog_name[8048000+17000]
        Jan 9 11:15:11 HOSTNAME kernel: prog_name[25346]: segfault at a ip 0000000a sp bfb046ac error 14 in prog_name[8048000+17000]
        Jan 9 11:15:37 HOSTNAME kernel: prog_name[25374]: segfault at a ip 0000000a sp bfaa8aac error 14 in prog_name[8048000+17000]
        Jan 9 11:16:03 HOSTNAME kernel: prog_name[25393]: segfault at a ip 0000000a sp bf951c2c error 14 in prog_name[8048000+17000]
        Jan 9 11:16:29 HOSTNAME kernel: prog_name[25441]: segfault at a ip 0000000a sp bf84e9bc error 14 in prog_name[8048000+17000]
        Jan 9 11:16:55 HOSTNAME kernel: prog_name[25460]: segfault at a ip 0000000a sp bfc357ac error 14 in prog_name[8048000+17000]
        Jan 9 11:17:21 HOSTNAME kernel: prog_name[25499]: segfault at a ip 0000000a sp bfa090bc error 14 in prog_name[8048000+17000]
        Jan 9 11:17:47 HOSTNAME kernel: prog_name[25547]: segfault at a ip 0000000a sp bfd8de1c error 14 in prog_name[8048000+17000]
        Jan 9 11:39:46 HOSTNAME kernel: prog_name[25566]: segfault at a ip 0000000a sp bfa50c6c error 14 in prog_name[8048000+17000]
        Jan 9 11:40:12 HOSTNAME kernel: prog_name[26706]: segfault at a ip 0000000a sp bfeeea4c error 14 in prog_name[8048000+17000]
        Jan 9 11:40:38 HOSTNAME kernel: prog_name[26774]: segfault at a ip 0000000a sp bfca6cdc error 14 in prog_name[8048000+17000]
        Jan 9 11:41:04 HOSTNAME kernel: prog_name[26814]: segfault at a ip 0000000a sp bf8c078c error 14 in prog_name[8048000+17000]
        Jan 9 11:41:29 HOSTNAME kernel: prog_name[26842]: segfault at a ip 0000000a sp bfc4316c error 14 in prog_name[8048000+17000]
    Et cela a eu lieu plusieurs au cours de la journée. J'ai regardé les logs (/var/log/messages, /var/log/secure, /var/log/boot.log ....) mais je ne vois aucune trace de la raison de redémarrage du système. et le système a redémarré tout seul (sans aucune action manuelle).

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
     
    reboot   system boot  3.11.10-100.fc18 Fri Jan  9 15:00 - 17:21  (02:21)
    reboot   system boot  3.11.10-100.fc18 Fri Jan  9 14:18 - 17:21  (03:03)
    reboot   system boot  3.11.10-100.fc18 Fri Jan  9 13:51 - 17:21  (03:30)
    reboot   system boot  3.11.10-100.fc18 Fri Jan  9 13:01 - 17:21  (04:20)
    reboot   system boot  3.11.10-100.fc18 Fri Jan  9 12:25 - 17:21  (04:56)
    reboot   system boot  3.11.10-100.fc18 Fri Jan  9 12:20 - 17:21  (05:01)
    Je n'arrive pas à comprendre pourquoi le système redémarre à chaque fois, et je aimerais savoir si un segfault peut entrainer le redémarrage automatique d'un système Linux. A priori non pour moi car un processus au niveau userland ne peut pas arrêter le système.

    Yat-il un autre endroit où l'on peut voir ce qui provoque un redémarrage du système?

    prog_name dans les logs ci-dessus est le nom du programme/processus, il s'agit d'un programme écrit en C/C++, un logiciel embarqué.
    Le système tourne sous fedora, avec un kernel en SMP.
    4 processeurs Intel(R) Core(TM) i7-3517UE CPU @ 1.70GHz.

    Et pour le matériel il s'agit d'une vbox-3600.

    Merci

  2. #2
    Responsable Systèmes


    Homme Profil pro
    Gestion de parcs informatique
    Inscrit en
    Août 2011
    Messages
    17 446
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Gestion de parcs informatique
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Août 2011
    Messages : 17 446
    Points : 43 090
    Points
    43 090
    Par défaut
    Si tu démarre en mode maintenance, même problème ?

    Les infos ne sont pas assez claires, erreurs matérielle ou logicielle.

    Testes déjà la RAM.
    Ma page sur developpez.com : http://chrtophe.developpez.com/ (avec mes articles)
    Mon article sur le P2V, mon article sur le cloud
    Consultez nos FAQ : Windows, Linux, Virtualisation

  3. #3
    Membre habitué
    Homme Profil pro
    Ingénieur systèmes et réseaux
    Inscrit en
    Juillet 2009
    Messages
    218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur systèmes et réseaux
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Juillet 2009
    Messages : 218
    Points : 130
    Points
    130
    Par défaut
    Bonjour,

    Aucune trace d'erreur matérielle sur le système.

    Je parles bien de plusieurs segfault en continu, suivis de redémarrages.

    Avant que le système redémarre la dernière fois, j'avais déjà vérifier l'utilisation de la mémoire à coup de free, et elle était à moi de 20 % utilisée.
    @chrtophe tu penses à quoi toi quand tu me demandes de tester la mémoire? Merci.

    Depuis le système n'a plus redémarré, et le programme ne segfault plus. Je suis moi aussi persuadé que c'est un problème de ressources matérielles, mais y-a-t-il un endroit que j'ai oublié de vérifier?

    Je vais essayer de trouver des outils qui permettent de monitorer un système et remonter/logger des information à l'extinction ou au redémarrage. Je vais regarder du côté de sar. D'autres idées d'outils plus adaptés?

    Cordialement.

  4. #4
    Responsable Systèmes


    Homme Profil pro
    Gestion de parcs informatique
    Inscrit en
    Août 2011
    Messages
    17 446
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Gestion de parcs informatique
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Août 2011
    Messages : 17 446
    Points : 43 090
    Points
    43 090
    Par défaut
    Peut-être une barette RAM défectueuse.

    SI tu démarres en init 1, pas de service supplémentaire chargé. Qu'est ce que ça donne ?
    Il fait quoi ton serveur ? tu as peut-être un service qui plante. Si c'est récurent c'est déjà plus facile à trouver.
    Ma page sur developpez.com : http://chrtophe.developpez.com/ (avec mes articles)
    Mon article sur le P2V, mon article sur le cloud
    Consultez nos FAQ : Windows, Linux, Virtualisation

Discussions similaires

  1. sous-section Linux Kernel dans la section développement Linux
    Par kromartien dans le forum Evolutions du club
    Réponses: 1
    Dernier message: 13/04/2007, 09h36
  2. [Virus] redémarrage du système
    Par irnatene dans le forum Sécurité
    Réponses: 7
    Dernier message: 21/02/2007, 13h48
  3. Linux->kernel->sources : Documentation
    Par doccpu dans le forum Administration système
    Réponses: 3
    Dernier message: 04/09/2006, 11h03
  4. Linux Kernel Developpement
    Par Invité(e) dans le forum Linux
    Réponses: 3
    Dernier message: 13/06/2006, 14h52

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo