Hello,

Je suis débutante en Admin Réseau & Sys, J'espère trouver une réponse à mes questions dans ce forum.

J'ai deux serveurs de la même configuration installés en cluster et exécutants les mêmes services.
J'ai remarqué dernièrement une augmentation de l'iowait sur l'une des machines sachant qu'aucune mise à jour ou installation n'a été faite récemment.

[muser@serv1-opc ~] $ iostat -x 1
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
cciss/c0d0 0.00 6.00 0.00 9.00 0.00 60.00 13.33 0.00 0.00 0.00 0.00 0.00 0.00

[muser@serv2-opc ~] $ iostat -x 1
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
cciss/c0d0 0.03 59.78 0.10 56.43 3.28 464.85 16.56 1.63 [B] 28.76 4.53 28.81 3.35 18.92

Il me semble qu'une utilisation de 18% n'est pas du tt dangereuse mais je dois qd mm justifier cette différence d'usage de disque entre les deux servs.

pour ça , j'ai exécuté un script qui permet d'afficher ts les processus à l'état D et qui peuvent être à l'origine de ce usage.
Le seul processus qui s'affiche sur le serv 2 avec une fréquence de 5 s est le kjournald ( le processus de journalisation ext3).

[muser@serv1-opc ~] $ dmesg | egrep "READ|WRITE|dirtied" | egrep -o '([a-zA-Z]*)' | sort | uniq -c | sort -rn | head
137 kjournald
96 java
75 pdflush
55 cat
3 echo

[muser@serv2-opc ~] $ dmesg | egrep "READ|WRITE|dirtied" | egrep -o '([a-zA-Z]*)' | sort | uniq -c | sort -rn | head
430 kjournald
50 pdflush
47 java
3 rs

- le pidstat du kjournald n'affiche aucune valeur dans les statistques.
- avec lsof je vois qu'il écrit dans les dossiers suivants :

kjournald 1190 root cwd unknown /proc/1190/cwd
kjournald 1190 root rtd unknown /proc/1190/root
kjournald 1190 root txt unknown /proc/1190/exe
kjournald 1190 root NOFD /proc/1190/fd

Là je me suis dis que peut être le problème vient du système de fichiers / des paramètres de journalisation.
mais en comparant la config des deux machines, j'ai constaté qu'elles sont configurés de la même façon :

cat /etc/fstab :

/dev/cciss/c0d0p1 / ext3 defaults 1 1
/dev/cciss/c0d0p2 swap swap defaults,noatime 0 0
/dev/cciss/c0d0p6 /tmp ext3 defaults,noatime 1 2
none /proc proc defaults 0 0
/dev/root / ext3 rw,data=ordered 0 0


Je n'ai donc toujours d'explication à cette différence d'iowait.

- pourquoi on journalise sur la machine 2 plus que la machine 1 alors que les deux sont en ext3 et configurées de la même façon.
- je ne peux pas malheureusement installer / utiliser iotop pour afficher les statistiques io? avec top les résultats ne sont pas pertinents ?

- avez vous des idées sur comment je peux avancer sur ce point, y a peut être d'autres éléments à analyser ? le problème d'iowait est peut être ailleurs et n'est pas lié à kjournald ?

Merci bcp de votre aide
ps : je suis désolée si je m'exprime mal en français

Hind