Bonjour,

Je fais tourner deux serveurs identiques (Redhat ES4 update 2 4 CPUs, clonés via duplication de disque en raid1) qui fonctionnent en load-balancing round-robin.
Quand je fais un report via sar, j'obtiens un affichage normal sur le premier serveur :
#> sar -f /var/log/sa/sa20 -P ALL

Linux 2.6.9-5.ELsmp (xxx1.xxx.xxx.xxx) 20.12.2008

00:00:01 CPU %user %nice %system %iowait %idle
00:10:01 all 89,79 0,00 10,13 0,09 0,00
00:10:01 0 14,81 0,00 1,31 0,01 83,87
00:10:01 1 22,25 0,00 1,34 0,01 76,40
00:10:01 2 22,24 0,00 1,95 0,04 75,77
00:10:01 3 34,13 0,00 5,95 0,03 59,89
00:20:01 all 90,06 0,00 9,93 0,01 0,00
00:20:01 0 19,57 0,00 1,71 0,01 78,72
00:20:01 1 31,73 0,00 1,86 0,00 66,41
00:20:01 2 31,81 0,00 2,50 0,01 65,68
00:20:01 3 40,14 0,00 7,54 0,00 52,32
....
23:50:01 all 90,23 0,00 9,74 0,03 0,00
23:50:01 0 13,17 0,00 0,97 0,00 85,86
23:50:01 1 24,89 0,00 1,08 0,00 74,03
23:50:01 2 20,22 0,00 1,56 0,01 78,21
23:50:01 3 23,51 0,00 5,23 0,01 71,24
Moyenne: all 87,90 0,00 12,04 0,06 0,00
Moyenne: 0 11,92 0,00 0,92 0,01 87,14
Moyenne: 1 21,62 0,00 0,95 0,01 77,42
Moyenne: 2 15,85 0,00 1,74 0,02 82,38
Moyenne: 3 22,26 0,00 6,23 0,01 71,50

Par contre sur le deuxième serveur, cette log de 00h00 à 23h50 est répétée plusieurs fois pour un même jour. De plus le load-average est très élevé sur ce même serveur :
#> sar -f /var/log/sa/sa20 -P ALL

Linux 2.6.9-5.ELsmp (xxx2.xxx.xxx.xxx) 20.12.2008

00:00:01 CPU %user %nice %system %iowait %idle
00:10:01 all 91.43 0.00 8.52 0.05 0.00
00:10:01 0 4.47 0.00 0.49 0.01 95.03
00:10:01 1 10.61 0.00 0.71 0.01 88.67
00:10:01 2 12.32 0.00 1.43 0.00 86.26
00:10:01 3 6.31 0.00 0.51 0.01 93.17
...
23:50:01 all 91.18 0.00 8.72 0.10 0.00
23:50:01 0 8.28 0.00 0.86 0.00 90.86
23:50:01 1 13.33 0.00 0.98 0.01 85.68
23:50:01 2 27.43 0.00 3.07 0.01 69.50
23:50:01 3 10.39 0.00 0.77 0.05 88.79
00:00:01 all 91.08 0.00 8.75 0.17 0.00
00:00:01 0 7.15 0.00 0.74 0.02 92.09
00:00:01 1 11.73 0.00 0.80 0.02 87.44
00:00:01 2 18.03 0.00 2.14 0.02 79.82
00:00:01 3 8.79 0.00 0.71 0.03 90.47
...
23:50:01 all 91.97 0.00 7.99 0.04 0.00
23:50:01 0 5.44 0.00 0.56 0.00 94.00
23:50:01 1 10.39 0.00 0.63 0.00 88.98
23:50:01 2 14.01 0.00 1.39 0.00 84.59
23:50:01 3 6.28 0.00 0.56 0.01 93.15
00:00:01 all 89.01 0.00 10.74 0.25 0.00
00:00:01 0 22.50 0.00 2.02 0.07 75.41
00:00:01 1 28.76 0.00 1.94 0.07 69.23
00:00:01 2 29.03 0.00 6.91 0.06 64.00
00:00:01 3 26.19 0.00 1.99 0.10 71.72
...
23:50:01 all 90.86 0.00 9.13 0.01 0.00
23:50:01 0 18.60 0.00 1.59 0.01 79.80
23:50:01 1 33.73 0.00 1.29 0.00 64.99
23:50:01 2 29.22 0.00 6.30 0.00 64.48
23:50:01 3 26.17 0.00 1.66 0.00 72.17
Average: all 89.63 0.00 10.15 0.22 0.00
Average: 0 14.79 0.00 1.37 0.04 83.79
Average: 1 20.22 0.00 1.36 0.04 78.37
Average: 2 23.47 0.00 4.53 0.04 71.96
Average: 3 17.45 0.00 1.34 0.06 81.15


Les taux d'occupation CPU sont même différents entre chaque occurrence.

Les 2 machines font tourner des JVMs sous Jboss, le load-balancing est effectué par des serveurs indépendants faisant tourner Apache 2.2.6 et mod-jk.

Est-ce que quelqu'un aurait déjà rencontré ces symptômes ?

Merci d'avance,
Cdt.