Bonjour,

Configuration : 10gR2 en RAC et ASM sur des serveurs SUN.

Depuis quelques jours, notre plateforme connait des ralentissements et des dysfonctionnements que je n'arrive pas à expliquer.

Pour information : Suite à un incendie dans notre bâtiment, la base a été violemment coupée électriquement malgré nos onduleurs. Après vérification, la base ne semblait pas corrompue et a été remise en production il y a 2 semaines. Elle est arrêtée et redémarrée chaque soir.

Cette coupure a été accusée de tous les maux mais j'ai pu montrer que les problèmes ne venaient pas de la base mais de traitements applicatifs.

Seulement depuis, il existe toujours des "ralentissements" voire des pertes de connexions "étonnantes".

Dans l'alert_log, les seules traces inquiétantes sont des lignes du type :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
GES: Potential blocker (pid=17381) on resource TX-000A0019-0002B660;
 enqueue info in file /BASE/bdump/bdd_lmd0_13830.trc and DIAG trace file
Extrait du fichier bdd_lmd0_13830.trc
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
*** 2011-07-26 09:36:44.564
ENQUEUE DUMP REQUEST: from 1.11489 on [0xc002e][0x1c277],[TX] for reason 2 mtype 0
DUMP LOCAL BLOCKER/HOLDER: block level 5 res [0xc002e][0x1c277],[TX]
----------resource 0x3f5ab7600----------------------
resname       : [0xc002e][0x1c277],[TX]
Local node    : 0
dir_node      : 0
master_node   : 0
hv idx        : 4
hv last r.inc : 4
current inc   : 4
hv status     : 0
hv master     : 1
open options  : dd
grant_bits    : KJUSERNL KJUSEREX
grant mode    : KJUSERNL  KJUSERCR  KJUSERCW  KJUSERPR  KJUSERPW  KJUSEREX
count         : 1         0         0         0         0         1
val_state     : KJUSERVS_NOVALUE
valblk        : 0x00000000000000000000000000000000 .
access_node   : 0
vbreq_state   : 0
state         : x0
resp          : 3f5ab7600
On Scan_q?    : N
Total accesses: 443
Imm.  accesses: 396
Granted_locks : 1
Cvting_locks  : 1
value_block:  00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
GRANTED_Q :
lp 3fcc2ad28 gl KJUSEREX rp 3f5ab7600 [0xc002e][0x1c277],[TX]
  master 0 gl owner 3fc4c3798 possible pid 17344 xid 1002-002C-00000002 bast 0 rseq 21 mseq 0 history 0x4977d495
  open opt KJUSERDEADLOCK
CONVERT_Q:
lp 3fcc2afc8 gl KJUSERNL rl KJUSEREX rp 3f5ab7600 [0xc002e][0x1c277],[TX]
  master 0 owner 1  bast 1 rseq 16 mseq 0x1 history 0x77d497ad
  convert opt KJUSERGETVALUE
----------enqueue 0x3fcc2ad28------------------------
lock version     : 5
Owner node       : 0
grant_level      : KJUSEREX
req_level        : KJUSEREX
bast_level       : KJUSERNL
notify_func      : 0
resp             : 3f5ab7600
procp            : 3fcaa7320
pid              : 13830
proc version     : 0
oprocp           : 0
opid             : 0
group lock owner : 3fc4c3798
possible pid     : 17344
xid              : 1002-002C-00000002
dd_time          : 0.0 secs
dd_count         : 0
timeout          : 0.0 secs
On_timer_q?      : N
On_dd_q?         : N
lock_state       : GRANTED
Open Options     : KJUSERDEADLOCK
Convert options  : KJUSERNOQUEUE
History          : 0x4977d495
Msg_Seq          : 0x0
res_seq          : 21
valblk           : 0x00000000000000000000000000000000 .
Potential blocker (pid=17344) on resource TX-000C002E-0001C277
DUMP LOCAL BLOCKER: initiate state dump for TIMEOUT
  possible owner[44.17344]
Submitting asynchronized dump request [28]
Et là je suis perdu
Je ne comprends pas par où poursuivre l'enquête.

Comme demandé dans d'autres posts, je vous joins un extrait d'un rapport AWR d'aujourd'hui qui correspond à une période standard d'occupation du serveur (8h à 16h)
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Load Profile
~~~~~~~~~~~~                            Per Second       Per Transaction
                                   ---------------       ---------------
                  Redo size:             46,178.68             26,575.41
              Logical reads:              3,079.20              1,772.05
              Block changes:                173.64                 99.93
             Physical reads:                 88.20                 50.76
            Physical writes:                 54.53                 31.38
                 User calls:                307.17                176.78
                     Parses:                 26.29                 15.13
                Hard parses:                 13.24                  7.62
                      Sorts:                 13.00                  7.48
                     Logons:                  0.02                  0.01
                   Executes:                242.20                139.38
               Transactions:                  1.74
 
  % Blocks changed per Read:    5.64    Recursive Call %:    27.10
 Rollback per transaction %:   67.81       Rows per Sort:   290.69
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Instance Efficiency Percentages (Target 100%)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
            Buffer Nowait %:   98.64       Redo NoWait %:   99.97
            Buffer  Hit   %:   97.72    In-memory Sort %:  100.00
            Library Hit   %:   95.82        Soft Parse %:   49.66
         Execute to Parse %:   89.14         Latch Hit %:   99.21
Parse CPU to Parse Elapsd %:   85.88     % Non-Parse CPU:   98.92
 
 Shared Pool Statistics        Begin    End
                              ------  ------
             Memory Usage %:   78.57   70.18
    % SQL with executions>1:   85.24   87.85
  % Memory for SQL w/exec>1:   88.04   88.84
 
Top 5 Timed Events                                         Avg %Total
~~~~~~~~~~~~~~~~~~                                        wait   Call
Event                                 Waits    Time (s)   (ms)   Time Wait Class
------------------------------ ------------ ----------- ------ ------ ----------
enq: TX - row lock contention       301,966     149,823    496   91.0 Applicatio
CPU time                                          7,546           4.6
db file sequential read           1,920,392       3,444      2    2.1   User I/O
gc buffer busy                    1,252,999       1,824      1    1.1    Cluster
gc current block 2-way            1,050,626         589      1    0.4    Cluster
Merci d'avance pour l'aide apportée.