Bonjour,
Configuration : 10gR2 en RAC et ASM sur des serveurs SUN.
Depuis quelques jours, notre plateforme connait des ralentissements et des dysfonctionnements que je n'arrive pas à expliquer.
Pour information : Suite à un incendie dans notre bâtiment, la base a été violemment coupée électriquement malgré nos onduleurs. Après vérification, la base ne semblait pas corrompue et a été remise en production il y a 2 semaines. Elle est arrêtée et redémarrée chaque soir.
Cette coupure a été accusée de tous les maux mais j'ai pu montrer que les problèmes ne venaient pas de la base mais de traitements applicatifs.
Seulement depuis, il existe toujours des "ralentissements" voire des pertes de connexions "étonnantes".
Dans l'alert_log, les seules traces inquiétantes sont des lignes du type :
Extrait du fichier bdd_lmd0_13830.trc
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 GES: Potential blocker (pid=17381) on resource TX-000A0019-0002B660; enqueue info in file /BASE/bdump/bdd_lmd0_13830.trc and DIAG trace file
Et là je suis perdu
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69 *** 2011-07-26 09:36:44.564 ENQUEUE DUMP REQUEST: from 1.11489 on [0xc002e][0x1c277],[TX] for reason 2 mtype 0 DUMP LOCAL BLOCKER/HOLDER: block level 5 res [0xc002e][0x1c277],[TX] ----------resource 0x3f5ab7600---------------------- resname : [0xc002e][0x1c277],[TX] Local node : 0 dir_node : 0 master_node : 0 hv idx : 4 hv last r.inc : 4 current inc : 4 hv status : 0 hv master : 1 open options : dd grant_bits : KJUSERNL KJUSEREX grant mode : KJUSERNL KJUSERCR KJUSERCW KJUSERPR KJUSERPW KJUSEREX count : 1 0 0 0 0 1 val_state : KJUSERVS_NOVALUE valblk : 0x00000000000000000000000000000000 . access_node : 0 vbreq_state : 0 state : x0 resp : 3f5ab7600 On Scan_q? : N Total accesses: 443 Imm. accesses: 396 Granted_locks : 1 Cvting_locks : 1 value_block: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 GRANTED_Q : lp 3fcc2ad28 gl KJUSEREX rp 3f5ab7600 [0xc002e][0x1c277],[TX] master 0 gl owner 3fc4c3798 possible pid 17344 xid 1002-002C-00000002 bast 0 rseq 21 mseq 0 history 0x4977d495 open opt KJUSERDEADLOCK CONVERT_Q: lp 3fcc2afc8 gl KJUSERNL rl KJUSEREX rp 3f5ab7600 [0xc002e][0x1c277],[TX] master 0 owner 1 bast 1 rseq 16 mseq 0x1 history 0x77d497ad convert opt KJUSERGETVALUE ----------enqueue 0x3fcc2ad28------------------------ lock version : 5 Owner node : 0 grant_level : KJUSEREX req_level : KJUSEREX bast_level : KJUSERNL notify_func : 0 resp : 3f5ab7600 procp : 3fcaa7320 pid : 13830 proc version : 0 oprocp : 0 opid : 0 group lock owner : 3fc4c3798 possible pid : 17344 xid : 1002-002C-00000002 dd_time : 0.0 secs dd_count : 0 timeout : 0.0 secs On_timer_q? : N On_dd_q? : N lock_state : GRANTED Open Options : KJUSERDEADLOCK Convert options : KJUSERNOQUEUE History : 0x4977d495 Msg_Seq : 0x0 res_seq : 21 valblk : 0x00000000000000000000000000000000 . Potential blocker (pid=17344) on resource TX-000C002E-0001C277 DUMP LOCAL BLOCKER: initiate state dump for TIMEOUT possible owner[44.17344] Submitting asynchronized dump request [28]
Je ne comprends pas par où poursuivre l'enquête.
Comme demandé dans d'autres posts, je vous joins un extrait d'un rapport AWR d'aujourd'hui qui correspond à une période standard d'occupation du serveur (8h à 16h)
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 Load Profile ~~~~~~~~~~~~ Per Second Per Transaction --------------- --------------- Redo size: 46,178.68 26,575.41 Logical reads: 3,079.20 1,772.05 Block changes: 173.64 99.93 Physical reads: 88.20 50.76 Physical writes: 54.53 31.38 User calls: 307.17 176.78 Parses: 26.29 15.13 Hard parses: 13.24 7.62 Sorts: 13.00 7.48 Logons: 0.02 0.01 Executes: 242.20 139.38 Transactions: 1.74 % Blocks changed per Read: 5.64 Recursive Call %: 27.10 Rollback per transaction %: 67.81 Rows per Sort: 290.69Merci d'avance pour l'aide apportée.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 Instance Efficiency Percentages (Target 100%) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Buffer Nowait %: 98.64 Redo NoWait %: 99.97 Buffer Hit %: 97.72 In-memory Sort %: 100.00 Library Hit %: 95.82 Soft Parse %: 49.66 Execute to Parse %: 89.14 Latch Hit %: 99.21 Parse CPU to Parse Elapsd %: 85.88 % Non-Parse CPU: 98.92 Shared Pool Statistics Begin End ------ ------ Memory Usage %: 78.57 70.18 % SQL with executions>1: 85.24 87.85 % Memory for SQL w/exec>1: 88.04 88.84 Top 5 Timed Events Avg %Total ~~~~~~~~~~~~~~~~~~ wait Call Event Waits Time (s) (ms) Time Wait Class ------------------------------ ------------ ----------- ------ ------ ---------- enq: TX - row lock contention 301,966 149,823 496 91.0 Applicatio CPU time 7,546 4.6 db file sequential read 1,920,392 3,444 2 2.1 User I/O gc buffer busy 1,252,999 1,824 1 1.1 Cluster gc current block 2-way 1,050,626 589 1 0.4 Cluster
Partager