Bonjour à tous !
Je me permets de solliciter votre aide pour un PC acheté récemment avec lequel j'ai rencontré pas mal de problèmes. J'ai déjà contacté par mail le SAV du site sur lequel j'ai acheté les composants mais vu le contexte actuel, je pense qu'ils auront du mal à répondre rapidement (ce qui est compréhensible). Aussi, j'ai fait quelques tests complémentaires depuis mon mail donc je me suis dit que j'allais tenter de trouver des pistes avec vous si vous le voulez bien ! Je suis désolé, ce sera un peu long mais je préfère en mettre trop que pas assez.
Mon souci peut se résumer ainsi. Depuis que tout a été monté, le PC tourne relativement bien. Je peux jouer des heures avec tous les paramètres au max sans que le PC plante, idem avec des logiciels nécessitant beaucoup de calculs (logiciels de 3D par exemple...). Mais le PC plante aussi, plus ou moins fréquemment selon les jours, que ce soit en activité poussée (jeu, logiciel de 3D...) ou en activité "légère" comme de la navigation internet.
Problème :
Concrètement il s'agit de BSOD divers (je n'ai plus tous les crashdump mais les derniers pointent presque tous un même problème), le PC qui se freeze complètement, qui s'éteint, qui redémarre ou encore les périphériques qui s'éteignent (écran, clavier, souris etc. - d'ailleurs ce problème a de nouveau eu lieu pendant que j'étais en train de vous écrire) alors que le PC semble tourner normalement, voire parfois à pleine balle. Par contre, il démarre sans souci et hormis ces problèmes, tout tourne bien, rapidement et j'ai rarement eu des messages d'erreurs (quelques uns en jeu - messages classiques relatifs à DirectX). La seule lenteur que j'ai pu constater, c'est au moment d'accéder au menu Système des Paramètres de Windows.
Avant d'aller plus loin, je vous présente la config :
OS : Windows 10
CPU : AMD Ryzen 7 2700x avec le ventirad d'origine
GPU : Gigabyte GeForce RTX 2070 super windforce OC 3X 8G
RAM : DDR4 Cruciable Ballistix White (2x16GO) 2666 MHz CAS 16
SSD : Crucial MX500 250GO
HDD : Seagate Barracuda 1 To
Carte wifi : Asus PCE-AC51
CM : Asus TUF B450 PLUS GAMING (Bios à jour)
Alim : Corsair CV650
Je n'ai pas cherché à overclocker quoi que ce soit. La CG l'est d'office. J'ai juste activé le profil DOCP de la RAM dans le Bios (les problèmes existaient déjà avec l'activation du profil docp).
Le cablage a l'air ok, chaque composant est à sa place et est détecté normalement et la RAM est en dual channel.
Pistes et recherches :
Au début, comme le PC se lançait normalement, jusque l'arrivée dans la session windows, j'ai suspecté une mauvaise installation de windows (qui a bugué lors de l'installation). J'ai donc fait une nouvelle installation mais le problème est de nouveau apparu avec peut être 5-6 BSOD par jour.
Je me suis donc penché sur les drivers installés. Un driver de chez nvidia (nvlddmkm.sys) était visé dans l'un des crashdump. Après diverses tentatives de réparation, j'ai désinstallé les drivers Nvidia avec DDU puis fait une nouvelle installation sans installer GeForce experience qui semble être source de nombreux problèmes. Problème non résolu (j'ai tenté des stress test, peut être trop courts, avec OCCT qui n'ont rien donné).
Après plusieurs nouvelles installations de windows et autres recherches de solution, j'ai lancé le vérificateur de drivers de windows. 2-3 minutes après l'ouverture de la session, le vérificateur de drivers poussait le PC à redémarrer. J'ai testé les drivers un à un pour trouver celui qui posait problème ce qui m'a conduit à désinstaller le driver logitech de mon clavier. Le vérificateur a cessé de faire redémarrer mon PC mais les problèmes de BSOD et autres plantages n'ont pas cessé.
En lançant des commandes comme sfc /scannow chkdsk, des erreurs ont été détectées et corrigées. Un test sur Memtest86+ n'a rien détecté mais peut être que je l'ai arrêté trop tôt.
Pour repartir sur des bases saines pour la recherche de bugs, j'ai réinstallé Windows (ca fait beaucoup et je ne sais pas si c'est une bonne idée ^^). Sans surprise, les problèmes sont toujours présents depuis ce jour.
CrystalDiskInfo m'indique que l'état de mon SSD et de disc dur est correct. La température du SSD est aux alentours de 34-38°C et le HDD reste bloqué à 29 °C.
Pendant une utilisation basique, la température du CPU est entre 35° et 50° et sur une utilisation intensive (stress test), il monte rapidement à 65° puis bien plus lentement aux environs de 80° (je le stoppe dans ces eaux là de peur de le cramer même si la marge est très certainement importante à ce stade...). Les tensions oscillent à l'heure ou je vous parle entre 1, 28 et 1,42 V. Il m'est arrivé ponctuellement d'avoir une variation beaucoup plus importante qui était dû, je pense, aux paramètres d'alimentation par défaut de windows (ca s'est réglé en le réglant sur performances maximales / en utilisant les paramètre AMD Balanced).
La variation des fréquences du CPU me semble très importante. Ayant du mal à interpréter les infos d'OCCT j'ai du mal à savoir si ce que j'y vois est normal. La fréquence du premier coeur semble stable mais les autres varient énormément. Sur la capture d'écran on est sur une utilisation basique. Seul Firefox est ouvert pour rédiger ce post :
Au niveau du GPU je n'ai pas de souci de chauffe particulière. Le seul "problème" est un bruit strident / électrique qui me semble venir de l'alimentation lorsque la carte graphique monte en puissance (et non de la carte graphique elle même). Je suppose qu'il s'agit du fameux coil whine auquel on ne peut pas grand chose et qui est censé être normal.
Je ne vous joins que deux extraits de crashdump les derniers pointant tous un même problème :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135 ******************************************************************************* * * * Bugcheck Analysis * * * ******************************************************************************* IRQL_NOT_LESS_OR_EQUAL (a) An attempt was made to access a pageable (or completely invalid) address at an interrupt request level (IRQL) that is too high. This is usually caused by drivers using improper addresses. If a kernel debugger is available get the stack backtrace. Arguments: Arg1: fffff806333baee1, memory referenced Arg2: 00000000000000ff, IRQL Arg3: 0000000000000000, bitfield : bit 0 : value 0 = read operation, 1 = write operation bit 3 : value 0 = not an execute operation, 1 = execute operation (only on chips which support this level of status) Arg4: fffff806122bab4c, address which referenced memory Debugging Details: ------------------ *** WARNING: Unable to verify timestamp for win32k.sys KEY_VALUES_STRING: 1 Key : Analysis.CPU.Sec Value: 3 Key : Analysis.DebugAnalysisProvider.CPP Value: Create: 8007007e on PC Key : Analysis.DebugData Value: CreateObject Key : Analysis.DebugModel Value: CreateObject Key : Analysis.Elapsed.Sec Value: 4 Key : Analysis.Memory.CommitPeak.Mb Value: 76 Key : Analysis.System Value: CreateObject BUGCHECK_CODE: a BUGCHECK_P1: fffff806333baee1 BUGCHECK_P2: ff BUGCHECK_P3: 0 BUGCHECK_P4: fffff806122bab4c READ_ADDRESS: fffff80611d733b8: Unable to get MiVisibleState Unable to get NonPagedPoolStart Unable to get NonPagedPoolEnd Unable to get PagedPoolStart Unable to get PagedPoolEnd fffff80611c2a3d8: Unable to get Flags value from nt!KdVersionBlock fffff80611c2a3d8: Unable to get Flags value from nt!KdVersionBlock unable to get nt!MmSpecialPagesInUse fffff806333baee1 BLACKBOXBSD: 1 (!blackboxbsd) BLACKBOXNTFS: 1 (!blackboxntfs) BLACKBOXPNP: 1 (!blackboxpnp) BLACKBOXWINLOGON: 1 CUSTOMER_CRASH_COUNT: 1 PROCESS_NAME: System TRAP_FRAME: fffff80614467580 -- (.trap 0xfffff80614467580) NOTE: The trap frame does not contain all registers. Some register values may be zeroed or incorrect. rax=fffff806333baf54 rbx=0000000000000000 rcx=0000000000000000 rdx=00000000000057c4 rsi=0000000000000000 rdi=0000000000000000 rip=fffff806122bab4c rsp=fffff80614467710 rbp=0000004bd42f9b9b r8=000000000000f605 r9=01d63e7b40ada294 r10=0000fffff806122b r11=ffff76ffc5000000 r12=0000000000000000 r13=0000000000000000 r14=0000000000000000 r15=0000000000000000 iopl=0 nv up di ng nz na pe nc hal!HalpTimerOnlyClockInterruptPending+0xc: fffff806`122bab4c db488d fisttp dword ptr [rax-73h] ds:fffff806`333baee1=???????? Resetting default scope MISALIGNED_IP: hal!HalpTimerOnlyClockInterruptPending+c fffff806`122bab4c db488d fisttp dword ptr [rax-73h] STACK_TEXT: fffff806`14467438 fffff806`119d41e9 : 00000000`0000000a fffff806`333baee1 00000000`000000ff 00000000`00000000 : nt!KeBugCheckEx fffff806`14467440 fffff806`119d0529 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiBugCheckDispatch+0x69 fffff806`14467580 fffff806`122bab4c : fffff806`14467790 00000000`00989680 fffff806`14467778 fffff780`00000340 : nt!KiPageFault+0x469 fffff806`14467710 fffff806`118bca6e : 00000000`000057c4 fffff806`0cbf3180 00000000`00000000 00000000`00000000 : hal!HalpTimerOnlyClockInterruptPending+0xc fffff806`14467740 fffff806`118bb838 : 00000cb6`80c629ae 00000cb6`80c629ae ffffc50b`4a554010 00000000`00000000 : nt!KeResumeClockTimerFromIdle+0x15e fffff806`144677e0 fffff806`118badde : 00000000`00000003 00000000`00000002 ffffc50b`4a554100 00000000`00000008 : nt!PpmIdleExecuteTransition+0x8b8 fffff806`14467b00 fffff806`119c5e84 : 00000000`00000000 fffff806`0cbf3180 ffffc50b`53e10080 00000000`00000378 : nt!PoIdle+0x36e fffff806`14467c60 00000000`00000000 : fffff806`14468000 fffff806`14462000 00000000`00000000 00000000`00000000 : nt!KiIdleLoop+0x44 SYMBOL_NAME: nt!KiPageFault+469 IMAGE_NAME: hardware IMAGE_VERSION: 10.0.18362.836 STACK_COMMAND: .thread ; .cxr ; kb MODULE_NAME: hardware FAILURE_BUCKET_ID: IP_MISALIGNED OS_VERSION: 10.0.18362.1 BUILDLAB_STR: 19h1_release OSPLATFORM_TYPE: x64 OSNAME: Windows 10 FAILURE_ID_HASH: {201b0e5d-db2a-63d2-77be-8ce8ff234750} Followup: MachineOwnerHormis celui mentionnant un MODULE_NAME hardware, les 5 autres minidump enregistrés depuis la dernière installation sont semblables au dernier extrait ci-dessus (memory corruption).
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129 ******************************************************************************* * * * Bugcheck Analysis * * * ******************************************************************************* IRQL_NOT_LESS_OR_EQUAL (a) An attempt was made to access a pageable (or completely invalid) address at an interrupt request level (IRQL) that is too high. This is usually caused by drivers using improper addresses. If a kernel debugger is available get the stack backtrace. Arguments: Arg1: 000025020824c6d0, memory referenced Arg2: 0000000000000002, IRQL Arg3: 0000000000000000, bitfield : bit 0 : value 0 = read operation, 1 = write operation bit 3 : value 0 = not an execute operation, 1 = execute operation (only on chips which support this level of status) Arg4: fffff80642edd2db, address which referenced memory Debugging Details: ------------------ *** WARNING: Unable to verify timestamp for win32k.sys KEY_VALUES_STRING: 1 Key : Analysis.CPU.Sec Value: 3 Key : Analysis.DebugAnalysisProvider.CPP Value: Create: 8007007e on PC Key : Analysis.DebugData Value: CreateObject Key : Analysis.DebugModel Value: CreateObject Key : Analysis.Elapsed.Sec Value: 3 Key : Analysis.Memory.CommitPeak.Mb Value: 75 Key : Analysis.System Value: CreateObject BUGCHECK_CODE: a BUGCHECK_P1: 25020824c6d0 BUGCHECK_P2: 2 BUGCHECK_P3: 0 BUGCHECK_P4: fffff80642edd2db READ_ADDRESS: fffff806433733b8: Unable to get MiVisibleState Unable to get NonPagedPoolStart Unable to get NonPagedPoolEnd Unable to get PagedPoolStart Unable to get PagedPoolEnd fffff8064322a3d8: Unable to get Flags value from nt!KdVersionBlock fffff8064322a3d8: Unable to get Flags value from nt!KdVersionBlock unable to get nt!MmSpecialPagesInUse 000025020824c6d0 BLACKBOXBSD: 1 (!blackboxbsd) BLACKBOXNTFS: 1 (!blackboxntfs) BLACKBOXWINLOGON: 1 CUSTOMER_CRASH_COUNT: 1 PROCESS_NAME: System TRAP_FRAME: ffffb58aaf4df550 -- (.trap 0xffffb58aaf4df550) NOTE: The trap frame does not contain all registers. Some register values may be zeroed or incorrect. rax=0000000000000000 rbx=0000000000000000 rcx=ffff9d8004b78210 rdx=0000000000000000 rsi=0000000000000000 rdi=0000000000000000 rip=fffff80642edd2db rsp=ffffb58aaf4df6e0 rbp=7fffffffffffffff r8=0000000100000082 r9=fffff80642e00000 r10=fffff8063eb93180 r11=ffffb58aaf4df518 r12=0000000000000000 r13=0000000000000000 r14=0000000000000000 r15=0000000000000000 iopl=0 nv up ei pl nz ac pe nc nt!MiGatherMappedPages+0x117: fffff806`42edd2db 488b2f mov rbp,qword ptr [rdi] ds:00000000`00000000=???????????????? Resetting default scope STACK_TEXT: ffffb58a`af4df408 fffff806`42fd41e9 : 00000000`0000000a 00002502`0824c6d0 00000000`00000002 00000000`00000000 : nt!KeBugCheckEx ffffb58a`af4df410 fffff806`42fd0529 : 00000000`00000000 fffff806`4338f240 00000000`00000000 00000000`00000000 : nt!KiBugCheckDispatch+0x69 ffffb58a`af4df550 fffff806`42edd2db : 00000000`00000000 00000000`00000000 fffff806`4317a260 00000000`00000002 : nt!KiPageFault+0x469 ffffb58a`af4df6e0 fffff806`42f8ba5d : fffff806`4326a440 ffffa501`f8ec3080 fffff806`4326a440 00000000`00000005 : nt!MiGatherMappedPages+0x117 ffffb58a`af4df7b0 fffff806`42e6bcd5 : ffffa501`f8ec3080 ffffa501`f8ec3080 00000000`00000080 00000067`b4bbbdff : nt!MiMappedPageWriter+0x17d ffffb58a`af4dfc10 fffff806`42fc9998 : ffffdf01`92161180 ffffa501`f8ec3080 fffff806`42e6bc80 00000000`00000000 : nt!PspSystemThreadStartup+0x55 ffffb58a`af4dfc60 00000000`00000000 : ffffb58a`af4e0000 ffffb58a`af4da000 00000000`00000000 00000000`00000000 : nt!KiStartSystemThread+0x28 SYMBOL_NAME: nt!MiGatherMappedPages+117 MODULE_NAME: nt IMAGE_VERSION: 10.0.18362.836 STACK_COMMAND: .thread ; .cxr ; kb IMAGE_NAME: memory_corruption BUCKET_ID_FUNC_OFFSET: 117 FAILURE_BUCKET_ID: AV_nt!MiGatherMappedPages OS_VERSION: 10.0.18362.1 BUILDLAB_STR: 19h1_release OSPLATFORM_TYPE: x64 OSNAME: Windows 10 FAILURE_ID_HASH: {992c5d81-09db-e3e5-0551-a9cd2054a139} Followup: MachineOwner
Là encore, je n'y comprends pas grand chose (vous l'aurez compris) mais hardware + memory_corruption, je me suis dit que j'allais relancer un test de la mémoire avec Memtest86+. Je l'ai donc fait en utilisant tous les coeurs / threads (touche F2 au lancement de Memtest86+).
Lors du premier essai, plus de 140 erreurs sont apparues au début de la deuxième bout(au bout de 3-4h environ). Le deuxième essai a permis de mettre en évidence plus de 400 erreurs et beaucoup plus vite (peut être au bout de 10-15 minutes). Les essais qui on suivi on également fait apparaitre un grand nombre d'erreurs très rapidement (je n'ai pas poussé les tests jusqu'à leur terme - c'est très long et je sais qu'il y a beaucoup d'erreurs). Je vous mets une image de ces problèmes au cas où (cet exemple est survenu après désactivation du profil DOCP) :
J'ai fait les tests suivants :
- Les deux barrettes de ram sur les DIMM A et B en respectant la correspondance de chacun
- Barrette de RAM 1 sur les DIMM A1 et B1 (pour la forme sur le B2 mais ca ne bootait pas ce qui je crois est normal)
- Barrette de RAM 2 sur les DIMM A1 et B1
Dans chacune de ces configurations un nombre important d'erreurs a été détecté par Memtest86+. Malheureusement, je n'ai pas d'autre barrette de RAM pour tester mais il me semble peu probable que les deux barrettes d'un même lot aient un souci.
Voilà où j'en suis aujourd'hui... Le problème est peut être tout bête mais je n'ai pas la réponse. Je pense que vous aurez des idées bien plus précises que moi sur le sujet.
Je m'interroge sur l'origine du problème. J'aurais tendance à penser que le problème est matériel mais quelque chose m'échappe peut être. Problème avec la RAM, le CPU, la CM, autre chose ? Le fait que parfois le PC "éteigne" l'ensemble des périphériques après un court freeze n'est il pas un indice d'un problème avec le CPU ou la carte mère ? Idem pour les erreurs sur les deux barrettes de RAM ? Une incompatibilité quelconque ? Si vous avez des idées ou des informations sur des tests / vérifications à mener je suis preneur. J'ai tenté pas mal de trucs trouvés sur le net mais il y a peut être d'autres pistes.
Je vous remercie par avance pour votre aide !
Bonne soirée![]()
Partager