Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 28-11-2021 14:58:32

SuShY
CA Debian-Facile
Lieu : Chartres
Distrib. : Debian Sid x86_64
Noyau : Linux > 5.19.x-x-amd64
(G)UI : i3WM - 4.20-1
Inscription : 06-01-2018
Site Web

Problèmes disques durs

Bonjour,

Depuis quelques jours je rencontre un problème avec l'un de mes disques dur, voici le détail de mes recherches.

journalctl -r -p err

nov. 28 13:39:59 DEBIAN smartd[717]: Device: /dev/nvme0, number of Error Log entries increased from 1886 to 1896



Puis j'ai poussé la recherche avec ces deux commandes :

smartctl -A /dev/nvme0

smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.15.0-2-amd64] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF SMART DATA SECTION ===
SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        30 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    2%
Data Units Read:                    19141602 [9,80 TB]
Data Units Written:                 14353620 [7,34 TB]
Host Read Commands:                 276186700
Host Write Commands:                196749661
Controller Busy Time:               793
Power Cycles:                       2419
Power On Hours:                     2029
Unsafe Shutdowns:                   66
Media and Data Integrity Errors:    0
Error Information Log Entries:      1896
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               30 Celsius
Temperature Sensor 2:               34 Celsius
 



nvme error-log /dev/nvme0

Error Log Entries for device:nvme0 entries:64
 Entry[60]  
.................
error_count : 1836
sqid    : 0
cmdid   : 0x10
status_field  : 0x421a(FEATURE_NOT_SAVEABLE: The Feature Identifier specified does not support a saveable value)
parm_err_loc  : 0x28
lba   : 0
nsid    : 0
vs    : 0
trtype    : The transport type is not indicated or the error is not transport related.
cs    : 0
trtype_spec_info: 0
.................
 Entry[61]  
.................
error_count : 1835
sqid    : 0
cmdid   : 0x101a
status_field  : 0x4004(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field)
parm_err_loc  : 0xffff
lba   : 0
nsid    : 0
vs    : 0
trtype    : The transport type is not indicated or the error is not transport related.
cs    : 0
trtype_spec_info: 0
.................
 Entry[62]  
.................
error_count : 1834
sqid    : 0
cmdid   : 0x10
status_field  : 0x421a(FEATURE_NOT_SAVEABLE: The Feature Identifier specified does not support a saveable value)
parm_err_loc  : 0x28
lba   : 0
nsid    : 0
vs    : 0
trtype    : The transport type is not indicated or the error is not transport related.
cs    : 0
trtype_spec_info: 0
.................
 Entry[63]  
.................
error_count : 1833
sqid    : 0
cmdid   : 0x100e
status_field  : 0x4004(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field)
parm_err_loc  : 0xffff
lba   : 0
nsid    : 0
vs    : 0
trtype    : The transport type is not indicated or the error is not transport related.
cs    : 0
 



Quelles actions dois-je effectuer pour résoudre ce problème ?

En ligne

#2 28-11-2021 15:06:42

raleur
Membre
Inscription : 03-10-2014

Re : Problèmes disques durs

C'est un SSD, pas un disque dur. Titre et corps du message à corriger.

Il vaut mieux montrer que raconter.

Hors ligne

#3 28-11-2021 15:19:48

robert2a
Membre
Distrib. : Buster 10 version 10.11
Noyau : kernel buster backports
(G)UI : Mate
Inscription : 15-11-2014

Re : Problèmes disques durs

Bonjour
désinstalle smartmontools ou interdit lui de surveiller ce nvme et tu n'aura plus d'erreurs ou désactive "smartd"
a priori ça fait un moment que ça dure , de mémoire l'erreur est a chaque démarrage de la machine
bref tu n'est pas le seul , et de plus cela n'arrive pas avec tous les nvme (je sais pas la marque de ton ssd )

Machines : kabylake I7 7700 , AMD 1700(X) ,AMD threadripper gen1 , AMD Raven R3 2200G , AMD FX(tm)-8320

Hors ligne

#4 28-11-2021 15:22:15

SuShY
CA Debian-Facile
Lieu : Chartres
Distrib. : Debian Sid x86_64
Noyau : Linux > 5.19.x-x-amd64
(G)UI : i3WM - 4.20-1
Inscription : 06-01-2018
Site Web

Re : Problèmes disques durs

Hello robert2a,

Pour arrêter de le surveiller, ce n'est pas nécessaire pour les nmve ?
Oui l'erreur est bien à chaque démarrage de la machine.
Il y a d'autres cas du coup ?
La marque de mon nvme est SAMSUNG.

En ligne

#5 28-11-2021 15:25:52

raleur
Membre
Inscription : 03-10-2014

Re : Problèmes disques durs

robert2a a écrit :

désinstalle smartmontools ou interdit lui de surveiller ce nvme et tu n'aura plus d'erreurs ou désactive "smartd"


Super conseil. Casser le thermomètre n'arrête pas la fièvre.


Il vaut mieux montrer que raconter.

Hors ligne

#6 28-11-2021 16:29:13

robert2a
Membre
Distrib. : Buster 10 version 10.11
Noyau : kernel buster backports
(G)UI : Mate
Inscription : 15-11-2014

Re : Problèmes disques durs

Bonjour
au lieu de critiquer donne une solution
moi j'ai choisi de supprimer smartmontools
mais j'ai lu le man et il est possible de continuer a surveiller les disques et d'ignorer un qui n'est pas géré convenablement
sinon désactiver le démon mais ça revient a ne plus surveiller les disques

smartmontools est optionnel  et pas installer par défaut sur debian

pour la fièvre c'est smarmontools qui est malade pas son nvme


Il y a d'autres cas du coup ?
La marque de mon nvme est SAMSUNG.
 


oui moi et un samsung aussi  , qui se porte a merveille   wink

=> https://debian-facile.org/viewtopic.php?id=29774

ici aussi => https://debian-facile.org/viewtopic.php?id=28053  (pour passer le fil en résolu j'ai donné comme solution changer de disque , mais ce n'est pas vrai , toujours en fonctionnement.

j'ai pris le problème au sérieux et supprimer smartmontools , fait des recherches sans trouver de solutions

remarque: cela a fonctionné quelque temps , c'est une mise a jour de smartmontools qui a fait apparaître ce bug

Dernière modification par robert2a (28-11-2021 16:37:46)


Machines : kabylake I7 7700 , AMD 1700(X) ,AMD threadripper gen1 , AMD Raven R3 2200G , AMD FX(tm)-8320

Hors ligne

#7 28-11-2021 17:10:01

SuShY
CA Debian-Facile
Lieu : Chartres
Distrib. : Debian Sid x86_64
Noyau : Linux > 5.19.x-x-amd64
(G)UI : i3WM - 4.20-1
Inscription : 06-01-2018
Site Web

Re : Problèmes disques durs

+1 pour la solution au lieu de la critique du titre et la critique non constructive !

Ok, merci pour le partage d'expérience.

Tout à fait, le BUG est présent depuis une mise à jour on dirait.

En ligne

#8 28-11-2021 19:27:04

robert2a
Membre
Distrib. : Buster 10 version 10.11
Noyau : kernel buster backports
(G)UI : Mate
Inscription : 15-11-2014

Re : Problèmes disques durs

re,
voila la bête


fdisk -l
Disque /dev/nvme0n1 : 232,89 GiB, 250059350016 octets, 488397168 secteurs
Modèle de disque : Samsung SSD 960 EVO 250GB              
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 512 octets
taille d'E/S (minimale / optimale) : 512 octets / 512 octets
Type d'
étiquette de disque : gpt
Identifiant de disque : 0CC54B91-6B9E-494B-A645-FB813C07CAE0

Périphérique       Début       Fin  Secteurs Taille Type
/dev/nvme0n1p1      2048   1050623   1048576   512M Système EFI
/dev/nvme0n1p2   1050624 472010751 470960128 224,6G Système de fichiers Linux
/dev/nvme0n1p3 472012800 488396799  16384000   7,8G Partition d'échange Linux



sur un threadripper première génération


Nom de modèle :                         AMD Ryzen Threadripper 1950X 16-Core Processor
 



si  c'est possible j' installe l'utilitaire Samsung sur un windows et je te dis si il a de la fièvre le SSD  wink
ps: mais bon a faire galère , petite vis , pas toujours accessible , a faire 3 fois , debian => win => debian   old_geek.gif

sur bullseye


journalctl -b -r -p err
-- Journal begins at Sat 2021-10-02 13:58:18 CEST, ends at Sun 2021-11-28 18:17:01 CET. --
nov. 28 18:05:01 amdtr4 pulseaudio[1282]: Error opening PCM device iec958:0: Aucun fichier ou dossier de ce type
 

Dernière modification par robert2a (28-11-2021 19:30:04)


Machines : kabylake I7 7700 , AMD 1700(X) ,AMD threadripper gen1 , AMD Raven R3 2200G , AMD FX(tm)-8320

Hors ligne

#9 28-11-2021 21:23:47

raleur
Membre
Inscription : 03-10-2014

Re : Problèmes disques durs

robert2a a écrit :

au lieu de critiquer donne une solution


Ah ? Il est interdit de critiquer une suggestion qu'on juge inappropriée si on n'a pas de solution alternative ?

robert2a a écrit :

pour la fièvre c'est smarmontools qui est malade pas son nvme


Ben voyons. Et c'est smartmontools qui invente les logs d'erreurs du SSD dont il signale l'augmentation ?
Alors peut-être que ces logs sont bidon ou bénins, mais c'est la faute du SSD, pas de smartmontools qui n'est que le messager.
Alors si tu veux une "solution", tu n'as qu'à configurer smartd de ne pas signaler l'augmentation du nombre d'erreurs si tu es sûr qu'elles sont sans importance. Mais désinstaller smartmontools, c'est prendre le risque de passer à côté d'une vraie erreur.

Voilà, c'est assez constructif à votre goût ?

Dernière modification par raleur (28-11-2021 21:25:34)


Il vaut mieux montrer que raconter.

Hors ligne

#10 29-11-2021 08:49:14

robert2a
Membre
Distrib. : Buster 10 version 10.11
Noyau : kernel buster backports
(G)UI : Mate
Inscription : 15-11-2014

Re : Problèmes disques durs

Bonjour

la commande "nvme error-log /dev/nvme0"
retour pour lui avec smartd actif
ps: Entry[63] je sais pas pourquoi , mais a priori on a la même chose


.................
 Entry[63]  
.................
error_count : 1833
sqid    : 0
cmdid   : 0x100e
status_field  : 0x4004(INVALID_FIELD: A reserved coded value or an unsupported value in a defined field)
parm_err_loc  : 0xffff
lba   : 0
nsid    : 0
vs    : 0
trtype    : The transport type is not indicated or the error is not transport related.
cs    : 0
 


retour pour moi sans smartd installé


 ................
 Entry[63]  
.................
error_count : 0
sqid    : 0
cmdid   : 0
status_field  : 0(SUCCESS: The command completed successfully)
parm_err_loc  : 0
lba   : 0
nsid    : 0
vs    : 0
trtype    : The transport type is not indicated or the error is not transport related.
cs    : 0
trtype_spec_info: 0
 


il serait bien de connaître son type de samsung , pour moi "960 EVO"
ps: pour moi c'est smartd qui génère cette erreur et pas le nvme , mais bon  roll
une question , la paramètre "error_count" est écrit dans le ssd ? (valeur 1833 pour lui)
je vais vérifier si un firmware pour ce ssd nvme (a mettre a jour) avec le logiciel Magician de samsung

toi tu laisserai dans l'état sans essayer de corriger ces messages et ses écritures ?

https://bugs.launchpad.net/ubuntu/+sour … ug/1878264
https://bugs.debian.org/cgi-bin/bugrepo … bug=900244

Dernière modification par robert2a (29-11-2021 09:08:35)


Machines : kabylake I7 7700 , AMD 1700(X) ,AMD threadripper gen1 , AMD Raven R3 2200G , AMD FX(tm)-8320

Hors ligne

#11 29-11-2021 11:14:20

raleur
Membre
Inscription : 03-10-2014

Re : Problèmes disques durs

Oui, ce log d'erreur est enregistré dans le SSD.

La commande "nvme" qui affiche le log d'erreur du SSD est indépendante du démon smartd, donc la seule possibilité que je vois pour que ces erreurs soient liées à smartd serait que smartd envoie au SSD des commandes particulières qui provoquent ces erreurs.

Moi, j'essaierais de comprendre ce que signifient ces erreurs avant de chercher à les supprimer ou les ignorer. Mais je n'a

Il vaut mieux montrer que raconter.

Hors ligne

#12 29-11-2021 11:36:13

robert2a
Membre
Distrib. : Buster 10 version 10.11
Noyau : kernel buster backports
(G)UI : Mate
Inscription : 15-11-2014

Re : Problèmes disques durs

une information importante , l'erreur et l'écriture ne se font que a chaque démarrage de la machine , l'utilisation du ssd (lecture/écriture ) ne provoque pas d'erreur.
si la machine ne redémarre pas , pas de nouvelle erreur .
donc smartd initialise une base de donnée au démarrage de tous les disques de la machine , mais aucune idée des commandes utilisées.

Machines : kabylake I7 7700 , AMD 1700(X) ,AMD threadripper gen1 , AMD Raven R3 2200G , AMD FX(tm)-8320

Hors ligne

#13 29-11-2021 13:12:43

robert2a
Membre
Distrib. : Buster 10 version 10.11
Noyau : kernel buster backports
(G)UI : Mate
Inscription : 15-11-2014

Re : Problèmes disques durs

SuShY  pourra pousser plus loin les tests , moi comme j'ai supprimer smartd plus de trace
j'ai regarder sur ma sid avec un DD ce que fait smartd


Nov 29 08:45:17 debian2 kernel: [    0.000000] Linux version 5.15.0-2-amd64 (debian-kernel@lists.debian.org)
 (gcc-11 (Debian 11.2.0-12) 11.2.0, GNU ld (GNU Binutils for Debian) 2.37) #1 SMP Debian 5.15.5-1 (2021-11-26)


Nov 29 08:45:17 debian2 smartd[505]: smartd 7.2 2020-12-30 r5155 [x86_64-linux-5.15.0-2-amd64] (local build)
Nov 29 08:45:17 debian2 smartd[505]: Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org
Nov 29 08:45:17 debian2 smartd[505]: Opened configuration file /etc/smartd.conf
Nov 29 08:45:17 debian2 smartd[505]: Drive: DEVICESCAN, implied '-a' Directive on line 21 of file /etc/smartd.conf
Nov 29 08:45:17 debian2 smartd[505]: Configuration file /etc/smartd.conf was parsed, found DEVICESCAN, scanning devices
Nov 29 08:45:17 debian2 smartd[505]: Device: /dev/sda, type changed from 'scsi' to 'sat'
Nov 29 08:45:17 debian2 smartd[505]: Device: /dev/sda [SAT], opened
Nov 29 08:45:18 debian2 smartd[505]: Device: /dev/sda [SAT], is SMART capable. Adding to "monitor" list.
Nov 29 08:45:18 debian2 smartd[505]: Device: /dev/sda [SAT], state read from /var/lib/smartmontools/smartd.ST3200827AS-5ND4AJPE.ata.state
Nov 29 08:45:18 debian2 smartd[505]: Monitoring 1 ATA/SATA, 0 SCSI/SAS and 0 NVMe devices

                        smartd[505]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 67 to 66
Nov 29 08:45:18 debian2 smartd[505]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 33 to 34
Nov 29 08:45:18 debian2 smartd[505]: Device: /dev/sda [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 74 to 73
Nov 29 08:45:19 debian2 smartd[505]: Device: /dev/sda [SAT], state written to /var/lib/smartmontools/smartd.ST3200827AS-5ND4AJPE.ata.state
Nov 29 09:15:18 debian2 smartd[505]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 66 to 67
Nov 29 09:15:18 debian2 smartd[505]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 34 to 33
Nov 29 09:15:18 debian2 smartd[505]: Device: /dev/sda [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 73 to 71
 



le dossier /var/lib/smarmontools/   contient un dossier "drivedb et des logs ".cvs" et ".state"
ps: je pense pas que la version de sid de smartmontools est résolu ce souci mais pas testé

dans /etc/smartd.conf la seule ligne active par défaut


DEVICESCAN -d removable -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
 


pour scanner tous les disques du système


Machines : kabylake I7 7700 , AMD 1700(X) ,AMD threadripper gen1 , AMD Raven R3 2200G , AMD FX(tm)-8320

Hors ligne

#14 29-11-2021 19:53:26

robert2a
Membre
Distrib. : Buster 10 version 10.11
Noyau : kernel buster backports
(G)UI : Mate
Inscription : 15-11-2014

Re : Problèmes disques durs

re,
le retour de magician (samsung) sous windows10


Model Name     Samsung SSD 960 EVO 250GB
Byte  Description Raw Data  Status
0 Critical Warning  0 OK
2:1 Temperature (K) 12b OK
3 Available Spare 64  OK
4 Available Spare Threshold a OK
5 Percentage Used 0 OK
47:32 Data Units Read 67b14 OK
63:48 Data Units Written  22714b  OK
79:64 Host Read Commands  689afa  OK
95:80 Host Write Commands eb76b1  OK
111:96  Controller Busy Time  69  OK
127:112 Power Cycles  b6  OK
143:128 Power On Hours  11a OK
159:144 Unsafe Shutdowns  39  OK
175:160 Media Errors  0 OK
191:176 Number of Error Information Log Entries 1a  OK
195:192 Warning Composite Temperature Time  0 OK
199:196 Critical Composite Temperature Time 0 OK
201:200 Temperature Sensor 1  12b OK
203:202 Temperature Sensor 2  131 OK
205:204 Temperature Sensor 3  0 OK
207:206 Temperature Sensor 4  0 OK
209:208 Temperature Sensor 5  0 OK
211:210 Temperature Sensor 6  0 OK
213:212 Temperature Sensor 7  0 OK
215:214 Temperature Sensor 8  0 OK
 



pas de test possible , aucune partition compatible
microcode a jour , déjà la version la plus récente


Machines : kabylake I7 7700 , AMD 1700(X) ,AMD threadripper gen1 , AMD Raven R3 2200G , AMD FX(tm)-8320

Hors ligne

#15 29-11-2021 22:21:46

SuShY
CA Debian-Facile
Lieu : Chartres
Distrib. : Debian Sid x86_64
Noyau : Linux > 5.19.x-x-amd64
(G)UI : i3WM - 4.20-1
Inscription : 06-01-2018
Site Web

Re : Problèmes disques durs

Hello,
Mon disque est un samsung 960 EVO.
Je vais tester sous windows aussi ton utilitaire, j'indiquerai ici les informations.

En ligne

Pied de page des forums