Debian Debian-France Debian-Facile Debian-fr.org Debian-fr.xyz Debian ? Communautés

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 06-05-2020 05:57:40

Micka260
Membre
Inscription : 12-07-2018

smartctl analyse des résultats.

Bonjour,

J'aurai besoin de votre aide sur l'analyse des résultats de mon smartctl.
J'ai bien cru comprendre qu'il était pas jolie car il y a des erreurs, mais j'ai du mal à comprendre les erreurs.

#

smartctl -a /dev/sda


smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-8-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 3.5
Device Model:     ST4000DM005-2DP166
Serial Number:    ZDH1L5H1
LU WWN Device Id: 5 000c50 0a2eee656
Firmware Version: 0001
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5980 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Wed May  6 06:56:49 2020 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
          was completed without error.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
          without error or no self-test has ever
          been run.
Total time to complete Offline
data collection:    (  601) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    ( 669) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.
SCT capabilities:          (0x10a5) SCT Status supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   080   064   006    Pre-fail  Always       -       102574208
  3 Spin_Up_Time            0x0003   095   094   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   097   097   020    Old_age   Always       -       3275
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   085   060   045    Pre-fail  Always       -       336228130
  9 Power_On_Hours          0x0032   073   073   000    Old_age   Always       -       23958 (192 243 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       308
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   096   096   000    Old_age   Always       -       4
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0 0 0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   075   052   040    Old_age   Always       -       25 (Min/Max 23/29)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   099   099   000    Old_age   Always       -       3794
193 Load_Cycle_Count        0x0032   077   077   000    Old_age   Always       -       46408
194 Temperature_Celsius     0x0022   025   048   000    Old_age   Always       -       25 (0 17 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       21028h+48m+00.039s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       62759672438
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       114782897125

SMART Error Log Version: 1
ATA Error Count: 4
  CR = Command Register [HEX]
  FR = Features Register [HEX]
  SC = Sector Count Register [HEX]
  SN = Sector Number Register [HEX]
  CL = Cylinder Low Register [HEX]
  CH = Cylinder High Register [HEX]
  DH = Device/Head Register [HEX]
  DC = Device Command Register [HEX]
  ER = Error register [HEX]
  ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 4 occurred at disk power-on lifetime: 18830 hours (784 days + 14 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 53 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 00 ff ff ff 4f 00   9d+08:02:45.649  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00   9d+08:02:43.016  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00   9d+08:02:43.015  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00   9d+08:02:43.008  READ FPDMA QUEUED
  60 00 20 ff ff ff 4f 00   9d+08:02:43.008  READ FPDMA QUEUED

Error 3 occurred at disk power-on lifetime: 18613 hours (775 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 53 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 e0 20 bc 30 40 00      06:18:22.488  READ FPDMA QUEUED
  60 00 18 20 48 31 40 00      06:18:22.484  READ FPDMA QUEUED
  60 00 00 00 25 31 40 00      06:18:22.484  READ FPDMA QUEUED
  60 00 30 ff ff ff 4f 00      06:18:22.483  READ FPDMA QUEUED
  60 00 08 00 f6 45 40 00      06:18:22.483  READ FPDMA QUEUED

Error 2 occurred at disk power-on lifetime: 18541 hours (772 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 53 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 80 08 10 42 00  47d+00:06:50.030  READ FPDMA QUEUED
  60 00 20 00 fa 30 40 00  47d+00:06:47.374  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00  47d+00:06:47.373  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00  47d+00:06:47.368  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  47d+00:06:47.355  READ FPDMA QUEUED

Error 1 occurred at disk power-on lifetime: 18493 hours (770 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 53 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00  44d+23:53:44.522  READ FPDMA QUEUED
  60 00 10 ff ff ff 4f 00  44d+23:53:44.516  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00  44d+23:53:44.512  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00  44d+23:53:44.507  READ FPDMA QUEUED
  60 00 20 ff ff ff 4f 00  44d+23:53:44.507  READ FPDMA QUEUED

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      9203         -
# 2  Extended offline    Completed without error       00%      7365         -
# 3  Extended offline    Interrupted (host reset)      00%       422         -
# 4  Extended offline    Completed without error       00%       245         -
# 5  Extended offline    Interrupted (host reset)      00%        87         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 



Merci pour votre aide smile

Edit à toto : Pour que la lecture du code sur le forum soit lisible par tous, il faut bien disposer chaque commande hors de son retour. Modif fête. smile
Oh, quel beau BB …code où comment mettre en forme vos messages dans le fofo

Hors ligne

#2 06-05-2020 06:22:11

smolski
quasi...modo
Lieu : AIN
Distrib. : backports (buster) 10
Noyau : Linux 4.19.0-8-amd64
(G)UI : gnome
Inscription : 21-10-2008

Re : smartctl analyse des résultats.

Nous avons une page de tuto concernant l'usage et l'interprétation de smartctl :
https://debian-facile.org/doc:systeme:smartmontools

Force et courage

"Théo et Adama te rappellent pourquoi Zyed et Bouna couraient…"
"L'utopie ne signifie pas l'irréalisable, mais l'irréalisée." - T Monod (source :  La zone de Siné)
"Je peux rire de tout mais pas avec n'importe qui." - P Desproges
"saque eud dun" (patois chtimi : fonce dedans)

En ligne

#3 07-05-2020 06:03:33

Micka260
Membre
Inscription : 12-07-2018

Re : smartctl analyse des résultats.

Merci pour ta réponse, j'ai passé la soirée a lire, décortiqué, et essayé de comprendre ... mais je confirme je vais avoir besoin d'aide ...

Hors ligne

#4 07-05-2020 06:40:14

smolski
quasi...modo
Lieu : AIN
Distrib. : backports (buster) 10
Noyau : Linux 4.19.0-8-amd64
(G)UI : gnome
Inscription : 21-10-2008

Re : smartctl analyse des résultats.

C'est cette partie qu'il faut d'abord analyser pour VALUE WORST TRESH TYPE :

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   080   064   006    Pre-fail  Always       -       102574208
  3 Spin_Up_Time            0x0003   095   094   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   097   097   020    Old_age   Always       -       3275
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   085   060   045    Pre-fail  Always       -       336228130
  9 Power_On_Hours          0x0032   073   073   000    Old_age   Always       -       23958 (192 243 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       308
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   096   096   000    Old_age   Always       -       4
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0 0 0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   075   052   040    Old_age   Always       -       25 (Min/Max 23/29)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   099   099   000    Old_age   Always       -       3794
193 Load_Cycle_Count        0x0032   077   077   000    Old_age   Always       -       46408
194 Temperature_Celsius     0x0022   025   048   000    Old_age   Always       -       25 (0 17 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       21028h+48m+00.039s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       62759672438
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       114782897125


À lire d'après :
https://debian-facile.org/doc:systeme:s … es-valeurs

À l'aide du tableau :
https://debian-facile.org/doc:systeme:s … buts-smart

Indique clairement et point à point sur le forum sur quoi tu achoppes, avec ton aide nous améliorerons le tuto en conséquence. smile

Force et courage

Dernière modification par smolski (07-05-2020 06:52:49)


"Théo et Adama te rappellent pourquoi Zyed et Bouna couraient…"
"L'utopie ne signifie pas l'irréalisable, mais l'irréalisée." - T Monod (source :  La zone de Siné)
"Je peux rire de tout mais pas avec n'importe qui." - P Desproges
"saque eud dun" (patois chtimi : fonce dedans)

En ligne

#5 08-05-2020 16:33:45

Micka260
Membre
Inscription : 12-07-2018

Re : smartctl analyse des résultats.

Oui, le tuto ligne a ligne est plutôt bien fait wink j'ai un descriptif de chaque ligne ... mais je ne sais pas vraiment a quoi elles servent ... qu'est ce qui est grave et pas grave, dois-je m'inquiéter ou est-ce des erreurs bénigne ?
Je vois qu'il y a eu plusieurs erreur, mais aucun secteur réaffecté ... c'est dans ce sens que j'ai besoin de votre aide ... l'interprétation des résultats n'est pas claire ... peace_flag.gif

Par exemple je vois qu'il y a 336228130 erreur dans le positionnement de la tête de lecteur, c'est beaucoup ou non ? On ne sais pas vraiment ou est l'attendu, et quand on sort de l'attendu a partir de quand c'est inquiétant ...

Hors ligne

#6 08-05-2020 20:35:16

raleur
Membre
Inscription : 03-10-2014

Re : smartctl analyse des résultats.

Micka260 a écrit :

Je vois qu'il y a eu plusieurs erreur, mais aucun secteur réaffecté


En effet, on voit plusieurs erreurs de lecture sur un même secteur dans les logs. Les auto-tests sont antérieurs donc leur résultat n'est pas pertinent. Par contre il n'y a aucun secteur marqué reallocated, pending ou uncorrectable, donc soit il a été réparé sur place à l'occasion d'une écriture, soit le firmware ne rapporte pas son état correctement. Il faudrait lancer un autotest hors ligne étendu (offline extended self-test).


Il vaut mieux montrer que raconter.

Hors ligne

#7 09-05-2020 00:25:30

Micka260
Membre
Inscription : 12-07-2018

Re : smartctl analyse des résultats.

raleur a écrit :

sur un même secteur dans les logs. Les auto-tests sont antérieurs donc leur résultat n'est pas pertinent. Par contre il n'y a aucun secteur marqué reallocated, pending ou uncorrectable, donc soit il a été réparé sur place à l'occasion d'une écriture, soit le firmware ne rapporte pas son état correctement. Il faudrait lancer un autotest hors ligne étendu (offline extended self-test).



Sur un même secteur ? Comment as tu interprété cela ?
Quand tu dis que les auto-tests son antérieurs tu parles de quoi précisément ? (désolé j'essais de comprendre dans le détail ...)

Oui j'ai bien vu qu'il n'y avait aucun secteur reallocated, pending ou uncorrectable, ce qui est plutôt bon signe je suppose smile

Quand tu dis qu'il est réparé sur place à l'occasion d'une écriture c'est à dire ? Et que veux dire que le firmware ne rapporte pas son état correctement ?

Merci pour tout les conseils en tout cas smile je vais tenter de faire des recherches du coté : "offline extended self-test"

Hors ligne

#8 09-05-2020 00:37:09

Micka260
Membre
Inscription : 12-07-2018

Re : smartctl analyse des résultats.

Je viens de trouver comment faire le test hors ligne.

smartctl -t long /dev/sda


smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-8-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 669 minutes for test to complete.
Test will complete after Sat May  9 12:43:21 2020

Use smartctl -X to abort test.
 



Prochain épisode demain alors !
Concrètement il se passe quoi réellement sur le disque lorsque je fais ceci :

smartctl -t long /dev/sda



Edit à toto : Pour que la lecture du code sur le forum soit lisible par tous, il faut bien disposer chaque commande hors de son retour. Modif fête. smile
Oh, quel beau BB …code où comment mettre en forme vos messages dans le fofo

Hors ligne

#9 09-05-2020 09:09:37

raleur
Membre
Inscription : 03-10-2014

Re : smartctl analyse des résultats.

Micka260 a écrit :

Sur un même secteur ? Comment as tu interprété cela ?


Tous les logs contiennent le même numéro de secteur.

  40 53 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455


UNC = uncorrectable = erreur de lecture impossible à corriger (trop de bits en erreur pour le code correcteur)
LBA = adresse logique du secteur

Ceci dit, à regarder de plus près la valeur en hexadécimal (0x0fffffff), il est louche, ce numéro de secteur. Il a les 28 bits de poids faible à 1, ce qui correspond au numéro de secteur maximum adressable en LBA32 (28 bits utiles). Or un disque de plus de 128 Gio (137 Go) avec des secteurs logiques de 512 octets comme celui-ci doit utiliser l'adressage LBA48 (48 bits), et je ne crois pas aux coïncidences. Si c'est une limitation du format des logs SMART, cette valeur n'est pas pertinente.

Micka260 a écrit :

Quand tu dis que les auto-tests son antérieurs tu parles de quoi précisément ?


Le plus ancien log d'erreur s'est produit à 18493 heures de fonctionnement :

Error 1 occurred at disk power-on lifetime: 18493 hours (770 days + 13 hours)


et le plus récent auto-test s'est produit à 9203 heures de fonctionnement, donc avant :


Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      9203         -



Micka260 a écrit :

Quand tu dis qu'il est réparé sur place à l'occasion d'une écriture c'est à dire ?


Il y a deux façons de réparer un secteur défectueux :
- en ré-écrivant à l'emplacement physique courant du secteur (sur place), si c'est seulement un défaut de magnétisation (l'écriture recrée la magnétisation)
- en changeant l'emplacement physique du secteur (réallocation), si c'est un défaut de la surface magnétique.
Normalement la réallocation se voit dans les attributs SMART, pas la réécriture sur place.

Micka260 a écrit :

Et que veux dire que le firmware ne rapporte pas son état correctement ?


Il se peut que le disque ne rapporte pas correctement les valeurs des attributs reallocated, pending ou uncorrectable. J'ai eu des disques qui annonçaient des valeurs pending ou uncorrectable non nulles alors qu'un test de surface complet ne détectait aucun secteur défectueux (et vice versa).

Micka260 a écrit :

Concrètement il se passe quoi réellement sur le disque lorsque je fais ceci


Je ne connais pas tous les tests effectués, mais vu le temps il y a au moins un test en lecture de la toute la surface pour détecter d'éventuels secteurs illisibles qui devraient apparaître dans l'attribut "offline uncorrectable" (à la différence des secteurs défectueux détectés lors d'un accès par le système hôte qui sont comptés dans l'attribut "pending").


Il vaut mieux montrer que raconter.

Hors ligne

#10 09-05-2020 10:02:13

Micka260
Membre
Inscription : 12-07-2018

Re : smartctl analyse des résultats.

Ah oui en effet d'après ton expertise c'est vraiment très bizarre ... Il ne doit pas y avoir grand chose de défectueux alors.

raleur a écrit :

Ceci dit, à regarder de plus près la valeur en hexadécimal (0x0fffffff), il est louche, ce numéro de secteur. Il a les 28 bits de poids faible à 1, ce qui correspond au numéro de secteur maximum adressable en LBA32 (28 bits utiles). Or un disque de plus de 128 Gio (137 Go) avec des secteurs logiques de 512 octets comme celui-ci doit utiliser l'adressage LBA48 (48 bits), et je ne crois pas aux coïncidences. Si c'est une limitation du format des logs SMART, cette valeur n'est pas pertinente.


La tu m'as perdu ... Tout ce que je peu te dire c'est que le disque fait 2To
En gros si je comprend bien j'ai le fameux secteur en 28 bits au lieux de 48 bits ... Qu'est ce qu'une limitation du format des lois SMART ?

raleur a écrit :

Je ne connais pas tous les tests effectués, mais vu le temps il y a au moins un test en lecture de la toute la surface pour détecter d'éventuels secteurs illisibles qui devraient apparaître dans l'attribut "offline uncorrectable" (à la différence des secteurs défectueux détectés lors d'un accès par le système hôte qui sont comptés dans l'attribut "pending").


Pour avoir le résultat après ce test je refais un

smartctl --all /dev/sda

vers 13h ?

Hors ligne

#11 09-05-2020 10:44:01

raleur
Membre
Inscription : 03-10-2014

Re : smartctl analyse des résultats.

Micka260 a écrit :

Tout ce que je peu te dire c'est que le disque fait 2To


Ah ? Pourtant smartctl annonce une capacité de 4 To.

Micka260 a écrit :

En gros si je comprend bien j'ai le fameux secteur en 28 bits au lieux de 48 bits


Disons que c'est la valeur maximum qui peut être représentée sur 28 bits, qui correspond à la taille de l'adressage LBA32.

Micka260 a écrit :

Qu'est ce qu'une limitation du format des lois SMART ?


Des logs. Extrait de la page de manuel de smartctl qui confirme mon intuition :

(Because of the limitations of the SMART error log, if the LBA is greater than 0xfffffff, then either no error log entry will be made, or the error log entry will have an incorrect LBA. This may happen for drives with a capacity greater than 128 GiB or 137 GB.)


Donc il n'est pas certain qu'il s'agit du même secteur.

Micka260 a écrit :

vers 13h ?


Tu peux commencer avant. Le test s'interrompt à la première erreur détectée.


Il vaut mieux montrer que raconter.

Hors ligne

#12 09-05-2020 10:54:58

raleur
Membre
Inscription : 03-10-2014

Re : smartctl analyse des résultats.

Je viens de voir aussi :

xerror[,NUM][,error] - [ATA only] prints the Extended Comprehensive SMART error log (General Purpose Log address 0x03). Unlike the Summary SMART error log (see '-l error' above), it provides sufficient space to log the contents of the 48-bit LBA register set introduced with ATA-6. It also supports logs with more than one sector. Each sector holds up to 4 log entries. The actual number of log sectors is vendor specific.


Donc pour afficher les logs d'erreur étendus avec les adresses LBA48, il faudrait utiliser

smartctl -l xerror /dev/sda


Il vaut mieux montrer que raconter.

Hors ligne

#13 09-05-2020 11:10:48

Micka260
Membre
Inscription : 12-07-2018

Re : smartctl analyse des résultats.

Voici le résultat des log d'erreur étendus :
#

smartctl -l xerror /dev/sda


smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-8-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Extended Comprehensive Error Log Version: 1 (5 sectors)
Device Error Count: 4
  CR     = Command Register
  FEATR  = Features Register
  COUNT  = Count (was: Sector Count) Register
  LBA_48 = Upper bytes of LBA High/Mid/Low Registers ]  ATA-8
  LH     = LBA High (was: Cylinder High) Register    ]   LBA
  LM     = LBA Mid (was: Cylinder Low) Register      ] Register
  LL     = LBA Low (was: Sector Number) Register     ]
  DV     = Device (was: Device/Head) Register
  DC     = Device Control Register
  ER     = Error register
  ST     = Status register
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 4 [3] occurred at disk power-on lifetime: 18830 hours (784 days + 14 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER -- ST COUNT  LBA_48  LH LM LL DV DC
  -- -- -- == -- == == == -- -- -- -- --
  40 -- 53 00 00 00 00 a9 cb 5d 90 00 00  Error: UNC at LBA = 0xa9cb5d90 = 2848677264

  Commands leading to the command that caused the error were:
  CR FEATR COUNT  LBA_48  LH LM LL DV DC  Powered_Up_Time  Command/Feature_Name
  -- == -- == -- == == == -- -- -- -- --  ---------------  --------------------
  60 00 00 01 00 00 00 be 2a 64 68 40 00  9d+08:02:45.649  READ FPDMA QUEUED
  60 00 00 01 00 00 00 be 2a ae c8 40 00  9d+08:02:43.016  READ FPDMA QUEUED
  60 00 00 01 00 00 00 be 2a b3 f8 40 00  9d+08:02:43.015  READ FPDMA QUEUED
  60 00 00 01 00 00 00 be 2a 9d 90 40 00  9d+08:02:43.008  READ FPDMA QUEUED
  60 00 00 00 20 00 00 d5 d4 3a 20 40 00  9d+08:02:43.008  READ FPDMA QUEUED

Error 3 [2] occurred at disk power-on lifetime: 18613 hours (775 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER -- ST COUNT  LBA_48  LH LM LL DV DC
  -- -- -- == -- == == == -- -- -- -- --
  40 -- 53 00 00 00 00 a9 cb 5d 90 00 00  Error: UNC at LBA = 0xa9cb5d90 = 2848677264

  Commands leading to the command that caused the error were:
  CR FEATR COUNT  LBA_48  LH LM LL DV DC  Powered_Up_Time  Command/Feature_Name
  -- == -- == -- == == == -- -- -- -- --  ---------------  --------------------
  60 00 00 00 e0 00 00 00 30 bc 20 40 00     06:18:22.488  READ FPDMA QUEUED
  60 00 00 00 18 00 00 00 31 48 20 40 00     06:18:22.484  READ FPDMA QUEUED
  60 00 00 01 00 00 00 00 31 25 00 40 00     06:18:22.484  READ FPDMA QUEUED
  60 00 00 00 30 00 00 d5 15 18 20 40 00     06:18:22.483  READ FPDMA QUEUED
  60 00 00 00 08 00 00 00 45 f6 00 40 00     06:18:22.483  READ FPDMA QUEUED

Error 2 [1] occurred at disk power-on lifetime: 18541 hours (772 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER -- ST COUNT  LBA_48  LH LM LL DV DC
  -- -- -- == -- == == == -- -- -- -- --
  40 -- 53 00 00 00 00 a9 cb 5d 90 00 00  Error: UNC at LBA = 0xa9cb5d90 = 2848677264

  Commands leading to the command that caused the error were:
  CR FEATR COUNT  LBA_48  LH LM LL DV DC  Powered_Up_Time  Command/Feature_Name
  -- == -- == -- == == == -- -- -- -- --  ---------------  --------------------
  60 00 00 00 08 00 00 02 10 08 80 40 00 47d+00:06:50.030  READ FPDMA QUEUED
  60 00 00 00 20 00 00 00 30 fa 00 40 00 47d+00:06:47.374  READ FPDMA QUEUED
  60 00 00 00 08 00 00 d6 54 b0 18 40 00 47d+00:06:47.373  READ FPDMA QUEUED
  60 00 00 00 08 00 00 d6 54 af d8 40 00 47d+00:06:47.368  READ FPDMA QUEUED
  60 00 00 08 00 00 00 a9 cb 58 00 40 00 47d+00:06:47.355  READ FPDMA QUEUED

Error 1 [0] occurred at disk power-on lifetime: 18493 hours (770 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER -- ST COUNT  LBA_48  LH LM LL DV DC
  -- -- -- == -- == == == -- -- -- -- --
  40 -- 53 00 00 00 00 a9 cb 5d 90 00 00  Error: UNC at LBA = 0xa9cb5d90 = 2848677264

  Commands leading to the command that caused the error were:
  CR FEATR COUNT  LBA_48  LH LM LL DV DC  Powered_Up_Time  Command/Feature_Name
  -- == -- == -- == == == -- -- -- -- --  ---------------  --------------------
  60 00 00 00 08 00 00 d6 51 13 00 40 00 44d+23:53:44.522  READ FPDMA QUEUED
  60 00 00 00 10 00 00 d6 54 70 b0 40 00 44d+23:53:44.516  READ FPDMA QUEUED
  60 00 00 00 08 00 00 d6 54 0c a8 40 00 44d+23:53:44.512  READ FPDMA QUEUED
  60 00 00 00 08 00 00 d6 51 11 b8 40 00 44d+23:53:44.507  READ FPDMA QUEUED
  60 00 00 00 20 00 00 d6 50 0e e0 40 00 44d+23:53:44.507  READ FPDMA QUEUED

 



Edit à toto qui commence à fumer... : Pour que la lecture du code sur le forum soit lisible par tous, il faut bien disposer chaque commande hors de son retour. Voir les posts précédents en les éditant s'il le faut. Modif fête. smile
Oh, quel beau BB …code où comment mettre en forme vos messages dans le fofo

Hors ligne

#14 09-05-2020 11:30:56

raleur
Membre
Inscription : 03-10-2014

Re : smartctl analyse des résultats.

Finalement c'était bien le même secteur dont l'adresse réelle est 2848677264.

Il vaut mieux montrer que raconter.

Hors ligne

#15 09-05-2020 15:43:15

Micka260
Membre
Inscription : 12-07-2018

Re : smartctl analyse des résultats.

Je viens de refaire un nouveau test :

# smartctl --all /dev/sda
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-8-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 3.5
Device Model:     ST4000DM005-2DP166
Serial Number:    ZDH1L5H1
LU WWN Device Id: 5 000c50 0a2eee656
Firmware Version: 0001
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5980 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sat May  9 16:42:03 2020 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
          was completed without error.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
          without error or no self-test has ever
          been run.
Total time to complete Offline
data collection:    (  601) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    ( 669) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.
SCT capabilities:          (0x10a5) SCT Status supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   083   064   006    Pre-fail  Always       -       205728824
  3 Spin_Up_Time            0x0003   095   094   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   097   097   020    Old_age   Always       -       3275
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   085   060   045    Pre-fail  Always       -       339371615
  9 Power_On_Hours          0x0032   073   073   000    Old_age   Always       -       24039 (86 167 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       308
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   096   096   000    Old_age   Always       -       4
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0 0 0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   071   052   040    Old_age   Always       -       29 (Min/Max 22/30)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   099   099   000    Old_age   Always       -       3798
193 Load_Cycle_Count        0x0032   077   077   000    Old_age   Always       -       46412
194 Temperature_Celsius     0x0022   029   048   000    Old_age   Always       -       29 (0 17 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       21110h+01m+59.837s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       62995597190
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       115198768293

SMART Error Log Version: 1
ATA Error Count: 4
  CR = Command Register [HEX]
  FR = Features Register [HEX]
  SC = Sector Count Register [HEX]
  SN = Sector Number Register [HEX]
  CL = Cylinder Low Register [HEX]
  CH = Cylinder High Register [HEX]
  DH = Device/Head Register [HEX]
  DC = Device Command Register [HEX]
  ER = Error register [HEX]
  ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 4 occurred at disk power-on lifetime: 18830 hours (784 days + 14 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 53 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 00 ff ff ff 4f 00   9d+08:02:45.649  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00   9d+08:02:43.016  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00   9d+08:02:43.015  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00   9d+08:02:43.008  READ FPDMA QUEUED
  60 00 20 ff ff ff 4f 00   9d+08:02:43.008  READ FPDMA QUEUED

Error 3 occurred at disk power-on lifetime: 18613 hours (775 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 53 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 e0 20 bc 30 40 00      06:18:22.488  READ FPDMA QUEUED
  60 00 18 20 48 31 40 00      06:18:22.484  READ FPDMA QUEUED
  60 00 00 00 25 31 40 00      06:18:22.484  READ FPDMA QUEUED
  60 00 30 ff ff ff 4f 00      06:18:22.483  READ FPDMA QUEUED
  60 00 08 00 f6 45 40 00      06:18:22.483  READ FPDMA QUEUED

Error 2 occurred at disk power-on lifetime: 18541 hours (772 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 53 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 80 08 10 42 00  47d+00:06:50.030  READ FPDMA QUEUED
  60 00 20 00 fa 30 40 00  47d+00:06:47.374  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00  47d+00:06:47.373  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00  47d+00:06:47.368  READ FPDMA QUEUED
  60 00 00 ff ff ff 4f 00  47d+00:06:47.355  READ FPDMA QUEUED

Error 1 occurred at disk power-on lifetime: 18493 hours (770 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 53 00 ff ff ff 0f  Error: UNC at LBA = 0x0fffffff = 268435455

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 08 ff ff ff 4f 00  44d+23:53:44.522  READ FPDMA QUEUED
  60 00 10 ff ff ff 4f 00  44d+23:53:44.516  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00  44d+23:53:44.512  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00  44d+23:53:44.507  READ FPDMA QUEUED
  60 00 20 ff ff ff 4f 00  44d+23:53:44.507  READ FPDMA QUEUED

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     24032         -
# 2  Short offline       Completed without error       00%      9203         -
# 3  Extended offline    Completed without error       00%      7365         -
# 4  Extended offline    Interrupted (host reset)      00%       422         -
# 5  Extended offline    Completed without error       00%       245         -
# 6  Extended offline    Interrupted (host reset)      00%        87         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

 



Pas grand chose n'a évolué depuis

Dernière modification par Micka260 (09-05-2020 15:44:27)

Hors ligne

#16 09-05-2020 16:03:44

raleur
Membre
Inscription : 03-10-2014

Re : smartctl analyse des résultats.

Il y a au moins ça :

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%     24032         -


L'auto-test étendu s'est achevé sans erreur. Donc a priori le secteur défectueux a bel et bien disparu.


Il vaut mieux montrer que raconter.

Hors ligne

#17 09-05-2020 16:13:54

Micka260
Membre
Inscription : 12-07-2018

Re : smartctl analyse des résultats.

Super merci pour ton aide,
J'ai aussi appris plein de chose et c'est avant tout l'essentiel ! En espérant que ça serve aussi a d'autre personne dans mon cas smile

Hors ligne

#18 09-05-2020 22:01:09

smolski
quasi...modo
Lieu : AIN
Distrib. : backports (buster) 10
Noyau : Linux 4.19.0-8-amd64
(G)UI : gnome
Inscription : 21-10-2008

Re : smartctl analyse des résultats.

Micka260 a écrit :

En espérant que ça serve aussi a d'autre personne


Surtout si tu n'oublies pas de mettre le post en Resolu :

Voir le tuto : C'est résolu ! Bravo mais il faut l'indiquer dans l'titre.


"Théo et Adama te rappellent pourquoi Zyed et Bouna couraient…"
"L'utopie ne signifie pas l'irréalisable, mais l'irréalisée." - T Monod (source :  La zone de Siné)
"Je peux rire de tout mais pas avec n'importe qui." - P Desproges
"saque eud dun" (patois chtimi : fonce dedans)

En ligne

Pied de page des forums