logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 19-11-2019 11:00:51

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

[clos] dépannage hdd 4 To red raid 1

bonjour à tous   big_smile

d'habitude , je me casse pas les pieds ;
dès qu'un disque me fait des soucis , je le change .

mais là , y en a pour des sous donc , si je peux le récupérer , je préfère .

voilà le message du daemon :

smartctl daemon  a écrit :

This message was generated by the smartd daemon running on:

   host name:  Alain-PC
   DNS domain: lan

The following warning/error was logged by the smartd daemon:

Device: /dev/sdj [SAT], Self-Test Log error count increased from 5 to 6

Device info:
WDC WD40EFRX-68WT0N0, S/N:WD-WCC4E4LZFZ01, WWN:5-0014ee-20db380bb, FW:82.00A82, 4.00 TB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
The original message about this issue was sent at Sun Nov 17 22:41:21 2019 CET
Another message will be sent in 24 hours if the problem persists.



test long en cours .

pour la curiosité , j'ai aussi lancé un test long sur :
- mon ssd (sdk)
- le 2 ème disque du raid 1 (sdi)
- un disque quasi vierge et presque inutilisé seagate 2 To (sda)

trouvé ceci : https://www.smartmontools.org/wiki/BadBlockHowto

intéressant , mais , je n'arrive pas à faire le calcul .

apparemment , erreur de syntaxe , mais , je trouve pas (int) dans le man .

pour en revenir à mes tests :
test ssd :

sudo smartctl -a /dev/sdk


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Crucial/Micron BX/MX1/2/3/500, M5/600, 1100 SSDs
Device Model:     CT500MX500SSD4
Serial Number:    1813E134D584
LU WWN Device Id: 5 00a075 1e134d584
Firmware Version: M3CR022
User Capacity:    500107862016 bytes [500 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    Solid State Device
Form Factor:      M.2
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.3, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Nov 19 10:46:42 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
          was completed without error.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
          without error or no self-test has ever
          been run.
Total time to complete Offline
data collection:    (    0) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    (  30) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.
SCT capabilities:          (0x0031) SCT Status supported.
          SCT Feature Control supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   000    Pre-fail  Always       -       0
  5 Reallocate_NAND_Blk_Cnt 0x0032   100   100   010    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       3468
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       2058
171 Program_Fail_Count      0x0032   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
173 Ave_Block-Erase_Count   0x0032   081   081   000    Old_age   Always       -       288
174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       378
180 Unused_Reserve_NAND_Blk 0x0033   000   000   000    Pre-fail  Always       -       43
183 SATA_Interfac_Downshift 0x0032   100   100   000    Old_age   Always       -       0
184 Error_Correction_Count  0x0032   100   100   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   057   019   000    Old_age   Always       -       43 (Min/Max 0/81)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   000    Old_age   Always       -       5
202 Percent_Lifetime_Remain 0x0030   081   081   001    Old_age   Offline      -       19
206 Write_Error_Rate        0x000e   100   100   000    Old_age   Always       -       0
210 Success_RAIN_Recov_Cnt  0x0032   100   100   000    Old_age   Always       -       0
246 Total_Host_Sector_Write 0x0032   100   100   000    Old_age   Always       -       41756204288
247 Host_Program_Page_Count 0x0032   100   100   000    Old_age   Always       -       735469391
248 FTL_Program_Page_Count  0x0032   100   100   000    Old_age   Always       -       3295350788

SMART Error Log Version: 1
Warning: ATA error count 0 inconsistent with error log pointer 2

ATA Error Count: 0
  CR = Command Register [HEX]
  FR = Features Register [HEX]
  SC = Sector Count Register [HEX]
  SN = Sector Number Register [HEX]
  CL = Cylinder Low Register [HEX]
  CH = Cylinder High Register [HEX]
  DH = Device/Head Register [HEX]
  DC = Device Command Register [HEX]
  ER = Error register [HEX]
  ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error -1 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was in an unknown state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  00 ec 00 00 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ec 00 00 00 00 00 00 00      00:00:00.000  IDENTIFY DEVICE
  ec 00 00 00 00 00 00 00      00:00:00.000  IDENTIFY DEVICE
  ec 00 00 00 00 00 00 00      00:00:00.000  IDENTIFY DEVICE
  ec 00 00 00 00 00 00 00      00:00:00.000  IDENTIFY DEVICE
  c8 00 00 00 00 00 00 00      00:00:00.000  READ DMA

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      3467         -
# 2  Short offline       Completed without error       00%       354         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 


test de sda . seagate 2 To peu utilisé :

sudo smartctl -a /dev/sda


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.14 (AF)
Device Model:     ST2000DM001-9YN164
Serial Number:    Z1E0AC50
LU WWN Device Id: 5 000c50 03fa4e30d
Firmware Version: CC4H
User Capacity:    2000398934016 bytes [2,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    7200 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Nov 19 10:52:21 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
          was completed without error.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 247) Self-test routine in progress...
          70% of test remaining.
Total time to complete Offline
data collection:    (  575) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    ( 219) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.
SCT capabilities:          (0x3085) SCT Status supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   117   099   006    Pre-fail  Always       -       158583976
  3 Spin_Up_Time            0x0003   095   094   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   095   095   020    Old_age   Always       -       5961
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   065   060   030    Pre-fail  Always       -       30092206322
  9 Power_On_Hours          0x0032   074   074   000    Old_age   Always       -       23467
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   020    Old_age   Always       -       3660
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   098   000    Old_age   Always       -       9 9 20
189 High_Fly_Writes         0x003a   097   097   000    Old_age   Always       -       3
190 Airflow_Temperature_Cel 0x0022   070   052   045    Old_age   Always       -       30 (Min/Max 23/30)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       1399
193 Load_Cycle_Count        0x0032   090   090   000    Old_age   Always       -       21469
194 Temperature_Celsius     0x0022   030   048   000    Old_age   Always       -       30 (0 16 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       12717h+03m+38.413s
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       29088281366924
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       14420480945014

SMART Error Log Version: 1
ATA Error Count: 2
  CR = Command Register [HEX]
  FR = Features Register [HEX]
  SC = Sector Count Register [HEX]
  SN = Sector Number Register [HEX]
  CL = Cylinder Low Register [HEX]
  CH = Cylinder High Register [HEX]
  DH = Device/Head Register [HEX]
  DC = Device Command Register [HEX]
  ER = Error register [HEX]
  ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 2 occurred at disk power-on lifetime: 21826 hours (909 days + 10 hours)
  When the command that caused the error occurred, the device was in an unknown state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 00 00 00 00 00  Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  00 00 00 00 00 00 00 ff      06:18:29.985  NOP [Abort queued commands]
  b0 d4 00 83 4f c2 00 00      06:17:28.107  SMART EXECUTE OFF-LINE IMMEDIATE
  b0 d0 01 00 4f c2 00 00      06:17:28.054  SMART READ DATA
  ec 00 01 00 00 00 00 00      06:17:28.048  IDENTIFY DEVICE
  ec 00 01 00 00 00 00 00      06:17:28.048  IDENTIFY DEVICE

Error 1 occurred at disk power-on lifetime: 21826 hours (909 days + 10 hours)
  When the command that caused the error occurred, the device was in an unknown state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 00 00 00 00 00  Error: ABRT

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  00 00 00 00 00 00 00 ff      06:08:23.692  NOP [Abort queued commands]
  b0 d4 00 83 4f c2 00 00      06:07:23.544  SMART EXECUTE OFF-LINE IMMEDIATE
  b0 d0 01 00 4f c2 00 00      06:07:23.483  SMART READ DATA
  ec 00 01 00 00 00 00 00      06:07:23.474  IDENTIFY DEVICE
  ec 00 01 00 00 00 00 00      06:07:23.472  IDENTIFY DEVICE

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Self-test routine in progress 70%     23467         -
# 2  Extended offline    Completed without error       00%     21875         -
# 3  Conveyance offline  Completed without error       00%     21827         -
# 4  Conveyance offline  Completed without error       00%     21827         -
# 5  Conveyance offline  Completed without error       00%     21826         -
# 6  Conveyance captive  Interrupted (host reset)      50%     21826         -
# 7  Conveyance captive  Interrupted (host reset)      50%     21826         -
# 8  Short offline       Completed without error       00%     17554         -
# 9  Extended offline    Completed without error       00%         3         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.



test premier disque du raid 1 : (sdi) seagate 4 To

sudo smartctl -a /dev/sdi


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Video 3.5 HDD
Device Model:     ST4000VM000-2AF166
Serial Number:    WDH0AFF6
LU WWN Device Id: 5 000c50 09ca2e849
Firmware Version: SC11
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5980 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Nov 19 10:54:08 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
          was completed without error.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 249) Self-test routine in progress...
          90% of test remaining.
Total time to complete Offline
data collection:    (  591) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    ( 637) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.
SCT capabilities:          (0x50bd) SCT Status supported.
          SCT Error Recovery Control supported.
          SCT Feature Control supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   082   064   044    Pre-fail  Always       -       161934254
  3 Spin_Up_Time            0x0003   094   093   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   097   097   020    Old_age   Always       -       3765
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   080   060   045    Pre-fail  Always       -       90155008
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       15399 (239 145 0)
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   020    Old_age   Always       -       3230
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   098   000    Old_age   Always       -       51540394001
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   070   056   040    Old_age   Always       -       30 (Min/Max 22/30)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       983
193 Load_Cycle_Count        0x0032   097   097   000    Old_age   Always       -       6968
194 Temperature_Celsius     0x0022   030   044   000    Old_age   Always       -       30 (0 15 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       12128 (203 141 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       20822276019
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       42985553239

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Self-test routine in progress 90%     15399         -
# 2  Short offline       Completed without error       00%     13710         -
# 3  Short offline       Completed without error       00%      9496         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.



et enfin test du disque incriminé : (sdj) WDC Red 4 To

sudo smartctl -a /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD40EFRX-68WT0N0
Serial Number:    WD-WCC4E4LZFZ01
LU WWN Device Id: 5 0014ee 20db380bb
Firmware Version: 82.00A82
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Nov 19 10:57:35 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84) Offline data collection activity
          was suspended by an interrupting command from host.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 121) The previous self-test completed having
          the read element of the test failed.
Total time to complete Offline
data collection:    (51840) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    ( 518) minutes.
Conveyance self-test routine
recommended polling time:    (   5) minutes.
SCT capabilities:          (0x703d) SCT Status supported.
          SCT Error Recovery Control supported.
          SCT Feature Control supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   197   176   021    Pre-fail  Always       -       7108
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3442
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       12683
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3189
192 Power-Off_Retract_Count 0x0032   199   199   000    Old_age   Always       -       1092
193 Load_Cycle_Count        0x0032   198   198   000    Old_age   Always       -       6173
194 Temperature_Celsius     0x0022   122   103   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       54
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%     12682         12452296
# 2  Extended offline    Completed: read failure       90%     12674         12452296
# 3  Extended offline    Completed: read failure       90%     12670         12452296
# 4  Extended offline    Completed: read failure       90%     12668         12452296
# 5  Short offline       Completed: read failure       90%     12665         12452296
# 6  Short offline       Completed: read failure       90%     12665         12452296
# 7  Short offline       Completed without error       00%     10995         -
# 8  Short offline       Completed without error       00%      6774         -
# 9  Short offline       Completed without error       00%      1134         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.



pour terminer ce long post , que pensez vous de -- ce disque -- en remplacement du WDC qui me lâche .
même si je me sers souvent de mon pc , je l'allume et l'éteinds fréquemment , donc , un disque pour N.A.S. , pas vraiment besoin .
surtout si c'est pour le flinguer  comme celui ci ...

Dernière modification par Debian Alain (15-03-2020 19:56:45)

Hors ligne

#2 19-11-2019 14:35:29

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       54


54 secteurs illisibles. Ça ne veut pas dire qu'il est mourant.
Si RAID logiciel, est-ce que ce disque fait encore partie de son ensemble RAID /dev/mdX ?

cat /proc/mdstat
mdadm --detail /dev/mdX


S'il est encore dans l'ensemble RAID, tu peux lancer un "scrub" pour tenter de réparer ces secteurs grâce au contenu de l'autre disque.

mdadm --action=check /dev/mdX



S'il a été déclaré défaillant et sorti du RAID, tu peux utiliser badblocks pour identifier et/ou tenter de réparer les secteurs défectueux.

- En lecture-écriture pour les réparer (je suppose que la partition RAID est /dev/sdj1).
Je spécife une taille de bloc de 4096 octets correspondant à la taille des secteurs physiques du disque car si un secteur physique est défectueux, les 8 secteurs logiques de 512 octets qu'il contient seront vus comme défectueux, inutile de les tester séparément.

badblocks -svw -b 4096 /dev/sdj1 > badblocks.list


C'est très long car ça fait 4 passes d'écritures avec des motifs différents et 4 passes de relecture sur toute la partition. On peut raccourcir en ne faisant qu'une passe avec un motif (0 ici) :

badblocks -svw -t 0 -b 4096 /dev/sdj1 > badblocks.list


- En lecture seule pour identifier les secteurs défectueux.

badblocks -sv -b 4096 /dev/sdj1 > badblocks.list


Ensuite pour tenter de réparer les secteurs défectueux identifiés un par un, il y a la commande hdparm --write-sector qui agit directement sur un secteur logique. Attention, il faut multiplier un numéro de secteur physique N enregistré dans badblocks.list par 8 et traiter les 8 secteurs logiques consécutifs.

for i in [0-7] ; do hdparm --yes-i-know-what-i-am-doing --write-sector $((N*8+$i)) ; done # PAS TESTE - A VERIFIER


Ou bien il y a la commande dd.

dd if=/dev/zero of=/dev/sdj1 bs=4096 count=1 seek=N

Dernière modification par raleur (19-11-2019 15:22:42)


Il vaut mieux montrer que raconter.

Hors ligne

#3 19-11-2019 15:12:53

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [clos] dépannage hdd 4 To red raid 1

Râleur  a écrit :

54 secteurs illisibles. Ça ne veut pas dire qu'il est mourant.
Si RAID logiciel, est-ce que ce disque fait encore partie de son ensemble RAID /dev/mdX ?



cat /proc/mdadm


cat: /proc/mdadm: Aucun fichier ou dossier de ce type



mdadm --detail /dev/md0


/dev/md0:
           Version : 1.2
     Creation Time : Sun Jun 30 14:39:28 2019
        Raid Level : raid1
        Array Size : 3906884608 (3725.90 GiB 4000.65 GB)
     Used Dev Size : 3906884608 (3725.90 GiB 4000.65 GB)
      Raid Devices : 2
     Total Devices : 2
       Persistence : Superblock is persistent

     Intent Bitmap : Internal

       Update Time : Tue Nov 19 07:51:04 2019
             State : clean
    Active Devices : 2
   Working Devices : 2
    Failed Devices : 0
     Spare Devices : 0

Consistency Policy : bitmap

              Name : Alain-PC:0  (local to host Alain-PC)
              UUID : 257f5125:29630f11:47b23328:25c7c023
            Events : 1252

    Number   Major   Minor   RaidDevice State
       0       8      129        0      active sync   /dev/sdi1
       1       8      145        1      active sync   /dev/sdj1
 



Râleur  a écrit :

S'il a été déclaré défaillant et sorti du RAID, tu peux utiliser badblocks pour identifier et/ou tenter de réparer les secteurs défectueux.



non , non , pas encore . merci .

Râleur  a écrit :

S'il est encore dans l'ensemble RAID, tu peux lancer un "scrub" pour tenter de réparer ces secteurs grâce au contenu de l'autre disque.



mdadm --action=check /dev/mdX



okay , j'essaie .

comment je vérifie si l'opération est en cours et si elle a réussi ?
avec un smartctl ?

mdadm --action=check /dev/md0



cat /proc/md*


Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 sdj1[1] sdi1[0]
      3906884608 blocks super 1.2 [2/2] [UU]
      [>....................]  check =  1.4% (56671744/3906884608) finish=410.4min speed=156345K/sec
      bitmap: 0/30 pages [0KB], 65536KB chunk

unused devices: <none>

Dernière modification par Debian Alain (19-11-2019 15:18:28)

Hors ligne

#4 19-11-2019 15:24:35

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

Debian Alain a écrit :

cat: /proc/mdadm: Aucun fichier ou dossier de ce type


Erreur de ma part, c'est /proc/mdstat. J'ai corrigé mon message précédent.


Il vaut mieux montrer que raconter.

Hors ligne

#5 19-11-2019 15:29:31

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [clos] dépannage hdd 4 To red raid 1

cat /proc/mdstat


Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 sdj1[1] sdi1[0]
      3906884608 blocks super 1.2 [2/2] [UU]
      [==============>......]  check = 72.2% (2824214976/3906884608) finish=166.6min speed=108267K/sec
      bitmap: 0/30 pages [0KB], 65536KB chunk

unused devices: <none>



j'ai été voir sur le site de  WD .

pour mon 3TB qui m'a lâché , il était encore sous garantie .
j'ai pu créer un RMA . j'attends le nouveau disque .

6wdm143.png

83OXHl9.png

pour mon 4TB , il est  encore garanti jusque en fin janvier 2020 (si j'ai bien lu) .

dwcY6mb.png

question : je dois laisser mon pc allumé ou je peux l'éteindre ce soir et le rallumer demain matin (à quelles conditions ?)

Dernière modification par Debian Alain (19-11-2019 21:12:30)

Hors ligne

#6 19-11-2019 22:49:55

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

Le seul risque d'éteindre avant la fin, c'est que l'opération soit interrompue et ne reprenne pas au démarrage suivant.
A ce stade, que rapporte smartctl -a ?

Il vaut mieux montrer que raconter.

Hors ligne

#7 19-11-2019 22:59:06

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [clos] dépannage hdd 4 To red raid 1

cat /proc/mdstat


Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 sdj1[1] sdi1[0]
      3906884608 blocks super 1.2 [2/2] [UU]
      [=================>...]  check = 87.0% (3399567424/3906884608) finish=93.9min speed=90000K/sec
      bitmap: 0/30 pages [0KB], 65536KB chunk

unused devices: <none>
 



sudo smartctl -t long /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 518 minutes for test to complete.
Test will complete after Wed Nov 20 07:33:11 2019

Use smartctl -X to abort test.



sudo smartctl -a /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD40EFRX-68WT0N0
Serial Number:    WD-WCC4E4LZFZ01
LU WWN Device Id: 5 0014ee 20db380bb
Firmware Version: 82.00A82
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Nov 19 22:55:20 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x85) Offline data collection activity
          was aborted by an interrupting command from host.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 249) Self-test routine in progress...
          90% of test remaining.
Total time to complete Offline
data collection:    (51840) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    ( 518) minutes.
Conveyance self-test routine
recommended polling time:    (   5) minutes.
SCT capabilities:          (0x703d) SCT Status supported.
          SCT Error Recovery Control supported.
          SCT Feature Control supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       72
  3 Spin_Up_Time            0x0027   197   176   021    Pre-fail  Always       -       7108
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3442
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       12695
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3189
192 Power-Off_Retract_Count 0x0032   199   199   000    Old_age   Always       -       1092
193 Load_Cycle_Count        0x0032   198   198   000    Old_age   Always       -       6173
194 Temperature_Celsius     0x0022   121   103   000    Old_age   Always       -       31
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       3
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: read failure       90%     12682         12452296
# 2  Extended offline    Completed: read failure       90%     12674         12452296
# 3  Extended offline    Completed: read failure       90%     12670         12452296
# 4  Extended offline    Completed: read failure       90%     12668         12452296
# 5  Short offline       Completed: read failure       90%     12665         12452296
# 6  Short offline       Completed: read failure       90%     12665         12452296
# 7  Short offline       Completed without error       00%     10995         -
# 8  Short offline       Completed without error       00%      6774         -
# 9  Short offline       Completed without error       00%      1134         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 

Hors ligne

#8 19-11-2019 23:18:06

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

Il y a du progrès, le nombre de secteurs illisibles a bien diminué.

Il vaut mieux montrer que raconter.

Hors ligne

#9 20-11-2019 04:43:38

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [clos] dépannage hdd 4 To red raid 1

sudo smartctl -t short /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Wed Nov 20 04:36:06 2019



sudo smartctl -a /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD40EFRX-68WT0N0
Serial Number:    WD-WCC4E4LZFZ01
LU WWN Device Id: 5 0014ee 20db380bb
Firmware Version: 82.00A82
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Wed Nov 20 04:37:10 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84) Offline data collection activity
          was suspended by an interrupting command from host.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 121) The previous self-test completed having
          the read element of the test failed.
Total time to complete Offline
data collection:    (51840) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    ( 518) minutes.
Conveyance self-test routine
recommended polling time:    (   5) minutes.
SCT capabilities:          (0x703d) SCT Status supported.
          SCT Error Recovery Control supported.
          SCT Feature Control supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       72
  3 Spin_Up_Time            0x0027   204   176   021    Pre-fail  Always       -       6800
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3443
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       12701
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3190
192 Power-Off_Retract_Count 0x0032   199   199   000    Old_age   Always       -       1093
193 Load_Cycle_Count        0x0032   198   198   000    Old_age   Always       -       6173
194 Temperature_Celsius     0x0022   122   103   000    Old_age   Always       -       30
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       7

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%     12701         12457656
# 2  Extended offline    Completed: read failure       90%     12701         12457656
# 3  Extended offline    Completed: read failure       90%     12696         12457656
# 4  Extended offline    Completed: read failure       90%     12682         12452296
# 5  Extended offline    Completed: read failure       90%     12674         12452296
# 6  Extended offline    Completed: read failure       90%     12670         12452296
# 7  Extended offline    Completed: read failure       90%     12668         12452296
# 8  Short offline       Completed: read failure       90%     12665         12452296
# 9  Short offline       Completed: read failure       90%     12665         12452296
#10  Short offline       Completed without error       00%     10995         -
#11  Short offline       Completed without error       00%      6774         -
#12  Short offline       Completed without error       00%      1134         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Hors ligne

#10 20-11-2019 06:51:19

Anonyme
Invité

Re : [clos] dépannage hdd 4 To red raid 1

Bonjour,
Je n'ai pas suivi le sujet mais suis surpris de voir un disque avec si peu de démarrages et d'heure avoir déjà des indications "pre fail" et "old age". D'un autre côté jamais vu si chaud non plus.

#11 20-11-2019 10:27:38

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

"pre fail" et "old age" sont les deux types d'attributs, ils sont toujours présents. Tu n'as jamais utilisé smartctl pour afficher les attributs SMART ?

Par contre je suis un peu surpris qu'il reste 4 secteurs "pending" alors que les logs d'erreur SMART sont vides. Je suppose que le check de mdadm est terminé ?
Il y a des messages liés dans les logs du noyau ? (dmesg) ?
Quel est le partitionnement du disque ?
Tu pourrais lancer badblocks en lecture seule pour vérifier s'il y a vraiment des secteurs illisibles. J'ai déjà eu le cas où l'information "pending" était fausse.

Dernière modification par raleur (20-11-2019 14:41:46)


Il vaut mieux montrer que raconter.

Hors ligne

#12 20-11-2019 15:56:12

Anonyme
Invité

Re : [clos] dépannage hdd 4 To red raid 1

raleur a écrit :

"pre fail" et "old age" sont les deux types d'attributs, ils sont toujours présents. Tu n'as jamais utilisé smartctl pour afficher les attributs SMART ?
.


Si mais toujours sur de vieux disques où ces indications me semblaient logiques neutral et je lisais des températures bien plus basses.

#13 20-11-2019 16:08:52

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

30 °C est une température tout-à-fait convenable, je ne commencerais à m'inquiéter qu'au delà de 35-40 °C.

Dernière modification par raleur (20-11-2019 16:09:04)


Il vaut mieux montrer que raconter.

Hors ligne

#14 20-11-2019 16:10:46

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [clos] dépannage hdd 4 To red raid 1

il faut que je démonte sdj  du raid pour faire ton badblocks , râleur ?

Hors ligne

#15 20-11-2019 16:25:35

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

Non, c'est un test en lecture seule (sans -n ou -w).

Dernière modification par raleur (20-11-2019 16:26:00)


Il vaut mieux montrer que raconter.

Hors ligne

#16 20-11-2019 16:32:23

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [clos] dépannage hdd 4 To red raid 1

badblocks /dev/sdj

scratchhead.gif
c'est la bonne commande ?

je peux faire : ?

badblocks /dev/sdj -o ~/badblocks.txt



je crois que j'y suis , tu parlais de cette commande : ?

badblocks -sv -b 4096 /dev/sdj1 > badblocks.list

Dernière modification par Debian Alain (20-11-2019 16:39:17)

Hors ligne

#17 20-11-2019 16:42:03

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

La dernière est presque parfait : elle est adaptée à la taille des secteurs physiques et permet de suivre la progression. Mais il faut tester le disque entier sdj, pas seulement la partition sdj1.

Dernière modification par raleur (20-11-2019 16:42:39)


Il vaut mieux montrer que raconter.

Hors ligne

#18 20-11-2019 19:39:30

Anonyme
Invité

Re : [clos] dépannage hdd 4 To red raid 1

raleur a écrit :

30 °C est une température tout-à-fait convenable, je ne commencerais à m'inquiéter qu'au delà de 35-40 °C.


J'ai pas lu >100 ?

Temperature_Celsius     0x0022   122

#19 21-11-2019 08:48:28

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [clos] dépannage hdd 4 To red raid 1

sudo badblocks -sv -b 4096 /dev/sdj > badblocks.list


Checking blocks 0 to 976754645
Checking for bad blocks (read-only test):   0.00% done, 0:00 elapsed. (0/0/0 err  5.38% done, 22:47  5  5.40% done, 22:5  5.40% done, 22:  5.41% done, 22:53 el  5.41% done, 22:54 elapsed. (1  5.42% do    5.46% done, 23:07 elapsed. (1/  5.47% done, 23:09 elapsed. (1/0/0 errors  5.48% done, 23:10 elapsed. (1/0/0  5.52% done, 23:  5.52% done, 23:21   5.54% done, 23:25   5.54% done, 23  6.97% done, 29:25 elapsed. (1/0/0   6.97% do  6.9done                                                
Pass completed, 1 bad blocks found. (1/0/0 errors)



cat badblocks.list


1557207



This message was generated by the smartd daemon running on:

   host name:  Alain-PC
   DNS domain: lan

The following warning/error was logged by the smartd daemon:

Device: /dev/sdj [SAT], 4 Currently unreadable (pending) sectors

Device info:
WDC WD40EFRX-68WT0N0, S/N:WD-WCC4E4LZFZ01, WWN:5-0014ee-20db380bb, FW:82.00A82, 4.00 TB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
The original message about this issue was sent at Sat Nov 16 21:46:41 2019 CET
Another message will be sent in 24 hours if the problem persists.



This message was generated by the smartd daemon running on:

   host name:  Alain-PC
   DNS domain: lan

The following warning/error was logged by the smartd daemon:

Device: /dev/sdj [SAT], 1 Offline uncorrectable sectors

Device info:
WDC WD40EFRX-68WT0N0, S/N:WD-WCC4E4LZFZ01, WWN:5-0014ee-20db380bb, FW:82.00A82, 4.00 TB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
Another message will be sent in 24 hours if the problem persists.



sudo smartctl -t short /dev/sdj


[sudo] Mot de passe de alain :
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Thu Nov 21 08:33:38 2019



sudo smartctl -a /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD40EFRX-68WT0N0
Serial Number:    WD-WCC4E4LZFZ01
LU WWN Device Id: 5 0014ee 20db380bb
Firmware Version: 82.00A82
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Nov 21 08:44:18 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
          was completed without error.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 121) The previous self-test completed having
          the read element of the test failed.
Total time to complete Offline
data collection:    (51840) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    ( 518) minutes.
Conveyance self-test routine
recommended polling time:    (   5) minutes.
SCT capabilities:          (0x703d) SCT Status supported.
          SCT Error Recovery Control supported.
          SCT Feature Control supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       140
  3 Spin_Up_Time            0x0027   205   176   021    Pre-fail  Always       -       6750
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3445
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       12724
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3192
192 Power-Off_Retract_Count 0x0032   199   199   000    Old_age   Always       -       1094
193 Load_Cycle_Count        0x0032   198   198   000    Old_age   Always       -       6174
194 Temperature_Celsius     0x0022   123   103   000    Old_age   Always       -       29
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       26

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%     12724         12457656
# 2  Short offline       Completed: read failure       90%     12701         12457656
# 3  Extended offline    Completed: read failure       90%     12701         12457656
# 4  Extended offline    Completed: read failure       90%     12696         12457656
# 5  Extended offline    Completed: read failure       90%     12682         12452296
# 6  Extended offline    Completed: read failure       90%     12674         12452296
# 7  Extended offline    Completed: read failure       90%     12670         12452296
# 8  Extended offline    Completed: read failure       90%     12668         12452296
# 9  Short offline       Completed: read failure       90%     12665         12452296
#10  Short offline       Completed: read failure       90%     12665         12452296
#11  Short offline       Completed without error       00%     10995         -
#12  Short offline       Completed without error       00%      6774         -
#13  Short offline       Completed without error       00%      1134         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.



grave / pas grave / gênant / je ne sais plus que faire ....
comprends rien .
apparemment , après un rapide calcul , smartctl = badblocks * 8
mais à quoi çà sert ?
qu'est ce  que c'est ?
comment mettre à jour si erreur(s) d'estimation ?

Dernière modification par Debian Alain (21-11-2019 08:59:34)

Hors ligne

#20 21-11-2019 09:36:18

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

Anonyme a écrit :

J'ai pas lu >100 ?

Temperature_Celsius     0x0022   122


122 est la valeur normalisée entre 255 et 0, le plus haut étant le mieux. Il faut regarder la valeur brute (RAW_VALUE).

Debian Alain a écrit :

apparemment , après un rapide calcul , smartctl = badblocks * 8


Effectivement, les deux informations correspondent, ce qui est plutôt rassurant. Il faudrait essayer d'écrire dans les 8 secteurs logiques de ce secteur physique avec les données correspondantes de l'autre disque.

dd if=/dev/sdi of=/dev/sdj bs=4096 count=1 skip=1557207 seek=1557207 conv=fsync oflag=direct


Je ne suis pas sûr que les options fsync et direct soient utiles.
Mais avant cela il faudrait vérifier à quoi ces secteurs sont affectés pour s'assurer qu'ils sont censés contenir les mêmes données.

fdisk -l /dev/sdi
fdisk -l /dev/sdj
mdadm --examine -v /dev/sdi1
mdadm --examine -v /dev/sdj1


Il vaut mieux montrer que raconter.

Hors ligne

#21 21-11-2019 09:48:26

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [clos] dépannage hdd 4 To red raid 1

fdisk -l /dev/sdi


Disque /dev/sdi : 3,65 TiB, 4000787030016 octets, 7814037168 secteurs
Modèle de disque : ST4000VM000-2AF1
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : D5B43389-5B0D-4F7C-985C-F888ACE72F5E

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdi1     2048 7814035455 7814033408   3,7T RAID Linux



fdisk -l /dev/sdj


Disque /dev/sdj : 3,65 TiB, 4000787030016 octets, 7814037168 secteurs
Modèle de disque : WDC WD40EFRX-68W
Unités : secteur de 1 × 512 = 512 octets
Taille de secteur (logique / physique) : 512 octets / 4096 octets
taille d'E/S (minimale / optimale) : 4096 octets / 4096 octets
Type d'étiquette de disque : gpt
Identifiant de disque : B1512351-D0B6-4734-88E6-04706CE0304B

Périphérique Début        Fin   Secteurs Taille Type
/dev/sdj1     2048 7814035455 7814033408   3,7T RAID Linux



mdadm --examine -v /dev/sdi1


/dev/sdi1:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x1
     Array UUID : 257f5125:29630f11:47b23328:25c7c023
           Name : Alain-PC:0  (local to host Alain-PC)
  Creation Time : Sun Jun 30 14:39:28 2019
     Raid Level : raid1
   Raid Devices : 2

 Avail Dev Size : 7813769216 (3725.90 GiB 4000.65 GB)
     Array Size : 3906884608 (3725.90 GiB 4000.65 GB)
    Data Offset : 264192 sectors
   Super Offset : 8 sectors
   Unused Space : before=264112 sectors, after=0 sectors
          State : clean
    Device UUID : 1616005d:a5c9126a:e9bdd058:f1032cf4

Internal Bitmap : 8 sectors from superblock
    Update Time : Wed Nov 20 08:22:05 2019
  Bad Block Log : 512 entries available at offset 24 sectors
       Checksum : 4ab60af2 - correct
         Events : 1260


   Device Role : Active device 0
   Array State : AA ('A' == active, '.' == missing, 'R' == replacing)




mdadm --examine -v /dev/sdj1


/dev/sdj1:
          Magic : a92b4efc
        Version : 1.2
    Feature Map : 0x1
     Array UUID : 257f5125:29630f11:47b23328:25c7c023
           Name : Alain-PC:0  (local to host Alain-PC)
  Creation Time : Sun Jun 30 14:39:28 2019
     Raid Level : raid1
   Raid Devices : 2

 Avail Dev Size : 7813769216 (3725.90 GiB 4000.65 GB)
     Array Size : 3906884608 (3725.90 GiB 4000.65 GB)
    Data Offset : 264192 sectors
   Super Offset : 8 sectors
   Unused Space : before=264112 sectors, after=0 sectors
          State : clean
    Device UUID : 8409f72c:11780a2a:e7987e20:9f2244ee

Internal Bitmap : 8 sectors from superblock
    Update Time : Wed Nov 20 08:22:05 2019
  Bad Block Log : 512 entries available at offset 24 sectors
       Checksum : 9c6aa678 - correct
         Events : 1260


   Device Role : Active device 1
   Array State : AA ('A' == active, '.' == missing, 'R' == replacing)



faudrai savoir à quel(s) fichiers(s) correspond(ent) ce(s) block(s) .
comment faire ?

le raid a été constitué avec 2 disques différents , un seagate et un WD Red , 4 To chacun

sudo smartctl -i /dev/sdi


[sudo] Mot de passe de alain :
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Video 3.5 HDD
Device Model:     ST4000VM000-2AF166
Serial Number:    WDH0AFF6
LU WWN Device Id: 5 000c50 09ca2e849
Firmware Version: SC11
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5980 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Nov 21 10:05:41 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled



sudo smartctl -i /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD40EFRX-68WT0N0
Serial Number:    WD-WCC4E4LZFZ01
LU WWN Device Id: 5 0014ee 20db380bb
Firmware Version: 82.00A82
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Nov 21 10:05:50 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

Dernière modification par Debian Alain (21-11-2019 10:07:33)

Hors ligne

#22 21-11-2019 10:12:15

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

Debian Alain a écrit :

faudrai savoir à quel(s) fichiers(s) correspond(ent) ce(s) block(s)


Pour quoi faire ?

Les deux disques ont exactement la même structure et les secteurs illisibles sont dans la zone de données RAID 1, donc tu peux tenter la copie.
Idéalement il faudrait arrêter l'ensemble RAID avant si possible, au cas improbable où il voudrait écrire à cet endroit en même temps.

Dernière modification par raleur (21-11-2019 10:14:24)


Il vaut mieux montrer que raconter.

Hors ligne

#23 21-11-2019 10:44:06

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [clos] dépannage hdd 4 To red raid 1

sudo -i


[sudo] Mot de passe de alain :



dd if=/dev/sdi of=/dev/sdj bs=4096 count=1 skip=1557207 seek=1557207 conv=fsync oflag=direct


1+0 enregistrements lus
1+0 enregistrements écrits
4096 octets (4,1 kB, 4,0 KiB) copiés, 0,704778 s, 5,8 kB/s



smartctl -t short /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Thu Nov 21 10:38:35 2019

Use smartctl -X to abort test.



smartctl -a /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD40EFRX-68WT0N0
Serial Number:    WD-WCC4E4LZFZ01
LU WWN Device Id: 5 0014ee 20db380bb
Firmware Version: 82.00A82
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Nov 21 10:39:54 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
          was completed without error.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 121) The previous self-test completed having
          the read element of the test failed.
Total time to complete Offline
data collection:    (51840) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    ( 518) minutes.
Conveyance self-test routine
recommended polling time:    (   5) minutes.
SCT capabilities:          (0x703d) SCT Status supported.
          SCT Error Recovery Control supported.
          SCT Feature Control supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       140
  3 Spin_Up_Time            0x0027   205   176   021    Pre-fail  Always       -       6750
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3445
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       12726
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3192
192 Power-Off_Retract_Count 0x0032   199   199   000    Old_age   Always       -       1094
193 Load_Cycle_Count        0x0032   198   198   000    Old_age   Always       -       6174
194 Temperature_Celsius     0x0022   123   103   000    Old_age   Always       -       29
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       3
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       26

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%     12726         12491568
# 2  Short offline       Completed: read failure       90%     12724         12457656
# 3  Short offline       Completed: read failure       90%     12701         12457656
# 4  Extended offline    Completed: read failure       90%     12701         12457656
# 5  Extended offline    Completed: read failure       90%     12696         12457656
# 6  Extended offline    Completed: read failure       90%     12682         12452296
# 7  Extended offline    Completed: read failure       90%     12674         12452296
# 8  Extended offline    Completed: read failure       90%     12670         12452296
# 9  Extended offline    Completed: read failure       90%     12668         12452296
#10  Short offline       Completed: read failure       90%     12665         12452296
#11  Short offline       Completed: read failure       90%     12665         12452296
#12  Short offline       Completed without error       00%     10995         -
#13  Short offline       Completed without error       00%      6774         -
#14  Short offline       Completed without error       00%      1134         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.



bon , apparemment , irrésolvable .

j'a merdé qque part ?

en attendant , toujours pas de rapport du daemon ...

Dernière modification par Debian Alain (21-11-2019 10:46:05)

Hors ligne

#24 21-11-2019 11:28:52

raleur
Membre
Inscription : 03-10-2014

Re : [clos] dépannage hdd 4 To red raid 1

Non, regarde bien : l'adresse de première erreur a changé et le nombre de secteurs en pending a diminué.
Il faut refaire l'opération avec cette nouvelle adresse 12491568/8 = 1561446 dans dd

Il vaut mieux montrer que raconter.

Hors ligne

#25 21-11-2019 11:58:08

Debian Alain
Membre
Lieu : Bretagne
Distrib. : sid (unstable) / bullseye (stable)
Noyau : Linux sid 6.4.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [clos] dépannage hdd 4 To red raid 1

ok , je recommence .

sudo dd if=/dev/sdi of=/dev/sdj bs=4096 count=1 skip=1561446 seek=1557207 conv=fsync oflag=direct


[sudo] Mot de passe de alain :
1+0 enregistrements lus
1+0 enregistrements écrits
4096 octets (4,1 kB, 4,0 KiB) copiés, 0,0619376 s, 66,1 kB/s



sudo smartctl -t short /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 2 minutes for test to complete.
Test will complete after Thu Nov 21 11:51:32 2019

Use smartctl -X to abort test.



sudo smartctl -a /dev/sdj


smartctl 7.0 2018-12-30 r4883 [x86_64-linux-5.2.0-3-amd64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Red
Device Model:     WDC WD40EFRX-68WT0N0
Serial Number:    WD-WCC4E4LZFZ01
LU WWN Device Id: 5 0014ee 20db380bb
Firmware Version: 82.00A82
User Capacity:    4000787030016 bytes [4,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Thu Nov 21 11:53:02 2019 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
          was completed without error.
          Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 121) The previous self-test completed having
          the read element of the test failed.
Total time to complete Offline
data collection:    (51840) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    ( 518) minutes.
Conveyance self-test routine
recommended polling time:    (   5) minutes.
SCT capabilities:          (0x703d) SCT Status supported.
          SCT Error Recovery Control supported.
          SCT Feature Control supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       140
  3 Spin_Up_Time            0x0027   205   176   021    Pre-fail  Always       -       6750
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3445
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   083   083   000    Old_age   Always       -       12728
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3192
192 Power-Off_Retract_Count 0x0032   199   199   000    Old_age   Always       -       1094
193 Load_Cycle_Count        0x0032   198   198   000    Old_age   Always       -       6174
194 Temperature_Celsius     0x0022   123   103   000    Old_age   Always       -       29
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       3
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       26

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed: read failure       90%     12728         12491569
# 2  Short offline       Completed: read failure       90%     12726         12491568
# 3  Short offline       Completed: read failure       90%     12724         12457656
# 4  Short offline       Completed: read failure       90%     12701         12457656
# 5  Extended offline    Completed: read failure       90%     12701         12457656
# 6  Extended offline    Completed: read failure       90%     12696         12457656
# 7  Extended offline    Completed: read failure       90%     12682         12452296
# 8  Extended offline    Completed: read failure       90%     12674         12452296
# 9  Extended offline    Completed: read failure       90%     12670         12452296
#10  Extended offline    Completed: read failure       90%     12668         12452296
#11  Short offline       Completed: read failure       90%     12665         12452296
#12  Short offline       Completed: read failure       90%     12665         12452296
#13  Short offline       Completed without error       00%     10995         -
#14  Short offline       Completed without error       00%      6774         -
#15  Short offline       Completed without error       00%      1134         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.



je crois que je recommence avec  12491569/8

donc :

 sudo dd if=/dev/sdi of=/dev/sdj bs=4096 count=1 skip=1561446 seek=1561446 conv=fsync oflag=direct


c'est bon ?

Hors ligne

Pied de page des forums