logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 20-01-2016 10:08:35

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

[Résolu] Alerte disque dur (a fait son temps ?)

Bonjour les DF,

Un message inquiétant ce matin en démarrant mon ordi : invitation à sauvegarder mes données car le disque va bientôt flancher.
Je n'ai pas noté le message exact mais ça nommait le secteur (S1). Amorce du disque ?

Je tape F1 pour continuer puis grub s'affiche normalement, je boot sur Debian et tout à l'air de fonctionner.

Y a-t-il moyen d'en savoir plus sur cette erreur ?
J'imagine qu'il vaut mieux éviter d'arrêter ou redémarrer mon ordi en attendant d'avoir un disque de rechange pour réinstaller tout mon système.

Rien vu de spécial sur la commande dmesg, quelques warning mais ce sont les même que d'habitude et rien de grave d'après mes recherches sur le oueb.

Infos utiles :
Ordi portable Dell studio, age bientôt 6 ans. Debian est en dual boot avec W7.
W n'a pas été démarré depuis 2-3 semaines.

En attendant j'ai déjà sauvegardé mon /home + le /etc et le /var, ainsi que ma liste des paquets installés.
Comme cette sauvegarde est faite sur un disque externe en ext4, je suis en train d'en faire une seconde avec seulement mes documents/photos et bases de données sur une partition en ntfs (du même disque externe), pour le cas où je doive ressortir mon ancien portable sous Vistanosaure pour bosser "en urgence"

Dernière modification par Mercredi (20-01-2016 15:12:36)

Hors ligne

#2 20-01-2016 10:17:51

paskal
autobahn
Lieu : ailleurs
Inscription : 14-06-2011
Site Web

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Bonjour aujourd Mercredi  smile

Je pense qu'il faut que tu t'intéresses d'urgence à smartmontools
Le ouiqui : https://debian-facile.org/doc:systeme:smartmontools

I'd love to change the world
But I don't know what to do
So I'll leave it up to you...

logo-sur-fond.png

Hors ligne

#3 20-01-2016 10:21:44

Anonyme-8
Invité

Re : [Résolu] Alerte disque dur (a fait son temps ?)

il y a cet utilitaire qui permet d'obtenir des infos sur un disque dur
https://debian-facile.org/doc:systeme:smartmontools

le pb c'est que qu'il est difficile d'en tirer des conclusions.

sinon, il y a un utilitaire qui doit se nommer "Disque" qui permet également de déterminer la santé de ton disque dur.

#4 20-01-2016 10:33:26

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Merci, je termine mes sauvegardes pour parer au plus pressé et je regarde ça en détail, et surtout en étant plus zen une fois mes données sauves wink

Hors ligne

#5 20-01-2016 10:35:11

Mugen
Membre
Distrib. : Debian Bookworm
Noyau : Linux 6.1.0-9-amd64
(G)UI : Mate
Inscription : 04-02-2014

Re : [Résolu] Alerte disque dur (a fait son temps ?)

pour l'utilitaire Disques il em semble qu'il n'est pas installé par défaut, le paquet à installer c'est gnome-disk-utility

mon ancien pseudo : bartaba

Hors ligne

#6 20-01-2016 10:36:23

Anonyme-8
Invité

Re : [Résolu] Alerte disque dur (a fait son temps ?)

je te rassure,  un disque dur n'explose pas tongue
tu fais bien de faire des sauvegardes mais c'est juste un message d'alerte.

#7 20-01-2016 10:46:11

anonyme
Invité

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Bonjour,

Le message intervenant avant le menu GRUB indique que c'est l'utilitaire SMART de la carte mère qui à détecté le problème. Les utilitaires du paquet smartmontools te donneront des indications sur l'état de santé des disques. Ils utilisent pour cela la même techno que celui de la carte-mère (SMART) donc on peut s'attendre à une confirmation de l'alerte, avec plus de détails. Dans tous les cas il est urgent de sauvegarder tout ce qui doit l'être sur ce disque, car si on ne peut pas être certain que SMART détecte à tous les coups une défaillance imminente, on peut par contre lui faire confiance quand il détecte un problème.

Il faut donc installer le paquet smartmontools et lancer un test sur le disque considéré, par exemple

smartctl -t long /dev/sda


en adaptant /dev/sda selon le cas

À noter que selon la taille du disque un test "long" peut durer plusieurs heures (1 heure par To de mon expérience)
Ensuite il faut lancer

smartctl -a /dev/sda


en adaptant ici aussi le /dev/sda selon le cas.
Tu peux ensuite copier le résultat du test ici.

Edit: il me semble qu'il est déconseillé d'avoir à la fois la surveillance des disques active au niveau de la carte-mère et des smartmontools. Il vaut donc peut-être mieux désactiver temporairement l'option de surveillance des disques sur la CM.

Dernière modification par anonyme (20-01-2016 10:54:14)

#8 20-01-2016 10:58:52

Anonyme-8
Invité

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Dans certains cas, on peut détecter des alertes sans avoir de pb et la situation peut durer un moment.
Évidemment, une sauvegarde est à recommander dans ce cas.

En règle générale, dés que j'ai une alerte je change de disque et le réutilise comme disque dur externe.
C'est comme le papier toilette, on préférera anticiper la fin du rouleau plutôt que faire face à un rouleau vide et se retrouver dans une situation délicate.

#9 20-01-2016 11:15:58

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Anonyme-8 a écrit :

je te rassure,  un disque dur n'explose pas tongue


lol J'ai un Dolibarr qui me sert à faire ma compta et mes factures, d'où le stress tongue

Mais ça y est, tout est fini de sauver, y compris dans un format qui me permet d'installer ma compta sur Vistanausore si besoin était.
Un nouveau disque est en commande pour anticiper ...
Je vais pouvoir étudier ce que donne Smartmontools et je vous redis

Hors ligne

#10 20-01-2016 11:27:06

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Je commence par le plus simple : l'utilitaire disque avec une belle phrase en rouge :

LE DISQUE VA PROBABLEMENT BIENTÔT TOMBER EN PANNE (35 ℃ / 95 ℉)



Gloups !

Hors ligne

#11 20-01-2016 11:39:00

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Avec Smartmontools, en suivant le wiki :

smartctl --all /dev/sda


=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
See vendor-specific Attribute list for failed Attributes.
 


Je n'ai mis que l'extrait qui me semble pertinent.

Au vu du résultat est-ce utile de lancer un test "long" ?

Hors ligne

#12 20-01-2016 11:40:38

Anonyme-8
Invité

Re : [Résolu] Alerte disque dur (a fait son temps ?)

pour confirmer utilise smartontools et donne le résultat.

je te conseille maintenant d'utiliser au minimum ton ordinateur le temps de changer de disque dur, sauf si tu es sûre d'avoir sauvegarder correctement toutes tes données.

#13 20-01-2016 11:49:33

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

ok, 109 minutes pour le test long. Résultats cet après-midi.

Je vais commencer à dépoussiérer vistanausore, comme ça je laisserai mon ordi tranquille pendant ce temps.
J'ai encore de la chance de ne pas avoir trop de taf aujourd'hui.

Bon app' à tous smile

Hors ligne

#14 20-01-2016 13:43:32

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Le retour de la commande :

smartctl -a /dev/sda


smartctl 6.4 2014-10-07 r4002 [x86_64-linux-3.16.0-4-amd64] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Momentus 7200.4
Device Model:     ST9500420AS
Serial Number:    5VJ5645M
LU WWN Device Id: 5 000c50 024836857
Firmware Version: D005SDM1
User Capacity:    500 107 862 016 bytes [500 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 4
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Wed Jan 20 13:42:19 2016 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
See vendor-specific Attribute list for failed Attributes.

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
          was never started.
          Auto Offline Data Collection: Disabled.
Self-test execution status:      (  73) The previous self-test completed having
          a test element that failed and the test
          element that failed is not known.
Total time to complete Offline
data collection:    (    0) seconds.
Offline data collection
capabilities:        (0x73) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          No Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    ( 109) minutes.
Conveyance self-test routine
recommended polling time:    (   3) minutes.
SCT capabilities:          (0x103f) SCT Status supported.
          SCT Error Recovery Control supported.
          SCT Feature Control supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   119   090   006    Pre-fail  Always       -       220055647
  3 Spin_Up_Time            0x0003   098   098   085    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   098   098   020    Old_age   Always       -       2562
  5 Reallocated_Sector_Ct   0x0033   036   036   036    Pre-fail  Always   FAILING_NOW 1312
  7 Seek_Error_Rate         0x000f   085   060   030    Pre-fail  Always       -       4639932917
  9 Power_On_Hours          0x0032   079   079   000    Old_age   Always       -       18955
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   098   037   020    Old_age   Always       -       2554
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   001   001   000    Old_age   Always       -       624
188 Command_Timeout         0x0032   100   099   000    Old_age   Always       -       2
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   067   053   045    Old_age   Always       -       33 (Min/Max 16/38)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       56
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   001   001   000    Old_age   Always       -       543313
194 Temperature_Celsius     0x0022   033   047   000    Old_age   Always       -       33 (0 8 0 0 0)
195 Hardware_ECC_Recovered  0x001a   046   027   000    Old_age   Always       -       220055647
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       15422 (1 240 0)
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       4144916472
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       2601278809
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed: unknown failure    90%     18953         0
# 2  Short offline       Completed without error       00%      3596         -
# 3  Short offline       Completed without error       00%      3290         -
# 4  Short offline       Completed without error       00%      3027         -
# 5  Short offline       Completed without error       00%      2855         -
# 6  Short offline       Completed without error       00%      2684         -
# 7  Short offline       Completed without error       00%      2527         -
# 8  Short offline       Completed without error       00%      2382         -
# 9  Short offline       Completed without error       00%      2238         -
#10  Short offline       Completed without error       00%      2151         -
#11  Extended offline    Completed without error       00%         2         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 



Hum -a et --all c'est la même chose non ?

Du coup comment je récupère le résultat du test long ? J'ai eu un message comme quoi il serait disponible après 109 minutes mais je n'ai pas compris comment le récupérer hmm

Dernière modification par Mercredi (20-01-2016 13:50:59)

Hors ligne

#15 20-01-2016 14:38:09

anonyme
Invité

Re : [Résolu] Alerte disque dur (a fait son temps ?)

L'option -a est identique à --all. C'est elle qui fournit le résultat du test.

Ce qu'on peut voir, c'est que le disque à épuisé tous ses secteurs de réserve (Reallocated_Sector_Ct) mais que tu n'as pas encore perdu de données à ce stade (Current_Pending_Sector et Offline_Uncorrectable sont nuls).
Concernant l'origine du problème, je penche pour une usure (Raw_Read_Error_Rate, Seek_Error_Rate) liée à l'age (Power_On_Hours - presque 19000 heures de fonctionnement) mais surtout au grand nombre de Load_Cycle_Count. Ceci est souvent lié à la gestion de l'énergie (quelquefois au fabricant du hd ou du pc) qui induit des parquages de têtes fréquents. Ça peut se gérer sous Linux avec hdparm, mais pour ce disque ci c'est un peu tard. hmm

On voit aussi que tu as interrompu un test long à 90% de complétion. Il faut attendre la fin du test avant de lancer le smartctl -a (cf mon premier post).

#16 20-01-2016 14:57:25

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

ok, je vais relancer le test long alors (je m'était fiée à la durée annoncée mais cette fois je le laisserai faire plus longtemps).
Et aller me renseigner sur hdparm pour le prochain disque, avec un peu de chance je l'aurais demain ou après demain.

Merci pour les explications détaillées, ça m'aide à comprendre et surtout à lire un peu mieux par moi même le résultat de la commande smile

Hors ligne

#17 20-01-2016 15:05:10

anonyme
Invité

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Il n'est pas utile de relancer le test, les résultats que tu as donnés sont ceux du test suivant (18955 heures contre 18953 pour celui avorté).

#18 20-01-2016 15:11:53

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Trop tard tongue
C'est pas grave, un peu plus ou un peu moins mon disque n'en a plus pour longtemps de toute façon.

Bon du coup je passe le sujet en résolu : disque vieux et usé.

Encore merci à tous pour votre aide smile  cool

Hors ligne

#19 20-01-2016 15:16:01

raleur
Membre
Inscription : 03-10-2014

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Je confirme globalement l'analyse de tux12, bien que les valeurs des attributs Raw_Read_Error_Rate et Seek_Error_Rate ne me semblent pas alarmantes.
Le disque a bien fait son boulot en réallouant les secteurs défectueux avant qu'ils deviennent illisibles (ce n'est pas toujours le cas), évitant la perte de données, mais maintenant il arrive "au bout du rouleau" du stock de réserver.

Concernant l'urgence, je suis plus dubitatif. Il aurait fallu avoir l'historique de réallocation pour voir si c'est récent (donc brutal, remplacement urgent) ou étalé sur une longue période (donc progressif, remplacement moins urgent).

Il vaut mieux montrer que raconter.

Hors ligne

#20 20-01-2016 15:21:20

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Y a-t-il un moyen pour connaitre l'historique de ré-allocation ? et éventuellement de surveiller ça ?

Hors ligne

#21 20-01-2016 15:23:41

raleur
Membre
Inscription : 03-10-2014

Re : [Résolu] Alerte disque dur (a fait son temps ?)

A posteriori, je n'en connais pas. Il aurait fallu enregistrer régulièrement les valeurs des attributs avec smartd (inclus dans smartmontools) ou autre.

Il vaut mieux montrer que raconter.

Hors ligne

#22 20-01-2016 15:29:43

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Merci, je vais étudier smartmontools de plus près également smile
Ma liste va devenir sans fin à force lol

Hors ligne

#23 20-01-2016 15:32:33

raleur
Membre
Inscription : 03-10-2014

Re : [Résolu] Alerte disque dur (a fait son temps ?)

En tout cas je ne pense pas que ces réallocations aient été causées par un seul événement catastrophique nécessitant un remplacement immédiat, car la valeur normalisée de l'attribut est juste au seuil, ce qui semble indiquer qu'elle a diminué progressivement. Tu peux continuer à surveiller l'attribut pour voir à quel rythme la valeur brute (RAW) continue à augmenter et la valeur normalisée (VALUE) continue à baisser.

PS :

tux12 a écrit :

il me semble qu'il est déconseillé d'avoir à la fois la surveillance des disques active au niveau de la carte-mère et des smartmontools.


Il n'y a pas de surveillance active au niveau de la carte mère, juste une vérification au démarrage par le BIOS/firmware. Quand bien même, je ne vois pas en quoi ce serait déconseillé. Ce n'est que de la lecture.


Il vaut mieux montrer que raconter.

Hors ligne

#24 20-01-2016 20:14:48

Mercredi
Membre
Distrib. : Testing/Sid
Noyau : 5.2
(G)UI : Gnome-shell
Inscription : 25-09-2015

Re : [Résolu] Alerte disque dur (a fait son temps ?)

Comme je disais plus haut le disque a 6 ans de bons et loyaux services donc je penche aussi pour des réallocations "dans le temps".

Sinon un truc qui peut servir pour les débutants qui débutent et qui ont du mal à lire les résultats du test en langage parfois un peu obscur du terminal :
Une fois que Smartmontools est installé, on peut aussi lancer le test long dans l'utilitaire disque de gnome ou juste lire le résultat du test fait précédemment en ligne de commande.
La lecture en mode graphique est plus facile à comprendre, et en plus si on compare les deux : ça fait avancer notre compréhension du "langage parfois obscur du terminal" smile

Edit pour corriger la bêtise que j'ai écrite :
Le menu "Données Smart et auto-test" de l'utilitaire de disque du bureau Gnome est une fonction native : ça marche sans le paquet Smartmontools mais je ne l'avais point vu avant. roll
Cette analyse n'est peut-être pas aussi complète que le test long de Smartmontools mais elle nous en apprend déjà beaucoup sur l'état du disque dur

Dernière modification par Mercredi (22-01-2016 10:19:44)

Hors ligne

Pied de page des forums