Debian Debian-France Debian-Facile Debian-fr.org Debian-fr.xyz Debian ? Communautés

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 15-10-2021 14:44:04

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

[Contourné] Problème aléatoire au lancement de Bullseye

Bonjour à toutes et à tous,
Depuis la mise à niveau de ma machine de Buster vers Bullseye, j'ai parfois ce problème au démarrage:
PB-Bullseye.png
Je suis obligé de l'éteindre de façon "sauvage" (désolé) et au redémarrage c'est OK après quelques lignes de correction qui suivent le "/dev/nvme0n1p1: clean...."
Avez-vous une idée sur ce qui peut provoquer cela ?
Merci.

Dernière modification par pomme (06-12-2021 15:22:11)

Hors ligne

#2 15-10-2021 14:55:59

Debian Alain
Adhérent(e)
Lieu : Bretagne
Distrib. : bookworm unstable sid / bullseye (stable)
Noyau : Linux sid 5.15.0-3-amd64
(G)UI : Gnome X.org (X11) / GDM3
Inscription : 11-03-2017
Site Web

Re : [Contourné] Problème aléatoire au lancement de Bullseye

bonjour pomme smile  smile  smile

que donne (au pif)  :

tail -n 100 /var/log/syslog



amicalement ,

alain.

coyotus.png

En ligne

#3 15-10-2021 15:00:38

raleur
Membre
Inscription : 03-10-2014

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Ça ne donnera rien d'intéressant car les 100 dernières lignes auront été produites par le dernier démarrage (réussi), pas le précédent qui a échoué. Il faudrait remonter beaucoup plus loin que 100 lignes, en supposant qu'il était encore possibe d'écrire dans les logs à ce moment (et je crains que ce soit le SSD qui coince en l'occurrence).

Les messages "task ... blocked" se produisent toujours après l'échec du démarrage du démon SMART ? Dans ce cas tu peux essayer de le désactiver pour voir si ça fait une différence.

Dernière modification par raleur (15-10-2021 15:03:22)


Il vaut mieux montrer que raconter.

En ligne

#4 15-10-2021 15:06:25

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Bonjour Alain,
Voici :

# tail -n 100 /var/log/syslog


Oct 15 14:15:36 Pomme kernel: [ 9844.273752] scsi host6: uas
Oct 15 14:15:36 Pomme kernel: [ 9844.273809] usbcore: registered new interface driver uas
Oct 15 14:15:36 Pomme mtp-probe: checking bus 2, device 2: "/sys/devices/pci0000:00/0000:00:14.0/usb2/2-4"
Oct 15 14:15:36 Pomme mtp-probe: bus: 2, device: 2 was not an MTP device
Oct 15 14:15:36 Pomme kernel: [ 9844.287395] scsi 6:0:0:0: Direct-Access     WDC  WDS 100T2B0A-00S     4010 PQ: 0 ANSI: 6
Oct 15 14:15:36 Pomme kernel: [ 9844.288619] sd 6:0:0:0: Attached scsi generic sg3 type 0
Oct 15 14:15:36 Pomme kernel: [ 9844.289511] sd 6:0:0:0: [sdc] 1953525168 512-byte logical blocks: (1.00 TB/932 GiB)
Oct 15 14:15:36 Pomme kernel: [ 9844.289633] sd 6:0:0:0: [sdc] Write Protect is off
Oct 15 14:15:36 Pomme kernel: [ 9844.289634] sd 6:0:0:0: [sdc] Mode Sense: 2f 00 00 00
Oct 15 14:15:36 Pomme kernel: [ 9844.289876] sd 6:0:0:0: [sdc] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Oct 15 14:15:36 Pomme kernel: [ 9844.290245] sd 6:0:0:0: [sdc] Optimal transfer size 33553920 bytes
Oct 15 14:15:36 Pomme kernel: [ 9844.399657]  sdc: sdc1
Oct 15 14:15:36 Pomme kernel: [ 9844.420468] sd 6:0:0:0: [sdc] Attached SCSI disk
Oct 15 14:15:40 Pomme ntfs-3g[157475]: Version 2017.3.23AR.3 integrated FUSE 28
Oct 15 14:15:40 Pomme udisksd[552]: Mounted /dev/sdc1 at /media/pomme/Films on behalf of uid 1000
Oct 15 14:15:40 Pomme ntfs-3g[157475]: Mounted /dev/sdc1 (Read-Write, label "Films", NTFS 3.1)
Oct 15 14:15:40 Pomme ntfs-3g[157475]: Cmdline options: rw,nodev,nosuid,uid=1000,gid=1000,windows_names,uhelper=udisks2
Oct 15 14:15:40 Pomme ntfs-3g[157475]: Mount options: nodev,nosuid,uhelper=udisks2,allow_other,nonempty,relatime,rw,default_permissions,fsname=/dev/sdc1,blkdev,blksize=4096
Oct 15 14:15:40 Pomme ntfs-3g[157475]: Global ownership and permissions enforced, configuration type 7
Oct 15 14:17:00 Pomme kernel: [ 9928.696016] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:17:01 Pomme CRON[158882]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Oct 15 14:17:23 Pomme smartd[550]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 81 to 75
Oct 15 14:17:23 Pomme smartd[550]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 19 to 25
Oct 15 14:17:34 Pomme ntfs-3g[157475]: Unmounting /dev/sdc1 (Films)
Oct 15 14:17:34 Pomme systemd[1]: media-pomme-Films.mount: Succeeded.
Oct 15 14:17:34 Pomme systemd[1348]: media-pomme-Films.mount: Succeeded.
Oct 15 14:17:34 Pomme udisksd[552]: Cleaning up mount point /media/pomme/Films (device 8:33 is not mounted)
Oct 15 14:17:34 Pomme udisksd[552]: Unmounted /dev/sdc1 on behalf of uid 1000
Oct 15 14:17:42 Pomme udisksd[552]: Successfully sent SCSI command SYNCHRONIZE CACHE to /dev/sdc
Oct 15 14:17:42 Pomme udisksd[552]: Successfully sent SCSI command START STOP UNIT to /dev/sdc
Oct 15 14:17:42 Pomme kernel: [ 9970.562640] sd 6:0:0:0: [sdc] Synchronizing SCSI cache
Oct 15 14:17:42 Pomme kernel: [ 9970.813946] sd 6:0:0:0: [sdc] Synchronize Cache(10) failed: Result: hostbyte=DID_ERROR driverbyte=DRIVER_OK
Oct 15 14:17:42 Pomme udisksd[552]: Powered off /dev/sdc - successfully wrote to sysfs path /sys/devices/pci0000:00/0000:00:14.0/usb2/2-4/remove
Oct 15 14:17:42 Pomme kernel: [ 9970.902377] usb 2-4: USB disconnect, device number 2
Oct 15 14:19:05 Pomme kernel: [10053.686458] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:20:03 Pomme dbus-daemon[540]: [system] Activating via systemd: service name='org.freedesktop.hostname1' unit='dbus-org.freedesktop.hostname1.service' requested by ':1.210' (uid=1000 pid=161391 comm="xfce4-screenshooter ")
Oct 15 14:20:03 Pomme systemd[1]: Starting Hostname Service...
Oct 15 14:20:03 Pomme dbus-daemon[540]: [system] Successfully activated service 'org.freedesktop.hostname1'
Oct 15 14:20:03 Pomme systemd[1]: Started Hostname Service.
Oct 15 14:20:34 Pomme systemd[1]: systemd-hostnamed.service: Succeeded.
Oct 15 14:21:10 Pomme kernel: [10178.676841] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:21:15 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:21:15 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:22:47 Pomme dbus-daemon[540]: [system] Activating via systemd: service name='org.freedesktop.hostname1' unit='dbus-org.freedesktop.hostname1.service' requested by ':1.214' (uid=1000 pid=43239 comm="firefox-esr ")
Oct 15 14:22:47 Pomme systemd[1]: Starting Hostname Service...
Oct 15 14:22:47 Pomme dbus-daemon[540]: [system] Successfully activated service 'org.freedesktop.hostname1'
Oct 15 14:22:47 Pomme systemd[1]: Started Hostname Service.
Oct 15 14:23:15 Pomme kernel: [10303.667314] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:23:17 Pomme systemd[1]: systemd-hostnamed.service: Succeeded.
Oct 15 14:24:16 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:24:16 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:24:59 Pomme dbus-daemon[540]: [system] Activating via systemd: service name='org.freedesktop.hostname1' unit='dbus-org.freedesktop.hostname1.service' requested by ':1.217' (uid=1000 pid=43239 comm="firefox-esr ")
Oct 15 14:24:59 Pomme systemd[1]: Starting Hostname Service...
Oct 15 14:24:59 Pomme dbus-daemon[540]: [system] Successfully activated service 'org.freedesktop.hostname1'
Oct 15 14:24:59 Pomme systemd[1]: Started Hostname Service.
Oct 15 14:25:20 Pomme kernel: [10428.657725] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:25:29 Pomme systemd[1]: systemd-hostnamed.service: Succeeded.
Oct 15 14:25:40 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:25:40 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:27:25 Pomme kernel: [10553.648198] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:29:30 Pomme kernel: [10678.638636] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:29:42 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:29:42 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:30:01 Pomme CRON[170724]: (root) CMD ([ -x /etc/init.d/anacron ] && if [ ! -d /run/systemd/system ]; then /usr/sbin/invoke-rc.d anacron start >/dev/null; fi)
Oct 15 14:30:08 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:30:08 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:30:17 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:30:17 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:30:20 Pomme dbus-daemon[540]: [system] Activating via systemd: service name='org.freedesktop.hostname1' unit='dbus-org.freedesktop.hostname1.service' requested by ':1.223' (uid=1000 pid=43239 comm="firefox-esr ")
Oct 15 14:30:20 Pomme systemd[1]: Starting Hostname Service...
Oct 15 14:30:20 Pomme dbus-daemon[540]: [system] Successfully activated service 'org.freedesktop.hostname1'
Oct 15 14:30:20 Pomme systemd[1]: Started Hostname Service.
Oct 15 14:30:50 Pomme systemd[1]: systemd-hostnamed.service: Succeeded.
Oct 15 14:31:35 Pomme kernel: [10803.629119] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:32:55 Pomme systemd[1]: Started Run anacron jobs.
Oct 15 14:32:55 Pomme anacron[173313]: Anacron 2.3 started on 2021-10-15
Oct 15 14:32:55 Pomme anacron[173313]: Normal exit (0 jobs run)
Oct 15 14:32:55 Pomme systemd[1]: anacron.service: Succeeded.
Oct 15 14:33:40 Pomme kernel: [10928.619538] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:35:11 Pomme systemd[1]: fwupd.service: Succeeded.
Oct 15 14:35:11 Pomme systemd[1]: fwupd.service: Consumed 1.102s CPU time.
Oct 15 14:35:17 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:35:17 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:35:45 Pomme kernel: [11053.609908] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:37:50 Pomme kernel: [11178.600440] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:39:04 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:39:04 Pomme rtkit-daemon[1414]: Supervising 7 threads of 4 processes of 1 users.
Oct 15 14:39:55 Pomme kernel: [11303.590922] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:42:00 Pomme kernel: [11428.581386] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:44:05 Pomme kernel: [11553.571803] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:46:10 Pomme kernel: [11678.562288] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:47:23 Pomme smartd[550]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 75 to 73
Oct 15 14:47:23 Pomme smartd[550]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 25 to 27
Oct 15 14:48:15 Pomme kernel: [11803.552717] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:50:20 Pomme kernel: [11928.543244] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:52:25 Pomme kernel: [12053.533645] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:54:30 Pomme kernel: [12178.524093] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:56:35 Pomme kernel: [12303.514614] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 14:58:40 Pomme kernel: [12428.505106] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
Oct 15 15:00:45 Pomme kernel: [12553.495583] [UFW BLOCK] IN=eno1 OUT= MAC=01:00:5e:00:00:01:74:da:88:76:6e:73:08:00 SRC=192.168.1.1 DST=224.0.0.1 LEN=36 TOS=0x00 PREC=0x00 TTL=1 ID=0 DF PROTO=2
 

Hors ligne

#5 15-10-2021 15:08:33

Tawal
Membre
Distrib. : Debian 11 Bullseye
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 25-02-2021

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Hello,

On peut trouver les erreurs dans le journal non ?
Donc en considérant que le boot avant le démarrage réussi a bloqué, on devrait les trouver ainsi :

journalctl -b -1 -p err



De plus, ton kernel (noyau) n'est pas à jour.
On en est au 5.10.0-9

Edit:
Comme disais raleur, on a dans ton dernier post que les messages du démarrage réussi.

Dernière modification par Tawal (15-10-2021 15:12:19)


Comme la science n'est pas infuse, elle se diffuse.
Useless Use of Cat Award
Filenames and Pathnames in Shell: How to do it Correctly
À chaque problème sa solution, à chaque solution son moyen, si pas de moyen, toujours le problème !

Hors ligne

#6 15-10-2021 15:26:33

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Bonjour Tawal,
Voici:

journalctl -b -1 -p err


-- Journal begins at Thu 2021-09-09 09:42:23 CEST, ends at Fri 2021-10-15 15:21:35 CEST. --
oct. 15 08:45:43 Pomme smartd[542]: Device: /dev/nvme0, number of Error Log entries increased from 409 to 410


Mon noyau est bien : 5.10.0.9
Merci. smile

Dernière modification par pomme (15-10-2021 15:26:45)

Hors ligne

#7 15-10-2021 15:31:23

Tawal
Membre
Distrib. : Debian 11 Bullseye
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 25-02-2021

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Bon, comme le pressentais raleur, le SSD a des soucis.

Edit:
Étonné de ne voir que cette erreur !

Dernière modification par Tawal (15-10-2021 15:32:59)


Comme la science n'est pas infuse, elle se diffuse.
Useless Use of Cat Award
Filenames and Pathnames in Shell: How to do it Correctly
À chaque problème sa solution, à chaque solution son moyen, si pas de moyen, toujours le problème !

Hors ligne

#8 15-10-2021 15:40:01

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

Re : [Contourné] Problème aléatoire au lancement de Bullseye

smartctl -a /dev/nvme0n1p1



smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.10.0-9-amd64] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       KINGSTON SA1000M8240G
Serial Number:                      50026B7682AA1325
Firmware Version:                   E8FK11.R
PCI Vendor/Subsystem ID:            0x2646
IEEE OUI Identifier:                0x0026b7
Total NVM Capacity:                 240057409536 [240 GB]
Unallocated NVM Capacity:           0
Controller ID:                      0
NVMe Version:                       1.2
Number of Namespaces:               1
Namespace 1 Size/Capacity:          240057409536 [240 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            0026b7 682aa13255
Local Time is:                      Fri Oct 15 15:33:44 2021 CEST
Firmware Updates (0x02):            1 Slot
Optional Admin Commands (0x0007):   Security Format Frmw_DL
Optional NVM Commands (0x001e):     Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Log Page Attributes (0x04):         Ext_Get_Lg
Maximum Data Transfer Size:         512 Pages
Warning  Comp. Temp. Threshold:     84 Celsius
Critical Comp. Temp. Threshold:     88 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     7.90W  0.0790W       -    0  0  0  0      600     600
 1 +     7.90W  0.0790W       -    0  0  0  0      600     600
 2 +     7.90W  0.0790W       -    0  0  0  0      600     600
 3 -   0.1000W  0.0790W       -    3  3  3  3     1000    1000
 4 -   0.0050W  0.0790W       -    4  4  4  4   400000   90000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         1
 1 -    4096       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        32 Celsius
Available Spare:                    100%
Available Spare Threshold:          100%
Percentage Used:                    1%
Data Units Read:                    4022526 [2,05 TB]
Data Units Written:                 3050324 [1,56 TB]
Host Read Commands:                 53657374
Host Write Commands:                29309438
Controller Busy Time:               23
Power Cycles:                       1460
Power On Hours:                     1779
Unsafe Shutdowns:                   13
Media and Data Integrity Errors:    0
Error Information Log Entries:      411
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 2:               32 Celsius

Error Information (NVMe Log 0x01, 16 of 16 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0        411     0  0x000e  0x0005      -     33555712     0     -
  1        410     0  0x000e  0x0005      -     33555712     0     -
  2        409     0  0x000e  0x0005      -     33555712     0     -
  3        408     0  0x000e  0x0005      -     33555712     0     -
  4        407     0  0x000e  0x0005      -     33555712     0     -
  5        406     0  0x000e  0x0005      -     33555712     0     -
  6        405     0  0x000e  0x0005      -     33555712     0     -
  7        404     0  0x000e  0x0005      -     33555712     0     -
  8        403     0  0x0069  0x0213      -      8323077     -     -
  9        402     0  0x004f  0x0213      -      8323077     -     -
 10        401     0  0x0002  0x0005      -          208     0     -
 11        400     0  0x000e  0x0005      -     33555712     0     -
 12        399     0  0x000e  0x0005      -     33555712     0     -
 13        398     0  0x000e  0x0005      -     33555712     0     -
 14        397     0  0x000e  0x0005      -     33555712     0     -
 15        396     0  0x000e  0x0005      -     33555712     0     -
 

Hors ligne

#9 15-10-2021 15:59:26

robert2a
Membre
Distrib. : Arch Linux
(G)UI : Mate
Inscription : 15-11-2014

Re : [Contourné] Problème aléatoire au lancement de Bullseye

pomme a écrit :

Bonjour Tawal,
Voici:

journalctl -b -1 -p err


-- Journal begins at Thu 2021-09-09 09:42:23 CEST, ends at Fri 2021-10-15 15:21:35 CEST. --
oct. 15 08:45:43 Pomme smartd[542]: Device: /dev/nvme0, number of Error Log entries increased from 409 to 410


Mon noyau est bien : 5.10.0.9
Merci. smile



j'ai ce message avec un ssd nvme , j'ai résolu en supprimant smartmontools
le ssd fonctionne bien , pas d'erreur mais il donne le même message que toi


Device: /dev/nvme0, number of Error Log entries increased from 409 to 410
 


il doit y avoir des traces sur le forum
aucune erreur sur le syslog a propos du ssd , c'est smartd qui bug
a l'époque rien trouver sur le net a propos de cette erreur

le mien c'est un Samsung SSD 960 EVO 250GB  =>  https://debian-facile.org/viewtopic.php?id=28053

en fait j'ai menti tongue , pas résolu mais virer smartmontools , c'est survenue suite a une mise a jour sur debian
ça le fait pas sur tous les ssd , mais entre en recherche ton erreur , tu est pas le seul sur le net

Dernière modification par robert2a (15-10-2021 16:19:18)

Hors ligne

#10 15-10-2021 17:41:40

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Bonjour Robert,
Tu écris pourtant dans le dernier  post https://debian-facile.org/viewtopic.php … 52#p340652

Bonjour
résolu changé le disque nvme M2 par un ssd 2.5

Dernière modification par pomme (15-10-2021 18:01:29)

Hors ligne

#11 15-10-2021 18:33:40

Tawal
Membre
Distrib. : Debian 11 Bullseye
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 25-02-2021

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Désactive le service smartd (raleur te l'avais conseillé) :

systemctl disable smartd.service


Et regarde si les problèmes de démarrage sont toujours là.


Comme la science n'est pas infuse, elle se diffuse.
Useless Use of Cat Award
Filenames and Pathnames in Shell: How to do it Correctly
À chaque problème sa solution, à chaque solution son moyen, si pas de moyen, toujours le problème !

Hors ligne

#12 15-10-2021 19:06:21

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Je vais le faire demain matin ,mais il faudra attendre plusieurs jours car le pb n'est pas permanent.
Quelqu'un peut me dire ce qu'il faut penser de mon post #8 ?
Merci smile

Hors ligne

#13 15-10-2021 19:14:52

robert2a
Membre
Distrib. : Arch Linux
(G)UI : Mate
Inscription : 15-11-2014

Re : [Contourné] Problème aléatoire au lancement de Bullseye

non il est toujours la le bougre  tongue cool


ls /dev/ | grep nvme
 


retour


nvme0
nvme0n1
nvme0n1p1
nvme0n1p2
nvme0n1p3
 




dmesg | grep -i nvme
 



[    0.956798] nvme nvme0: pci function 0000:41:00.0
[    0.980244] nvme nvme0: 7/0/0 default/read/poll queues
[    0.986238]  nvme0n1: p1 p2 p3
[    4.482011] EXT4-fs (nvme0n1p2): mounted filesystem with ordered data mode. Opts: (null)
[    4.750097] EXT4-fs (nvme0n1p2): re-mounted. Opts: errors=remount-ro
[    5.132040] Adding 8191996k swap on /dev/nvme0n1p3.  Priority:-2 extents:1 across:8191996k SSFS
 



apt policy smartmontools
 



smartmontools:
  Installé : (aucun)
  Candidat : 7.2-1
 Table de version :
     7.2-1 500
        500 https://deb.debian.org/debian bullseye/main amd64 Packages
 


ps: smartmontools n'est pas installé de base sur debian

Hors ligne

#14 15-10-2021 19:22:04

Tawal
Membre
Distrib. : Debian 11 Bullseye
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 25-02-2021

Re : [Contourné] Problème aléatoire au lancement de Bullseye

pomme a écrit :

Quelqu'un peut me dire ce qu'il faut penser de mon post #8 ?


Il est possible que ce soit un bug de smartmontools sur ce type de DD.
Mais il est aussi possible que ce ne le soit pas.
Pas assez calé dans ce domaine pour te donner une réponse plus claire sad

pomme a écrit :

Power On Hours:                     1779


Me ferait dire que les erreurs sont dues à un bug.

Mais

pomme a écrit :

Unsafe Shutdowns:                   13


est peut-être la cause des erreurs.


Comme la science n'est pas infuse, elle se diffuse.
Useless Use of Cat Award
Filenames and Pathnames in Shell: How to do it Correctly
À chaque problème sa solution, à chaque solution son moyen, si pas de moyen, toujours le problème !

Hors ligne

#15 15-10-2021 19:28:25

robert2a
Membre
Distrib. : Arch Linux
(G)UI : Mate
Inscription : 15-11-2014

Re : [Contourné] Problème aléatoire au lancement de Bullseye

pomme a écrit :

Je vais le faire demain matin ,mais il faudra attendre plusieurs jours car le pb n'est pas permanent.
Quelqu'un peut me dire ce qu'il faut penser de mon post #8 ?
Merci smile



moi c'est le #1 qui m' inquiète , depuis combien de temps il tourne comme cela ?
moi j'ai testé de remettre plusieurs fois smartmontools , mais sans succès
désinstalle le et voit si correct
au pire tu teste ton disque sur windows avec l'utiltaire de la marque de ton ssd
même voir si un firmware disponible pour lui
ps: pour arriver a plus de 400 erreurs ça doit faire un moment , en général c'est une écriture a chaque démarrage de la machine
pour moi il a rien , au pire tu le change et tu le l'initailise (remise a 0)
on voit pas le nombre de cellule de réserve , le nombre de cellule HS etc ....
bref tu vois

Dernière modification par robert2a (15-10-2021 19:29:22)

Hors ligne

#16 15-10-2021 19:46:16

robert2a
Membre
Distrib. : Arch Linux
(G)UI : Mate
Inscription : 15-11-2014

Re : [Contourné] Problème aléatoire au lancement de Bullseye

modifier (format M2)
regarde ici sur un ssd M2 sata le retour , j'ai 8 cellules hs et plus de 1000 en réserve
de plus tu a lancer smartctl sur une partition pas sur le nvme => "nvme0" (a vérifier)
=> smartctl -a /dev/nvme0  (voir mon #13 pour les lister )


smartctl -a /dev/sdc
 



smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.14.0-2-amd64] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Crucial/Micron Client SSDs
Device Model:     Crucial_CT275MX300SSD4
Serial Number:    172717D06377
LU WWN Device Id: 5 00a075 117d06377
Firmware Version: M0CR040
User Capacity:    275064201216 bytes [275 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      < 1.8 inches
TRIM Command:     Available, deterministic, zeroed
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri Oct 15 19:34:50 2021 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x03) Offline data collection activity
          is in progress.
          Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
          without error or no self-test has ever
          been run.
Total time to complete Offline
data collection:    (  689) seconds.
Offline data collection
capabilities:        (0x7b) SMART execute Offline immediate.
          Auto Offline data collection on/off support.
          Suspend Offline collection upon new
          command.
          Offline surface scan supported.
          Self-test supported.
          Conveyance Self-test supported.
          Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
          power-saving mode.
          Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
          General Purpose Logging supported.
Short self-test routine
recommended polling time:    (   2) minutes.
Extended self-test routine
recommended polling time:    (   5) minutes.
Conveyance self-test routine
recommended polling time:    (   3) minutes.
SCT capabilities:          (0x0035) SCT Status supported.
          SCT Feature Control supported.
          SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   000    Pre-fail  Always       -       15
  5 Reallocate_NAND_Blk_Cnt 0x0032   100   100   010    Old_age   Always       -       8
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       20261
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       758
171 Program_Fail_Count      0x0032   100   100   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   000    Old_age   Always       -       0
173 Ave_Block-Erase_Count   0x0032   099   099   000    Old_age   Always       -       24
174 Unexpect_Power_Loss_Ct  0x0032   100   100   000    Old_age   Always       -       86
183 SATA_Interfac_Downshift 0x0032   100   100   000    Old_age   Always       -       0
184 Error_Correction_Count  0x0032   100   100   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   057   029   000    Old_age   Always       -       43 (Min/Max 17/71)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       8
197 Current_Pending_ECC_Cnt 0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   100   100   000    Old_age   Always       -       0
202 Percent_Lifetime_Remain 0x0030   099   099   001    Old_age   Offline      -       1
206 Write_Error_Rate        0x000e   100   100   000    Old_age   Always       -       0
246 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       4495495843
247 Host_Program_Page_Count 0x0032   100   100   000    Old_age   Always       -       140485123
248 FTL_Program_Page_Count  0x0032   100   100   000    Old_age   Always       -       158369738
180 Unused_Reserve_NAND_Blk 0x0033   000   000   000    Pre-fail  Always       -       1248
210 Success_RAIN_Recov_Cnt  0x0032   100   100   000    Old_age   Always       -       56

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Vendor (0xff)       Completed without error       00%     20260         -
# 2  Vendor (0xff)       Completed without error       00%     20214         -
# 3  Vendor (0xff)       Completed without error       00%     19977         -
# 4  Vendor (0xff)       Completed without error       00%     19635         -
# 5  Vendor (0xff)       Completed without error       00%     19566         -
# 6  Vendor (0xff)       Completed without error       00%     19513         -
# 7  Vendor (0xff)       Completed without error       00%     19105         -
# 8  Vendor (0xff)       Completed without error       00%     18944         -
# 9  Vendor (0xff)       Completed without error       00%     18840         -
#10  Vendor (0xff)       Completed without error       00%     18722         -
#11  Vendor (0xff)       Completed without error       00%     18597         -
#12  Vendor (0xff)       Completed without error       00%     18480         -
#13  Vendor (0xff)       Completed without error       00%     18341         -
#14  Vendor (0xff)       Completed without error       00%     18216         -
#15  Vendor (0xff)       Completed without error       00%     18099         -
#16  Vendor (0xff)       Completed without error       00%     17974         -
#17  Vendor (0xff)       Completed without error       00%     17853         -
#18  Vendor (0xff)       Completed without error       00%     17739         -
#19  Vendor (0xff)       Completed without error       00%     17615         -
#20  Vendor (0xff)       Completed without error       00%     17499         -
#21  Vendor (0xff)       Completed without error       00%     17376         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 

Dernière modification par robert2a (15-10-2021 19:49:56)

Hors ligne

#17 16-10-2021 10:31:34

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Bonjour,  smile

raleur a écrit :

Les messages "task ... blocked" se produisent toujours après l'échec du démarrage du démon SMART ? Dans ce cas tu peux essayer de le désactiver pour voir si ça fait une différence.


Oui, je n'ai pas d'autre cas de figure de message "Failed" au démarrage.
Comme tu me le proposes et avec la commande :

systemctl disable smartd.service


proposée par Tawal, j'ai désactivé le service smartd.
Mais quelles en sont les conséquences ? Quel est sont rôle au démarrage?
Je redonne le résultat d'un smartctl :

smartctl -a /dev/nvme0



smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.10.0-9-amd64] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       KINGSTON SA1000M8240G
Serial Number:                      50026B7682AA1325
Firmware Version:                   E8FK11.R
PCI Vendor/Subsystem ID:            0x2646
IEEE OUI Identifier:                0x0026b7
Total NVM Capacity:                 240057409536 [240 GB]
Unallocated NVM Capacity:           0
Controller ID:                      0
NVMe Version:                       1.2
Number of Namespaces:               1
Namespace 1 Size/Capacity:          240057409536 [240 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            0026b7 682aa13255
Local Time is:                      Sat Oct 16 10:11:02 2021 CEST
Firmware Updates (0x02):            1 Slot
Optional Admin Commands (0x0007):   Security Format Frmw_DL
Optional NVM Commands (0x001e):     Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Log Page Attributes (0x04):         Ext_Get_Lg
Maximum Data Transfer Size:         512 Pages
Warning  Comp. Temp. Threshold:     84 Celsius
Critical Comp. Temp. Threshold:     88 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     7.90W  0.0790W       -    0  0  0  0      600     600
 1 +     7.90W  0.0790W       -    0  0  0  0      600     600
 2 +     7.90W  0.0790W       -    0  0  0  0      600     600
 3 -   0.1000W  0.0790W       -    3  3  3  3     1000    1000
 4 -   0.0050W  0.0790W       -    4  4  4  4   400000   90000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         1
 1 -    4096       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        29 Celsius
Available Spare:                    100%
Available Spare Threshold:          100%
Percentage Used:                    1%
Data Units Read:                    4027397 [2,06 TB]
Data Units Written:                 3052466 [1,56 TB]
Host Read Commands:                 53732030
Host Write Commands:                29339154
Controller Busy Time:               23
Power Cycles:                       1461
Power On Hours:                     1780
Unsafe Shutdowns:                   13
Media and Data Integrity Errors:    0
Error Information Log Entries:      413
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 2:               29 Celsius

Error Information (NVMe Log 0x01, 16 of 16 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0        413     0  0x000e  0x0005      -     33555712     0     -
  1        412     0  0x000e  0x0005      -     33555712     0     -
  2        411     0  0x000e  0x0005      -     33555712     0     -
  3        410     0  0x000e  0x0005      -     33555712     0     -
  4        409     0  0x000e  0x0005      -     33555712     0     -
  5        408     0  0x000e  0x0005      -     33555712     0     -
  6        407     0  0x000e  0x0005      -     33555712     0     -
  7        406     0  0x000e  0x0005      -     33555712     0     -
  8        405     0  0x000e  0x0005      -     33555712     0     -
  9        404     0  0x000e  0x0005      -     33555712     0     -
 10        403     0  0x0069  0x0213      -      8323077     -     -
 11        402     0  0x004f  0x0213      -      8323077     -     -
 12        401     0  0x0002  0x0005      -          208     0     -
 13        400     0  0x000e  0x0005      -     33555712     0     -
 14        399     0  0x000e  0x0005      -     33555712     0     -
 15        398     0  0x000e  0x0005      -     33555712     0     -
 


car lorsque tu écris:

(et je crains que ce soit le SSD qui coince en l'occurrence)


je suis un peu inquiet.
Merci à toi.

Dernière modification par pomme (16-10-2021 10:51:48)

Hors ligne

#18 16-10-2021 10:50:40

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

Re : [Contourné] Problème aléatoire au lancement de Bullseye

robert2a a écrit :


au pire tu teste ton disque sur windows avec l'utiltaire de la marque de ton ssd
même voir si un firmware disponible pour lui


Sous Windows l'utilitaire du ssd donne un disque OK avec 1% des réserves utilisées (comme smartctl , je pense)
Son firmware est à jour.

Hors ligne

#19 16-10-2021 11:33:05

robert2a
Membre
Distrib. : Arch Linux
(G)UI : Mate
Inscription : 15-11-2014

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Bonjour
normalement smartmontools n'est pas une application par défaut sur debian a l'installation
pour moi aucune conséquence de le retirer
si tu avais le paquet "smart-notify" installé et tes mails système géré en local tu aurais tous les jours une notification bidon comme quoi ton ssd a un souci
c'est bien que tu ai pu vérifier sous windows , ça confirme ce que je dis
smartd désactiver tu n'a plus de problème au démarrage ?

tu a deux choses , le bios qui regarde si un souci sur les disques (normalement activé par défaut) , c'est basic
et smartd si tu la installé qui surveille les disques

le souci c'est que le nvme a priori est mal pris en charge (a comparer au ssd 2.5 sata)
maintenant je peu pas te dire pourquoi ce bug sur ce matériel , mais le pire c'est que la déclaration du bug (il y en a beaucoup) rien n'a  changé.
ce que je peu affirmer aussi la machine peu fonctionner sans ce paquet et aucune conséquence .
son rôle c'est d'identifier les disques dans une base de données et de les controler
il sert aussi a faire une maintenance sur l'état d un disque
il permet aussi d'envoyer des alertes en cas de soucis a l'administrateur
mais crois moi il n'est pas indispensable comme logiciel et dans ton cas c'est même le contraire .
tu peu surveiller ceci


Error Information Log Entries:      413
 


sous windows tu a remarquer quelque chose au sujet de cet erreur ?
=> https://bugs.launchpad.net/ubuntu/+sour … ug/1878264
ce genre de messages au sujet du bug tu va en trouver plein

un dernier => https://bugs.debian.org/cgi-bin/bugrepo … bug=900244
tu remarque que ça ne touche que du nvme comme ssd

Dernière modification par robert2a (16-10-2021 11:39:08)

Hors ligne

#20 16-10-2021 13:00:42

robert2a
Membre
Distrib. : Arch Linux
(G)UI : Mate
Inscription : 15-11-2014

Re : [Contourné] Problème aléatoire au lancement de Bullseye

quelques liens utiles
=> https://gsmartcontrol.sourceforge.io/home/
=> https://www.smartmontools.org/
c'est hors debian , mais par exemple gsmartcontrol est disponible dans les dépôts debian

je vais tester smartmontools a nouveau sur mon nvme Samsung SSD 960 EVO 250GB
ps: mais encore une fois n'hésite pas a le désinstaller si ça résoud ton souci "Problème aléatoire au lancement de Bullseye"

ps:avec une boite au lettre locale (balsa) , smart-notify  et exim4 (en local)  pour surveiller le système et ce logiciel graphique que je connais pas  "gsmartcontrol"

l'utilitaire graphique me dit "type inconnu" , la machine est prête a recevoir les notifications par mail
voila mon test


smartctl -a /dev/nvme0
 



smartctl 7.2 2020-12-30 r5155 [x86_64-linux-5.10.0-9-amd64] (local build)
Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       Samsung SSD 960 EVO 250GB
Serial Number:                      S3ESNX0JC27641H
Firmware Version:                   3B7QCXE7
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Total NVM Capacity:                 250059350016 [250 GB]
Unallocated NVM Capacity:           0
Controller ID:                      2
NVMe Version:                       1.2
Number of Namespaces:               1
Namespace 1 Size/Capacity:          250059350016 [250 GB]
Namespace 1 Utilization:            72028463104 [72,0 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            002538 5c71b06bf9
Local Time is:                      Sat Oct 16 14:03:50 2021 CEST
Firmware Updates (0x16):            3 Slots, no Reset required
Optional Admin Commands (0x0007):   Security Format Frmw_DL
Optional NVM Commands (0x001f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Log Page Attributes (0x03):         S/H_per_NS Cmd_Eff_Lg
Maximum Data Transfer Size:         512 Pages
Warning  Comp. Temp. Threshold:     77 Celsius
Critical Comp. Temp. Threshold:     79 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.04W       -        -    0  0  0  0        0       0
 1 +     5.09W       -        -    1  1  1  1        0       0
 2 +     4.08W       -        -    2  2  2  2        0       0
 3 -   0.0400W       -        -    3  3  3  3      210    1500
 4 -   0.0050W       -        -    4  4  4  4     2200    6000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        29 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    381001 [195 GB]
Data Units Written:                 2110483 [1,08 TB]
Host Read Commands:                 6538978
Host Write Commands:                15181786
Controller Busy Time:               103
Power Cycles:                       163
Power On Hours:                     280
Unsafe Shutdowns:                   53
Media and Data Integrity Errors:    0
Error Information Log Entries:      15
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               29 Celsius
Temperature Sensor 2:               34 Celsius

Error Information (NVMe Log 0x01, 16 of 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0         15     0  0x0007  0x4016  0x004            0     1     -
  1         14     0  0x0007  0x4016  0x004            0     1     -
  2         13     0  0x0007  0x4016  0x004            0     1     -
  3         12     0  0x0008  0x4016  0x004            0     1     -
  4         11     0  0x0008  0x4016  0x004            0     1     -
  5         10     0  0x0008  0x4016  0x004            0     1     -
  6          9     0  0x0008  0x4016  0x004            0     1     -
  7          8     0  0x0008  0x4016  0x004            0     1     -
  8          7     0  0x0008  0x4016  0x004            0     1     -
  9          6     0  0x0008  0x4016  0x004            0     1     -
 10          5     0  0x0008  0x4016  0x004            0     1     -
 11          4     0  0x0008  0x4016  0x004            0     1     -
 12          3     0  0x0008  0x4016  0x004            0     1     -
 13          2     0  0x0008  0x4016  0x004            0     1     -
 14          1     0  0x0008  0x4016  0x004            0     1     -

 




si je redémarre je vais passer a 16


Error Information Log Entries:      15
 



nota: j'ai retrouver des mails système de février 2018 sur la machine , si le disque avait un souci depuis le temps ............


Oct 16 13:33:51 amdtr4 smartd[7569]: Device: /dev/nvme0, opened
Oct 16 13:33:51 amdtr4 smartd[7569]: Device: /dev/nvme0, Samsung SSD 960 EVO 250GB, S/N:S3ESNX0JC27641H, FW:3B7QCXE7, 250 GB
Oct 16 13:33:51 amdtr4 smartd[7569]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 16 13:33:51 amdtr4 smartd[7569]: Monitoring 4 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
 

Dernière modification par robert2a (16-10-2021 14:16:50)

Hors ligne

#21 16-10-2021 15:10:22

robert2a
Membre
Distrib. : Arch Linux
(G)UI : Mate
Inscription : 15-11-2014

Re : [Contourné] Problème aléatoire au lancement de Bullseye

après arrêt puis démarrer
sur la messagerie


This message was generated by the smartd daemon running on:

   host name:  amdtr4
   DNS domain: [Empty]

The following warning/error was logged by the smartd daemon:

Device: /dev/nvme0, number of Error Log entries increased from 15 to 16

Device info:
Samsung SSD 960 EVO 250GB, S/N:S3ESNX0JC27641H, FW:3B7QCXE7, 250 GB

For details see host's SYSLOG.

You can also use the smartctl utility for further investigation.
Another message will be sent in 24 hours if the problem persists.
 



le syslog


  Oct 16 14:51:21 amdtr4 smartd[790]: smartd 7.2 2020-12-30 r5155 [x86_64-linux-5.10.0-9-amd64] (local build)
Oct 16 14:51:21 amdtr4 smartd[790]: Copyright (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org
Oct 16 14:51:21 amdtr4 smartd[790]: Opened configuration file /etc/smartd.conf
Oct 16 14:51:21 amdtr4 smartd[790]: Drive: DEVICESCAN, implied '-a' Directive on line 21 of file /etc/smartd.conf
Oct 16 14:51:21 amdtr4 smartd[790]: Configuration file /etc/smartd.conf was parsed, found DEVICESCAN, scanning devices
Oct 16 14:51:21 amdtr4 smartd[790]: Device: /dev/nvme0, opened
Oct 16 14:51:21 amdtr4 smartd[790]: Device: /dev/nvme0, Samsung SSD 960 EVO 250GB, S/N:S3ESNX0JC27641H, FW:3B7QCXE7, 250 GB
Oct 16 14:51:21 amdtr4 smartd[790]: Device: /dev/nvme0, is SMART capable. Adding to "monitor" list.
Oct 16 14:51:21 amdtr4 smartd[790]: Device: /dev/nvme0, state read from /var/lib/smartmontools/smartd.Samsung_SSD_960_EVO_250GB-S3ESNX0JC27641H.nvme.state
Oct 16 14:51:21 amdtr4 smartd[790]: Monitoring 0 ATA/SATA, 0 SCSI/SAS and 1 NVMe devices
Oct 16 14:51:21 amdtr4 smartd[790]: Device: /dev/nvme0, number of Error Log entries increased from 15 to 16
Oct 16 14:51:21 amdtr4 smartd[790]: Sending warning via /usr/share/smartmontools/smartd-runner to root ...



Oct 16 14:51:21 amdtr4 smartd[790]: Warning via /usr/share/smartmontools/smartd-runner to root: successful
Oct 16 14:51:21 amdtr4 smartd[790]: Device: /dev/nvme0, state written to /var/lib/smartmontools/smartd.Samsung_SSD_960_EVO_250GB-S3ESNX0JC27641H.nvme.state
Oct 16 14:51:21 amdtr4 systemd[1]: Started Self Monitoring and Reporting Technology (SMART) Daemon.
 



j'ai désactivé la ligne "#DEVICESCAN -d removable -n standby -m root -M exec /usr/share/smartmontools/smartd-runner" dans /etc/smartd.conf

Hors ligne

#22 17-10-2021 09:41:49

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Bonjour à toutes et tous,
Help  peace_flag.gif
Contrairement à ce que j'ai répondu à raleur et après la désactivation du démon SMART, ce matin je me retrouve bloqué :
20211017-092751.jpg

journalctl -b -1 -p err



-- Journal begins at Thu 2021-09-09 09:42:23 CEST, ends at Sun 2021-10-17 09:57:55 CEST. --
oct. 17 09:26:04 Pomme systemd[1]: Failed to start Load/Save RF Kill Switch Status.
oct. 17 09:26:34 Pomme systemd-udevd[285]: wlan0: Worker [326] processing SEQNUM=2964 killed
oct. 17 09:27:32 Pomme kernel: INFO: task kworker/u12:5:46 blocked for more than 120 seconds.
oct. 17 09:27:32 Pomme kernel:       Tainted: G           OE     5.10.0-9-amd64 #1 Debian 5.10.70-1
oct. 17 09:27:32 Pomme kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
oct. 17 09:27:32 Pomme kernel: INFO: task kworker/5:1:88 blocked for more than 120 seconds.
oct. 17 09:27:32 Pomme kernel:       Tainted: G           OE     5.10.0-9-amd64 #1 Debian 5.10.70-1
oct. 17 09:27:32 Pomme kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
oct. 17 09:27:32 Pomme kernel: INFO: task systemd-udevd:326 blocked for more than 120 seconds.
oct. 17 09:27:32 Pomme kernel:       Tainted: G           OE     5.10.0-9-amd64 #1 Debian 5.10.70-1
oct. 17 09:27:32 Pomme kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
oct. 17 09:27:32 Pomme kernel: INFO: task NetworkManager:528 blocked for more than 120 seconds.
oct. 17 09:27:32 Pomme kernel:       Tainted: G           OE     5.10.0-9-amd64 #1 Debian 5.10.70-1
oct. 17 09:27:32 Pomme kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
oct. 17 09:27:32 Pomme kernel: INFO: task modprobe:623 blocked for more than 120 seconds.
oct. 17 09:27:32 Pomme kernel:       Tainted: G           OE     5.10.0-9-amd64 #1 Debian 5.10.70-1
oct. 17 09:27:32 Pomme kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
oct. 17 09:27:32 Pomme kernel: INFO: task systemd-rfkill:653 blocked for more than 120 seconds.
oct. 17 09:27:32 Pomme kernel:       Tainted: G           OE     5.10.0-9-amd64 #1 Debian 5.10.70-1
oct. 17 09:27:32 Pomme kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
 



Pouvez-vous m'aider ?
Merci .

Dernière modification par pomme (17-10-2021 09:59:49)

Hors ligne

#23 19-10-2021 11:14:57

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Bonjour à toutes et tous smile
Je me permets ce petit up parce que je suis toujours dans la panade.
Comme dit au-dessus j'ai fait une erreur en pensant que seul un "démon" est en cause ,depuis la désactivation du "démon" smartd, j'ai eu plusieurs fois le défaut dont 2 fois ce matin:
20211019-103530.jpg
20211019-104650.jpg
Selon vous s'agit-il plutôt d'un problème matériel ou logiciel ?
Les résultats de smartctl (post 17) ne semblent pas mauvais ....
Lorsque le problème se produit, ai-je une autre solution que l'arrêt hard ?
Merci à vous.

Hors ligne

#24 19-10-2021 13:18:18

robert2a
Membre
Distrib. : Arch Linux
(G)UI : Mate
Inscription : 15-11-2014

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Bonjour
supprimer smartmontools n'est pas grave (il ne fait pas partie de l'iso debian)
sinon ton retour des erreurs il semble qu'un souci du wifi puis des erreurs du noyau
au bout de 2mn il se passe quoi ? (120 seconds)
en mode "maintenance" même souci ? a partir de grub
la combinaison de touches ctrl+alt+F2 ne donne rien ?
un appui de moins de 4 secondes sur le bouton M/A lance un arrêt propre mais a partir du bureau
tu a aussi le bouton reset du PC mais pas très propre non plus

pas assez de connaissance pour t'aider plus
a priori le ssd est hors de cause mais peut être un souci sur ton système debian et en plus aléatoire si j'ai bien compris
tu a la possibilité de démarrer sur un réseau filaire ou wifi ?

remarque: (hors sujet)
j'ai testé le paquet "gsmartcontrol" , il me retourne "unknown model" pour un ssd plus en vente

Dernière modification par robert2a (19-10-2021 13:27:16)

Hors ligne

#25 19-10-2021 14:05:32

pomme
Membre
Distrib. : Debian 11 bullseye
Noyau : Linux 5.10.0.9-amd64
(G)UI : Cinnamon
Inscription : 09-07-2016

Re : [Contourné] Problème aléatoire au lancement de Bullseye

Bonjour Robert,

robert2a a écrit :

Bonjour
en mode "maintenance" même souci ? a partir de grub
la combinaison de touches ctrl+alt+F2 ne donne rien ?
tu a aussi le bouton reset du PC mais pas très propre non plus
tu a la possibilité de démarrer sur un réseau filaire ou wifi ?
remarque: (hors sujet)
j'ai testé le paquet "gsmartcontrol" , il me retourne "unknown model" pour un ssd plus en vente



Je testerai le mode "maintenance" , ctrl+alt+F2 et le bouton reset.
Je ne comprends pas "tu a la possibilité de démarrer sur un réseau filaire ou wifi ?"
J'utilise "Gsmartcontrol" et il me donne aussi "unknown model" pour mon ssd.

Hors ligne

Pied de page des forums