logo Debian Debian Debian-France Debian-Facile Debian-fr.org Forum-Debian.fr Debian ? Communautés logo inclusivité

Debian-facile

Bienvenue sur Debian-Facile, site d'aide pour les nouveaux utilisateurs de Debian.

Vous n'êtes pas identifié(e).

#1 28-07-2021 10:41:43

Maknho
Membre
Distrib. : Debian GNU/Linux 11
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 01-06-2020

[Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Bonjour,

Depuis une semaine, j'ai constaté (via le paquet netdata) :
a) qu'après un reboot le swap mettait une journée à se remplir
b) puis après quelques heures que le serveur était injoignable (serveur timeout);
c) que je devais débrancher et rebrancher le serveur pour y avoir de nouveau accès

1) Mon installation est la suivante :
- Odroid N2+ avec 4GB de ram ;
- OS: armbian (avec zram comme swap) avec en surcouche yunohost ;
- comme paquets majeurs d'installés via yunohost : nextcloud, navidrome, calibre web, jellifyn, netdata...

2) J'ai donc d'abord désinstallé trois applications : jellyfin (serveur vidéos) , navidrome (serveur musique) et calibre web.
=> Mais la swap se remplit toujours.

3) je n'ai pas fait la commande htop (je suis à l'extérieur, je rentre ce soir).


Question : j'aimerai rechercher de manière méthodique la cause de ce qui semble être une "fuite de mémoire" (est ce bien ça ? Et quel processus à l'origine ?). Comment agir par étapes (et qu'elles sont-elles ?)

D'avance merci beaucoup

Dernière modification par Maknho (28-07-2021 10:54:33)

Hors ligne

#2 28-07-2021 22:14:22

raleur
Membre
Inscription : 03-10-2014

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

top peut afficher l'occupation du swap et de la mémoire résidente par chaque processus, je suppose que htop peut en faire autant.

Il vaut mieux montrer que raconter.

Hors ligne

#3 29-07-2021 16:38:30

Maknho
Membre
Distrib. : Debian GNU/Linux 11
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 01-06-2020

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Bonjour raleur,

merci de ta réponse.

ci-dessous la sortie de la commande top :

# top                                                                                   [17:34:12]
top - 17:34:50 up 1 day, 10:37,  9 users,  load average: 2.51, 2.84, 3.10
Tasks: 368 total,   2 running, 365 sleeping,   0 stopped,   1 zombie
%Cpu(s): 15.6 us,  6.0 sy,  0.1 ni, 68.2 id,  8.6 wa,  0.6 hi,  0.9 si,  0.0 st
MiB Mem :   3696.9 total,     67.8 free,   1933.2 used,   1695.9 buff/cache
MiB Swap:   1848.5 total,      0.0 free,   1848.5 used.   1627.0 avail Mem

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
2883 mysql     20   0 3492300 189572   5688 S  47.2   5.0 799:17.51 mysqld
19385 nextclo+  20   0  831104 256092   3080 R  28.7   6.8 137:00.35 php7.3
26211 nextclo+  20   0  464512 256452   6508 S  27.7   6.8  57:37.37 php7.3
2519 redis     20   0   47876   2272   1680 S   5.0   0.1  92:47.92 redis-server
6244 netdata   20   0   13236   6136   1740 S   4.3   0.2  14:58.00 apps.plugin
4754 netdata   20   0  389736 132932   3884 S   2.6   3.5   9:28.29 netdata
6241 netdata   20   0  120092  21968   3904 S   1.7   0.6   4:55.81 python
7371 postgres  20   0  212880   8972   6352 S   1.7   0.2   5:16.23 postgres
1729 root      20   0       0      0      0 S   1.3   0.0  13:16.04 jbd2/sda1-8
31735 root      20   0    9172   3444   2628 R   1.3   0.1   0:00.26 top
3163 root      39  19 3329332  79532   5144 S   0.7   2.1 144:51.56 mono-sgen
6248 netdata   20   0  723320  11824   3964 S   0.7   0.3   2:13.47 go.d.plugin
23437 netdata   20   0    3732   2612   2160 S   0.7   0.1   0:03.60 bash
   13 root      20   0       0      0      0 I   0.3   0.0   0:58.49 rcu_preempt
2232 postsrsd  20   0    2084    244    216 S   0.3   0.0   6:21.37 postsrsd
2455 root      20   0 1281760  19196   3312 S   0.3   0.5  25:11.73 fail2ban-server
2772 root      20   0  633976   4788   2148 S   0.3   0.1  32:37.40 Xorg
3203 root      20   0 1582396  22548   2880 S   0.3   0.6  45:35.38 dockerd
9331 root      20   0  108352    892    144 S   0.3   0.0   0:00.75 containerd-shim

Hors ligne

#4 29-07-2021 18:21:27

raleur
Membre
Inscription : 03-10-2014

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Mauvaise mise en forme.
Il manque la colonne SWAP (à ajouter).
Tri par occupation CPU non approprié pour examiner la charge mémoire.

Il vaut mieux montrer que raconter.

Hors ligne

#5 29-07-2021 20:47:00

Maknho
Membre
Distrib. : Debian GNU/Linux 11
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 01-06-2020

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Huuum c'est juste smile
Deux colonnes ajoutées (SWAP avant-dernière et USED  dernière) :

PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND           SWAP   USED
2883 mysql     20   0 3492300 186016   6412 S  39.9   4.9 967:24.82 mysqld          272696 458712
30559 nextclo+  20   0  303744  60948  10576 S  29.0   1.6  29:59.94 php7.3          141192 202140
13451 nextclo+  20   0  251904  49332  11268 S  28.4   1.3  15:43.57 php7.3          103072 152404
2519 redis     20   0   47876   2040   1436 S   6.9   0.1 107:28.29 redis-server      8736  10776
6244 netdata   20   0   13236   5980   1688 S   5.0   0.2  29:36.63 apps.plugin       1096   7076
4754 netdata   20   0  392904 107368   3032 S   3.3   2.8  18:31.15 netdata          58276 165644
6241 netdata   20   0  120092  21480   3528 S   2.3   0.6   9:39.38 python            7432  28912
7371 postgres  20   0  212880   8736   6116 S   2.3   0.2  10:18.64 postgres          1944  10680
1729 root      20   0       0      0      0 D   1.0   0.0  15:46.45 jbd2/sda1-8          0      0
2605 root      20   0    9172   3332   2512 R   1.0   0.1   0:00.41 top                  0   3332
3163 root      39  19 3335328  23008   5684 S   0.7   0.6 153:10.03 mono-sgen       170864 193872
30880 thibault  30  10    8284   2360   1840 S   0.7   0.1   0:01.52 deco                 0   2360
    1 root      20   0  167344   5736   3296 S   0.3   0.2 157:26.65 systemd           1148   6884
2144 root      20   0   15084   2520   2200 S   0.3   0.1  21:39.75 systemd-logind     912   3432
2455 root      20   0 1281760  18900   3452 S   0.3   0.5  26:22.32 fail2ban-server   3872  22772
3203 root      20   0 1582396  21416   3876 S   0.3   0.6  46:00.78 dockerd          34244  55660
6248 netdata   20   0  723320  12580   4712 S   0.3   0.3   4:20.92 go.d.plugin       2252  14832
6892 root      20   0  141036  23068   4960 S   0.3   0.6 117:53.54 python3          68072  91140
21221 netdata   20   0    3732   2416   2048 S   0.3   0.1   0:05.29 bash                88   2504



NB : 94% de swap utilisé tjs selon netdata

Dernière modification par Maknho (29-07-2021 20:49:52)

Hors ligne

#6 29-07-2021 21:48:54

raleur
Membre
Inscription : 03-10-2014

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

C'est trop demander de présenter proprement la sortie en format code avec espacement fixe ?
Tu n'as pas changé la colonne de tri (c'est toujours %CPU), les plus gros consommateurs de mémoire ne sont pas forcément les plus gros consommateurs de CPU. La consommation de mémoire et CPU des processus affichés ne suffit pas à expliquer la quantité de swap utilisée.

Dernière modification par raleur (29-07-2021 21:49:28)


Il vaut mieux montrer que raconter.

Hors ligne

#7 29-07-2021 21:58:47

jpt
Banni(e)
Distrib. : Debian 10.8
Noyau : Linux 5.7.10 (backports)
(G)UI : LXDE
Inscription : 12-09-2020

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Bonsoir,

quand raleur parlait de

raleur a écrit :

Mauvaise mise en forme.

, je pense qu'il pensait à quelque chose de plus lisible parce que là (ci-dessus), franchement, c'est inbuvable et indécorticable, alors qu'il suffisait juste d'utiliser le bouton "Autre code" et de rajouter des espaces là où il fallait pour que ça devienne lumineux (mais pas pour moi) :

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND           SWAP   USED
 2883 mysql     20   0 3492300 186016   6412 S  39.9   4.9 967:24.82 mysqld          272696 458712
30559 nextclo+  20   0  303744  60948  10576 S  29.0   1.6  29:59.94 php7.3          141192 202140
13451 nextclo+  20   0  251904  49332  11268 S  28.4   1.3  15:43.57 php7.3          103072 152404
 2519 redis     20   0   47876   2040   1436 S   6.9   0.1 107:28.29 redis-server      8736  10776
 6244 netdata   20   0   13236   5980   1688 S   5.0   0.2  29:36.63 apps.plugin       1096   7076
 4754 netdata   20   0  392904 107368   3032 S   3.3   2.8  18:31.15 netdata          58276 165644
 6241 netdata   20   0  120092  21480   3528 S   2.3   0.6   9:39.38 python            7432  28912
 7371 postgres  20   0  212880   8736   6116 S   2.3   0.2  10:18.64 postgres          1944  10680
 1729 root      20   0       0      0      0 D   1.0   0.0  15:46.45 jbd2/sda1-8          0      0
 2605 root      20   0    9172   3332   2512 R   1.0   0.1   0:00.41 top                  0   3332
 3163 root      39  19 3335328  23008   5684 S   0.7   0.6 153:10.03 mono-sgen       170864 193872
30880 thibault  30  10    8284   2360   1840 S   0.7   0.1   0:01.52 deco                 0   2360
    1 root      20   0  167344   5736   3296 S   0.3   0.2 157:26.65 systemd           1148   6884
 2144 root      20   0   15084   2520   2200 S   0.3   0.1  21:39.75 systemd-logind     912   3432
 2455 root      20   0 1281760  18900   3452 S   0.3   0.5  26:22.32 fail2ban-server   3872  22772
 3203 root      20   0 1582396  21416   3876 S   0.3   0.6  46:00.78 dockerd          34244  55660
 6248 netdata   20   0  723320  12580   4712 S   0.3   0.3   4:20.92 go.d.plugin       2252  14832
 6892 root      20   0  141036  23068   4960 S   0.3   0.6 117:53.54 python3          68072  91140
21221 netdata   20   0    3732   2416   2048 S   0.3   0.1   0:05.29 bash                88   2504


Souhaitons bon courage à ceux qui vont tenter de (et réussir à ? Ce problème me laisse sans voix et sans idées) dépatouiller tout ça…

EDIT : ah tiens, croisement de posts

EDIT 2 :

Maknho a écrit :

Depuis une semaine, j'ai constaté (via le paquet netdata)

Avant tout fonctionnait bien ? Si oui, qu'est-ce qui a changé depuis ?

Maknho a écrit :

que je devais débrancher et rebrancher le serveur pour y avoir de nouveau accès

débrancher et rebrancher l'alimentation électrique ou le réseau ? Si l'alim, un simple reset ne suffit pas à réinitialiser pas la machine ?

Dernière modification par jpt (29-07-2021 22:11:17)


AMD Ryzen3 3200G sur Gigabyte B450M & Make Love Not War

Hors ligne

#8 29-07-2021 22:18:10

Maknho
Membre
Distrib. : Debian GNU/Linux 11
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 01-06-2020

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Je recommence avec :
- mise en forme plus clair ;
- tri sur swap

 PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND           SWAP   USED
 2883 mysql     20   0 3492300 209968   5692 S  55.4   5.5   1016:39 mysqld          248704 458672
30559 nextclo+  20   0  404096  80088  10036 S  29.7   2.1  53:30.66 php7.3          223448 303536
13451 nextclo+  20   0  363136  69904  10452 S  30.0   1.8  38:32.18 php7.3          192340 262244
 3163 root      39  19 3324840  18476   3908 S   0.7   0.5 153:49.84 mono-sgen       163136 181612
 9819 root      20   0  237024  17796   3224 S   0.0   0.5   2:31.34 python3          74412  92208
 6892 root      20   0  141036  26492   5284 S   0.3   0.7 118:08.65 python3          64408  90900
 2545 rabbitmq  20   0 4265964   5696   1940 S   0.0   0.2  57:09.11 beam.smp         60288  65984
 4754 netdata   20   0  394224 119796   3264 S   3.6   3.2  21:33.19 netdata          47400 167196
 3756 metrono+  20   0   68640   6100   2608 S   0.0   0.2  20:44.15 lua5.1           47264  53364
 2400 droppy    20   0  735472   6512   4820 S   0.0   0.2  25:25.53 node             45156  51668
 4447 _rspamd   20   0  120668   3800   1408 S   0.0   0.1   7:48.92 rspamd           39540  43340
 3194 _rspamd   20   0  120176   2828    660 S   0.0   0.1   0:01.03 rspamd           39300  42128
 4445 _rspamd   20   0  120668   3988   1400 S   0.0   0.1   4:32.04 rspamd           37280  41268
 4446 _rspamd   20   0  120668   3988   1400 S   0.0   0.1   7:18.68 rspamd           36708  40696
 4435 _rspamd   20   0  120668   4000   1420 S   0.0   0.1   7:17.66 rspamd           36660  40660
 4431 _rspamd   20   0  121448   7344   4116 S   0.0   0.2   6:52.08 rspamd           36416  43760
 4430 _rspamd   20   0  120176   3588   1080 S   0.0   0.1   7:09.99 rspamd           36084  39672
 3420 openldap  20   0  667948   2888   1380 S   0.0   0.1   0:33.78 slapd            32860  35748
 3203 root      20   0 1582396  26200   6320 S   0.0   0.7  46:08.67 dockerd          32448  58648



EDIT 1 : toujours 99% de swap utilisé

EDIT 2 :

Avant tout fonctionnait bien ? Si oui, qu'est-ce qui a changé depuis ?



Changements majeurs :
- installation de navidrome, jellyfin, calibre-web mais retirés depuis et le swap est toujours fortement utilisé

EDIT 3 :

débrancher et rebrancher l'alimentation électrique ou le réseau ? Si l'alim, un simple reset ne suffit pas à réinitialiser pas la machine ?



je n'ai plus accès à la machine (odroid n2+) et je n'ai pas de bouton reset donc je dois débrancher et rebrancher

EDIT 4 :

Souhaitons bon courage à ceux qui vont tenter de (et réussir à ? Ce problème me laisse sans voix et sans idées) dépatouiller tout ça…



Merci jpt de m'aider dans la mise en forme smile  ... sur le fond (si ce n'est la forme) j'ai une confiance forte en les capacités et la patience de raleur qui m'a déjà tiré de nombreuses fois d'impasses dans lesquelles mes inaptitudes de débutant m'avaient fourrées.

Merci++

Dernière modification par Maknho (30-07-2021 06:12:13)

Hors ligne

#9 29-07-2021 22:43:36

raleur
Membre
Inscription : 03-10-2014

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Le total des valeurs visibles de la colonne SWAP atteint à peine 1,5 Go. Il faut scroller pour voir le reste.
Est-ce qu'il y a des tmpfs ?

df -ht tmpfs -t devtmpfs

Dernière modification par raleur (29-07-2021 22:44:45)


Il vaut mieux montrer que raconter.

Hors ligne

#10 29-07-2021 23:32:56

Maknho
Membre
Distrib. : Debian GNU/Linux 11
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 01-06-2020

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Et voici :


PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND           SWAP   USED
30559 nextclo+  20   0  503424 144652   8740 R  27.4   3.8  71:44.12 php7.3          254172 398824
 2883 mysql     20   0 3492300 223776   5732 S  47.2   5.9   1060:28 mysqld          242700 466476
13451 nextclo+  20   0  446080 120784   9188 R  26.7   3.2  56:45.43 php7.3          220236 341020
 3163 root      39  19 3324840  20516   3588 S   0.3   0.5 154:20.28 mono-sgen       160776 181292
 9819 root      20   0  237024  22364   3692 S   0.0   0.6   2:46.67 python3          70316  92680
 6892 root      20   0  141036  27852   4576 S   0.7   0.7 118:20.79 python3          62324  90176
 2545 rabbitmq  20   0 4265964   5844   1828 S   0.3   0.2  57:15.51 beam.smp         60028  65872
 2400 droppy    20   0  735472   6296   4552 S   0.0   0.2  25:25.63 node             45180  51476
 4447 _rspamd   20   0  120668   3804   1400 S   0.0   0.1   7:49.11 rspamd           39528  43332
 3194 _rspamd   20   0  120176   2800    632 S   0.0   0.1   0:01.03 rspamd           39300  42100
 4445 _rspamd   20   0  120668   3972   1392 S   0.0   0.1   4:32.23 rspamd           37288  41260
 4446 _rspamd   20   0  120668   3992   1392 S   0.0   0.1   7:18.86 rspamd           36696  40688
 4435 _rspamd   20   0  120668   4008   1412 S   0.0   0.1   7:17.84 rspamd           36644  40652
 4431 _rspamd   20   0  121448   6964   3668 S   0.0   0.2   6:52.72 rspamd           36356  43320
 4430 _rspamd   20   0  120176   3600   1076 S   0.0   0.1   7:10.16 rspamd           36068  39668
 3756 metrono+  20   0   73784  22972   2968 S   0.0   0.6  20:44.73 lua5.1           35832  58804
 4754 netdata   20   0  394224 133380   3648 S   3.0   3.5  24:01.31 netdata          34200 167580
 3420 openldap  20   0  667948   2888   1380 S   0.0   0.1   0:34.29 slapd            32868  35756
 3203 root      20   0 1582396  24084   4448 S   0.0   0.6  46:16.41 dockerd          32136  56220
 6353 root      20   0 1047420   5856    500 S   0.0   0.2  43:25.79 docker           28148  34004
 2396 root      20   0  351160    716    624 S   0.0   0.0   3:35.31 yunohost-api     26432  27148
 2458 root      20   0 1844496   8748    156 S   0.0   0.2  24:17.44 containerd       24448  33196
 2313 www-data  20   0  281112    572    360 S   0.0   0.0   0:28.82 mono             22940  23512
 2415 root      39  19  145060      0      0 S   0.0   0.0   0:00.92 mono             22032  22032
 3948 thibault  20   0   60376   2436   1656 S   0.0   0.1  13:14.99 applet.py        19892  22328
 2772 root      20   0  633976   5204   2580 S   0.0   0.1  33:45.34 Xorg             17676  22880
 3437 root      20   0  175168    980    588 S   0.0   0.0   0:00.47 nginx            16212  17192
29089 www-data  20   0  175264   3840   3176 S   0.0   0.1   4:57.50 nginx            15956  19796
29088 www-data  20   0  175264   3856   3168 S   0.0   0.1   8:14.50 nginx            15932  19788
29090 www-data  20   0  175264   4104   3392 S   0.0   0.1   4:09.78 nginx            15908  20012
29084 www-data  20   0  175264   4104   3240 S   0.0   0.1   5:32.08 nginx            15756  19860
 3920 thibault  20   0 1238340   1564   1420 S   0.0   0.0   0:00.92 pasystray        15060  16624
 3925 thibault  20   0  752236   1268   1188 S   0.0   0.0  22:12.25 xpad             14976  16244
29086 www-data  20   0  175264   5416   3392 S   0.0   0.1   5:07.33 nginx            14596  20012
 4076 thibault  20   0  786848   2272   1640 S   0.0   0.1   8:56.34 panel-9-whisker  13764  16036
 3943 thibault  20   0  909744   3728   1932 S   0.0   0.1   0:01.29 nm-applet        13608  17336
3915 thibault  20   0  783208   1660   1660 S   0.0   0.0   0:01.24 Thunar           13576  15236
 3934 thibault  20   0  700828   1920   1460 S   0.0   0.1   0:00.36 polkit-gnome-au  12092  14012
29087 www-data  20   0  177616  11344   5448 S   0.0   0.3   7:01.43 nginx            10828  22172
 3106 www-data  20   0  281396     40      8 S   0.0   0.0   0:00.00 php-fpm7.3        9764   9804
 3107 www-data  20   0  281396     40      8 S   0.0   0.0   0:00.00 php-fpm7.3        9764   9804
 3052 grav      20   0  281416     16      0 S   0.0   0.0   0:00.00 php-fpm7.3        9760   9776
 3055 grav      20   0  281416     16      0 S   0.0   0.0   0:00.00 php-fpm7.3        9760   9776
 3061 grav      20   0  281416     44      8 S   0.0   0.0   0:00.00 php-fpm7.3        9760   9804
 3062 grav      20   0  281416     20      0 S   0.0   0.0   0:00.00 php-fpm7.3        9760   9780
 3065 grav      20   0  281416     48     12 S   0.0   0.0   0:00.00 php-fpm7.3        9760   9808
 3069 grav      20   0  281416     48     12 S   0.0   0.0   0:00.00 php-fpm7.3        9760   9808
 3070 grav      20   0  281416     52     16 S   0.0   0.0   0:00.00 php-fpm7.3        9760   9812
 3071 grav      20   0  281416     52     16 S   0.0   0.0   0:00.00 php-fpm7.3        9760   9812
 2390 root      20   0  281452   1348   1228 S   0.0   0.0  21:18.47 php-fpm7.3        9668  11016
 8483 nextclo+  20   0  318628  37660  29040 S   0.0   1.0   0:24.24 php-fpm7.3        9388  47048
 8525 nextclo+  20   0  318544  38152  27988 S   0.0   1.0   0:23.24 php-fpm7.3        9388  47540
 8469 nextclo+  20   0  318288  38788  28476 S   0.0   1.0   0:13.24 php-fpm7.3        9348  48136
 8527 nextclo+  20   0  318420  38316  27976 S   0.0   1.0   0:13.09 php-fpm7.3        9332  47648

21273 nextclo+  20   0  318276  38380  28080 S   0.0   1.0   0:10.74 php-fpm7.3        9316  47696
 3940 nextclo+  20   0  318340  38464  27692 S   0.0   1.0   0:36.17 php-fpm7.3        9264  47728
 8526 nextclo+  20   0  318292  38680  28104 S   0.0   1.0   0:14.36 php-fpm7.3        9224  47904
17123 nextclo+  20   0  318248  38404  27720 S   0.0   1.0   0:12.20 php-fpm7.3        9220  47624
 8524 nextclo+  20   0  318268  39252  28784 S   0.0   1.0   0:13.22 php-fpm7.3        9116  48368
 2519 redis     20   0   47876   2056   1424 R   7.6   0.1 117:24.79 redis-server      8700  10756
21003 nextclo+  20   0  320452  41292  29852 S   0.0   1.1   0:09.95 php-fpm7.3        8456  49748
 8482 nextclo+  20   0  318216  39168  27648 S   0.0   1.0   0:12.02 php-fpm7.3        8384  47552
 2369 root      20   0  112220      0      0 S   0.0   0.0   0:00.29 unattended-upgr   8364   8364
 2184 root      20   0   33352    112      4 S   0.0   0.0   0:00.30 networkd-dispat   8012   8124
 4686 thibault  20   0  306944   1728   1476 S   0.0   0.0   0:02.10 xfce4-notifyd     7396   9124
 6241 netdata   20   0  120092  21572   3560 S   2.0   0.6  12:38.91 python            7372  28944
 3918 thibault  20   0  377684   2388   1704 S   0.0   0.1   9:20.73 xfdesktop         7244   9632
 8965 root       9 -11   95000    828    244 S   0.0   0.0  95:41.32 pulseaudio        7024   7852
 8035 root      20   0  720264  10740   3700 S   0.0   0.3 210:47.21 coredns           6600  17340
 3929 thibault  20   0  882784   1812   1436 S   0.0   0.0   0:00.48 deja-dup-monito   6344   8156
 3942 thibault  20   0  470028   1524   1244 S   0.0   0.0   0:00.40 pulseaudio        5868   7392
26957 nextclo+  20   0  318092  43092  29200 S   0.0   1.1   0:02.88 php-fpm7.3        5492  48584
 4505 root      20   0   45876   9392   7672 S   0.0   0.2   1:28.34 systemd-journal   4488  13880
 3708 thibault  20   0  182436   2260   1724 S   0.0   0.1   0:00.30 xfce4-session     4092   6352
 6306 root      20   0  710420   1660    568 S   0.0   0.0   1:54.67 observer          3932   5592
 2455 root      20   0 1281760  19036   3304 S   0.3   0.5  27:15.82 fail2ban-server   3592  22628
 8057 root      20   0  108352   1080    212 S   0.0   0.0   5:47.04 containerd-shim   3492   4572
 7667 root      20   0  108352    856     52 S   0.0   0.0   5:34.18 containerd-shim   3468   4324
 5936 root      20   0  108352    852      0 S   0.0   0.0   5:24.89 containerd-shim   3428   4280
 6396 root      20   0  108352   1092    212 S   0.0   0.0   5:45.19 containerd-shim   3376   4468
 5920 root      20   0  401008   2036      0 S   0.0   0.1   2:38.35 docker-proxy      3240   5276
 3366 thibault  20   0  167944    120      0 S   0.0   0.0   0:00.00 (sd-pam)          3228   3348
 4323 admin     20   0  167804    120      0 S   0.0   0.0   0:00.00 (sd-pam)          3220   3340
 3910 thibault  20   0  188344   5068   3636 S   0.0   0.1  75:40.37 xfce4-panel       3216   8284
 3980 thibault  20   0  236700      4      4 S   0.0   0.0   0:00.04 gvfsd             3032   3036
 2555 minidlna  20   0  172544    864    768 S   0.0   0.0   0:56.01 minidlnad         2928   3792
 9296 root      20   0   13784      8      4 S   0.0   0.0   0:00.07 zsh               2816   2824
 9366 root      20   0   13784      8      4 S   0.0   0.0   0:00.08 zsh               2816   2824
 8086 root      20   0   13784      8      4 S   0.0   0.0   0:00.12 zsh               2812   2820
 9015 root      20   0   13784      8      4 S   0.0   0.0   0:00.08 zsh               2812   2820
 9333 root      20   0   13784      8      4 S   0.0   0.0   0:00.08 zsh               2812   2820
9706 root      20   0   13784      8      4 S   0.0   0.0   0:00.08 zsh               2812   2820
 4213 thibault  20   0  232876      4      4 S   0.0   0.0   0:00.02 gvfs-goa-volume   2732   2736
 2223 root      20   0  219700   2392   1308 S   0.0   0.1   1:58.27 rsyslogd          2428   4820
 3764 root      20   0   48932   1112    920 S   0.0   0.0   0:33.85 cleanupd          2348   3460
 3904 thibault  20   0   36176   2016   1472 S   0.0   0.1   0:36.38 xfwm4             2340   4356
 3757 root      20   0   48924   1300   1072 S   0.0   0.0   0:34.22 smbd-notifyd      2312   3612
 3927 thibault  20   0  216412   2008   1564 S   0.0   0.1   8:35.50 xfsettingsd       2300   4308
 3826 root      20   0   52408   2864   2452 S   0.0   0.1   7:45.51 lpqd              2232   5096
 3480 root      20   0   52424   2596   2064 S   0.0   0.1   1:44.54 smbd              2124   4720
 8966 root      20   0    4320    116    116 S   0.0   0.0   0:00.05 bash              2016   2132
 8997 root      20   0    4324      4      0 S   0.0   0.0   0:00.00 bash              2008   2012
 3056 postgres  20   0  209940   1488   1280 S   0.0   0.0   4:39.86 postgres          1952   3440
 7371 postgres  20   0  212880   8736   6116 S   2.3   0.2  13:32.11 postgres          1944  10680
 3048 postgres  20   0  209940   2348   2024 S   0.0   0.1   3:53.25 postgres          1924   4272
 6248 netdata   20   0  723320  11880   4384 S   0.7   0.3   5:42.10 go.d.plugin       1892  13772
 2219 root      20   0  392148   4764   3140 S   0.0   0.1  23:26.10 udisksd           1880   6644
 4288 thibault  20   0   33736   1592   1188 S   0.0   0.0   0:14.00 panel-2-actions   1880   3472
 3047 postgres  20   0  209536    436    344 S   0.0   0.0   5:53.62 postgres          1832   2268
 3045 postgres  20   0  209536   1016    900 S   0.0   0.0   2:28.16 postgres          1824   2840
 3046 postgres  20   0  209536    784    664 S   0.0   0.0   6:10.54 postgres          1808   2592
 3054 postgres  20   0   64444   1208    972 S   0.0   0.0   2:53.22 postgres          1720   2928
 2912 postgres  20   0  209536   1760   1512 S   0.0   0.0   2:17.06 postgres          1648   3408
 3346 thibault  20   0   17044   2556   2540 S   0.0   0.1   0:27.93 systemd           1632   4188
 3191 root      20   0   33204   2080   1748 S   0.0   0.1  16:03.49 nmbd              1604   3684
 6894 root      20   0    4372   1484   1004 S   0.0   0.0   0:44.20 bash              1584   3068
 4285 thibault  20   0   32472   1728   1304 S   0.0   0.0   0:09.32 panel-6-systray   1564   3292
 8454 root      20   0  108352   2876      0 S   0.0   0.1   5:26.68 containerd-shim   1428   4304
 8999 root      20   0  108352   3044    180 S   0.0   0.1   5:46.11 containerd-shim   1424   4468
 4500 root      20   0   20468   1800   1540 S   0.0   0.0   0:00.30 systemd-udevd     1316   3116
 4311 admin     20   0   17048   2868   2540 S   0.0   0.1   0:35.43 systemd           1292   4160
 2462 root      20   0  233332   3484   2552 S   0.0   0.1   0:06.37 polkitd           1280   4764
 4298 thibault  20   0  311092   1212   1168 S   0.0   0.0   0:08.61 gvfsd-trash       1248   2460
 2161 root      20   0  325864   5212   3360 S   0.0   0.1  14:37.22 NetworkManager    1240   6452
 4238 thibault  20   0  313864      0      0 S   0.0   0.0   0:00.05 gvfs-afc-volume   1076   1076
 7547 root      20   0   14032   3116   1332 S   0.0   0.1   0:00.29 zsh               1076   4192
 3314 debian-+  20   0  175548   1508   1272 S   0.0   0.0  28:02.60 transmission-da   1068   2576
 3122 root      20   0    9040   1184    964 S   0.0   0.0   0:00.45 dhclient          1044   2228
 4143 thibault  20   0  167296      0      0 S   0.0   0.0   0:00.02 gsettings-helpe   1044   1044
 



Et voila pour la sortie de    df -ht tmpfs -t devtmpfs :

Sys. de fichiers Taille Utilisé Dispo Uti% Monté sur
udev               1.4G       0  1.4G   0% /dev
tmpfs              370M     41M  330M  11% /run
tmpfs              1.9G     28K  1.9G   1% /dev/shm
tmpfs              5.0M    4.0K  5.0M   1% /run/lock
tmpfs              1.9G       0  1.9G   0% /sys/fs/cgroup
tmpfs              1.9G    180K  1.9G   1% /tmp
tmpfs              370M    8.0K  370M   1% /run/user/1000
tmpfs              370M       0  370M   0% /run/user/1007

Dernière modification par Maknho (30-07-2021 06:13:01)

Hors ligne

#11 31-07-2021 16:44:37

raleur
Membre
Inscription : 03-10-2014

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Visiblement, ce ne sont pas les tmpfs qui occupent beaucoup de mémoire ou de swap (41 Mo).
Si on fait le total des quantités de swap occupées par tous les processus, on obtient 2,2 Go, soit plus que la taille du swap (2 Go). Cela s'explique par le fait que des données sont partagées entre plusieurs processus. Il est probable que ce soit le cas notamment pour les processus nextcloud, rspamd, nginx... Pour ne pas les compter plusieurs fois, il faudrait regarder la quantité de swap "proportionnelle" de chaque processus. Hélas il semble que ni ps, ni top ne puissent l'afficher. Cela ne figure même pas dans les données disponibles dans /proc/<pid>/status pour chaque processus. Il faut aller la chercher pour chaque mapping mémoire d'un processus listé dans /proc/<pid>/smaps (champ SwapPss). La commande "pmap -X" permet d'afficher le total pour tous les mappings d'un processus.

Mais les plus gros consommateurs de mémoire/swap semblent quand même être nextcloud, mysqld, mono-sgen, netdata... J'ignore si cette consommation est normale.

Il vaut mieux montrer que raconter.

Hors ligne

#12 31-07-2021 18:57:30

Maknho
Membre
Distrib. : Debian GNU/Linux 11
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 01-06-2020

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Ok merci raleur,
Vu mon niveau 2 solutions :
- j'augmente la swap => mais est ce facile avec zram ;
- je rétrograde à la derniere sauvegarde de mon système.

Que ferai-tu ?

Hors ligne

#13 31-07-2021 19:25:29

jpt
Banni(e)
Distrib. : Debian 10.8
Noyau : Linux 5.7.10 (backports)
(G)UI : LXDE
Inscription : 12-09-2020

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Une 3ᵉ solution, puisqu'au bout de 24 h tu as une bonne idée du problème :
en repartant de la liste de raleur :

raleur a écrit :

nextcloud, mysqld, mono-sgen, netdata...

tu arrêtes nextcloud pendant 24 h et tu regardes où en est l'état du swap, et si c'est toujours pareil, tu peux réactiver nextcloud et tu arrêtes mysqld et ainsi de suite, tu finiras bien par trouver le coupable.

Dernière modification par jpt (31-07-2021 19:25:58)


AMD Ryzen3 3200G sur Gigabyte B450M & Make Love Not War

Hors ligne

#14 31-07-2021 20:09:55

raleur
Membre
Inscription : 03-10-2014

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Maknho a écrit :

j'augmente la swap => mais est ce facile avec zram


Surtout, est-ce raisonnable avec aussi peu de RAM ? zram utilise la RAM comme stockage donc plus de swap = moins de RAM disponible pour les caches et autres. Tu ne peux pas ajouter un stockage physique pour le swap ?

jpt a écrit :

tu arrêtes nextcloud pendant 24 h et tu regardes où en est l'état du swap, et si c'est toujours pareil, tu peux réactiver nextcloud et tu arrêtes mysqld


Je crains que ce ne soit pas si simple s'il y a des dépendances entre les services, par exemple si nextcloud utilise mysql.


Il vaut mieux montrer que raconter.

Hors ligne

#15 01-08-2021 08:55:46

jpt
Banni(e)
Distrib. : Debian 10.8
Noyau : Linux 5.7.10 (backports)
(G)UI : LXDE
Inscription : 12-09-2020

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Bonjour,

raleur a écrit :

Je crains que ce ne soit pas si simple s'il y a des dépendances entre les services, par exemple si nextcloud utilise mysql.

Qui ne tente rien n'aura rien, ça c'est sûr.
Et s'il y a ce genre de dépendances on arrête les deux (ou trois ou quatre) services et on pourra avoir une idée un peu moins floue, peut-être, de là où se situe le souci.

Dernière modification par jpt (01-08-2021 08:56:59)


AMD Ryzen3 3200G sur Gigabyte B450M & Make Love Not War

Hors ligne

#16 02-08-2021 05:46:13

anonyme
Invité

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Bonjour,

Le retour de la commande top, notament le "68.2 id,  8.6 wa" de l'utilisation du processeur, me laisse penser que le problème est lié à un trop grand nombre de fichiers ouverts. Il faut entendre par "fichier" non seulement les fichiers qui sont susceptibles d''être présents sur les serveurs (fichiers php, fichiers utilisateurs en stockage, etc) mais aussi les fichiers temporaires comme les fichiers de session web.

À défaut de pouvoir facilement arrêter un service, on peut envisager d'en interdire l'accès momentanément avec une règle iptables sur le port concerné.

Une autre piste de cause possible; un script cron qui n'aurait pas le temps de se terminer avant d'être relancé et dont les instances viendraient se cumuler.

Si ça peut aider...

#17 02-08-2021 16:16:06

Maknho
Membre
Distrib. : Debian GNU/Linux 11
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 01-06-2020

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Merci à tous.
Je suis en plein déménagement donc je teste différentes hypothèses dans quelques jours et je fais un retour.
Pour le cron je ne me souviens pas en avoir mis un en place. Par ex mes jobs rsync ne sont pas automatisés.

Hors ligne

#18 18-08-2021 13:18:30

Maknho
Membre
Distrib. : Debian GNU/Linux 11
Noyau : Linux 5.10.0-10-amd64
(G)UI : Xfce
Inscription : 01-06-2020

Re : [Fuite de mémoire] : swap (zram) 100% en un jour => serveur timeout

Hello à tous,

Excusez-moi du délai de réponse, mais le déménagement a été sportif smile
Toujours le problème de swap mais j'ai un peu de mal à cerner les processus en cause car j'ai l'impression que ceux ci ne sont pas les mêmes en cause selon les jours.

Aujourd'hui par exemple la sortie de top :

PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND                  SWAP
 9177 root      20   0  247552 104816  21428 S   0.0   2.8   0:22.88 python3                 64180
 2698 rabbitmq  20   0 4271596  66424   5492 S   0.0   1.8   0:20.03 beam.smp                28340
 3188 _rspamd   20   0  120176  28060  10936 S   0.0   0.7   0:00.97 rspamd                  24184
 4264 _rspamd   20   0  120176  22360   3380 S   0.0   0.6   0:00.13 rspamd                  24028
 4266 _rspamd   20   0  120668  23024   3980 S   0.0   0.6   0:00.14 rspamd                  23980
 4269 _rspamd   20   0  120668  23264   4112 S   0.0   0.6   0:00.14 rspamd                  23868
 4267 _rspamd   20   0  120668  23160   4000 S   0.0   0.6   0:00.15 rspamd                  23864
 4268 _rspamd   20   0  120668  23176   4000 S   0.0   0.6   0:00.16 rspamd                  23848
 4265 _rspamd   20   0  121448  25368   6280 S   0.0   0.7   0:00.72 rspamd                  21636
 6087 root      20   0  102332  64244  12512 S   0.3   1.7   0:11.48 python3                 17784
 3443 openldap  20   0  481556  20584   3272 S   0.0   0.5   0:03.31 slapd                   16572
 2836 mysql     20   0 2433564 179724   7868 S   0.0   4.7   1:02.45 mysqld                  15636
 7984 root       9 -11   95000  10596   6372 S   0.0   0.3   0:00.82 pulseaudio               9336
 2313 www-data  20   0  281128  25440  11180 S   0.0   0.7   0:01.57 mono                     8912
 3883 root      20   0  170684   5924   1044 S   0.0   0.2   0:00.01 nginx                    6640
 3892 www-data  20   0  170780  16660   9940 S   0.0   0.4   0:00.07 nginx                    5308
 3890 www-data  20   0  170780  16928  10204 S   0.0   0.4   0:00.14 nginx                    5288
 3891 www-data  20   0  170780  16936  10208 S   0.0   0.4   0:00.19 nginx                    5288
 



EDIT : commande effectuée une heure après un reboot du à une swap trop pleine.

EDIT 2 : et pour info

# free -h                                                                               [14:16:35]
              total        used        free      shared  buff/cache   available
Mem:          3.6Gi       1.4Gi        47Mi        66Mi       2.1Gi       2.0Gi
Swap:         1.8Gi       242Mi       1.6Gi
 

Dernière modification par Maknho (18-08-2021 13:21:48)

Hors ligne

Pied de page des forums