Out of memory lors d'une mise à jour, et serveur ralenti/peu stable depuis

Mon serveur YunoHost

Matériel: Vieil ordinateur
Version de YunoHost: 4.2.6.1
J’ai accès à mon serveur : En SSH et Par la webadmin et En direct avec un clavier/écran
Êtes-vous dans un contexte particulier ou avez-vous effectué des modifications particulières sur votre instance ? : oui
Si oui, expliquer:
vieille instance de yunohost, donc a subi pas mal d’upgrades et de migrations.

Description du problème

Version courte : j’ai diminué la ram de mon serveur de 8 à 4 Go, puis j’ai lancé une màj de Nextcloud, ça a bien planté le serveur. Après redémarrage, désinstal/restauration du backup pre-upgrade, tout remarche. Sauf que le serveur marche assez mal depuis, il est souvent lent à répondre.

Version plus longue :
Mercredi 23/07 : j’avais 8 Go de ram sur mon serveur, qui fonctionnait très bien. J’ai dû piquer une barrette pour un autre PC, je l’ai donc descendu à 4 Go de ram, ce qui me semblait largement suffisant pour fonctionner.
Le lendemain, j’ai lancé la mise à jour de nextcloud vers nextcloud 21. Le serveur a planté complètement, et en rentrant j’ai vu qu’il affichait (sur l’écran, impossible de se connecter en ssh) une erreur “out of memory”. Si j’ai bien compris, il est arrivé à cours de mémoire (j’ai aussi 6 Go de swap pourtant), du coup il s’est mis à tuer des processus un peu au pif pour récupérer de la mémoire, et il a planté.
Après redémarrage, j’ai repris la main dessus, j’ai pu désinstaller nextcloud (qui était cassé, car interrompu en pleine mise à jour), et restaurer le backup pre-upgrade. J’ai aussi etherpad qui était à moitié cassé (il manquait des trucs sur l’interface), je l’ai désinstallé / restauré un backup.
Depuis, il marche, mais assez mal : il est lent à répondre, parfois il faut recharger plusieurs fois une page web pour qu’elle s’affiche, etc… Et parfois il marche normalement.

Je n’ai pas l’impression que c’est juste un problème de ressources, quand il marche mal ça ne correspond par forcément à des moments où la ram est saturée, et le processeur est assez bas en général. Du coup j’ai l’impression qu’il y a autre chose qui a été cassé, mais je n’ai aucune idée de comment investiguer plus. Le diag de yunohost me dit que tout est ok.

Si quelqu’un a une piste…

C’est très bizarre. Mon serveur avec 3Go de ram et 6Go de swap n’a pas de problème. Mise à jour assez rapide, pas de consommation excessive de ram. J’ai installé : nextcloud, netdata (pour suivre l’état du serveur) , horde, photoview, phpsysinfo, et d’autres petits trucs.
Je te conseille de commencer par vérifier l’état smart de ton disque (j’en ai fait les frais la semaine dernière) et memtest, il est fort probable que la barrette mémoire restante soit défectueuse et que le serveur utilisait l’autre sans jamais dépasser sa capacité pour “aller voir” celle que tu as laissé.

L’analyse des performances et de l’état du disque avec smartctl est une idée.

Sinon quelques pistes à essayer:

  • un problème d’électricité statique (pour le résoudre tu peux essayer de débrancher tous les câbles de l’ordi, puis appuyer sur le bouton power pendant plus de 30s). Je penche pour cette solution, si tu n’as pas pensé à décharger ta propre électricité statique avant de procéder au retrait de la ram : Comment évacuer l’électricité statique lors du montage de son PC
  • un problème de nouveau kernel lors d’une maj
  • tenter par dicotomie de trouver une application responsable (tu peux commencer par toutes les éteindre et voir si c’est toujours lent)
  • tenter de remettre la ram ou de l’échanger et voir si le soucis persiste

Salut,
Merci pour les pistes, a priori c’est bien la ram qui ralentissait le serveur, j’en ai remis (je suis même passé à 12 Go), et il a retrouvé sa vélocité.
Par contre la mise à jour Nextcloud m’a re-planté le serveur quand même, pour la même cause : out of memory, donc ça sent la fuite de mémoire.
J’ai trouvé des pistes de solution ici : Upgrade from 20.0.8~ynh1 to 21.0.2~ynh1 failed · Issue #419 · YunoHost-Apps/nextcloud_ynh · GitHub, pas encore eu le temps de tester.

Nikel, ça a marché pour moi, merci !