What type of hardware are you using: Old laptop or computer
What YunoHost version are you running: 12.1.39
How are you able to access your server: The webadmin
SSH
Are you in a special context or did you perform specific tweaking on your YunoHost instance ?: non
Describe your issue
Bonjour,
Je rencontre des alertes répétées de smartd sur un serveur YunoHost basé sur Debian Bookworm.
J’ai cherché sur le forum et trouvé un sujet proche autour d’un NVMe potentiellement défaillant, mais mon cas semble un peu différent : les indicateurs critiques du SSD sont bons, et l’alerte semble liée au compteur NVMe Error Information Log Entries.
Le serveur est à jour : sudo yunohost tools update
Résultat : aucun paquet à mettre à jour.
Version de smartmontools : apt policy smartmontools
Résultat : smartmontools:
Installé : 7.3-1+b1
Candidat : 7.3-1+b1
Le mail reçu par smartd est le suivant :
SMART error (ErrorCount) detected on host: lab
Device: /dev/nvme0, number of Error Log entries increased from 114 to 116
Device info:
OM3PDP3-AD NVMe KDI 512GB, S/N:50026B72831379B4, FW:10100002, 512 GB
État SMART du SSD :
SMART overall-health self-assessment test result: PASSED
Critical Warning: 0x00
Temperature: 32 Celsius
Available Spare: 100%
Available Spare Threshold: 50%
Percentage Used: 0%
Data Units Written: 715785 [366 GB]
Power On Hours: 7
Unsafe Shutdowns: 30
Media and Data Integrity Errors: 0
Error Information Log Entries: 116
Journal d’erreur NVMe : sudo smartctl -l error /dev/nvme0
Résultat : Error Information (NVMe Log 0x01, 16 of 16 entries)
Num ErrCount SQId CmdId Status PELoc LBA NSID VS
0 116 0 0x4019 0x4005 0x028 0 0 -
À première vue, le SSD semble sain : PASSED, Critical Warning: 0x00, Available Spare: 100%, Percentage Used: 0%, Media and Data Integrity Errors: 0.
J’ai aussi vu le bug Debian #1041745, qui semble correspondre au message :
Device: /dev/nvme0, number of Error Log entries increased
Ce bug est indiqué comme trouvé dans smartmontools 7.3-1 et corrigé dans smartmontools 7.4-1.
Je sais aussi que YunoHost déconseille l’usage des backports, donc je préfère éviter d’activer bookworm-backports ou d’installer smartmontools 7.4 sans avis.
Quelle serait la recommandation propre côté YunoHost ?
Considérer cette alerte comme non critique tant que les indicateurs SMART critiques restent bons ?
Modifier /etc/smartd.conf pour surveiller explicitement /dev/nvme0 avec les indicateurs importants, mais sans surveiller l’augmentation du NVMe Error Log ?
Éviter toute modification et attendre une éventuelle mise à jour Debian/YunoHost ?
Installer smartmontools 7.4 depuis backports de manière ciblée est-il acceptable sur YunoHost, ou déconseillé ?
YunoHost pourrait-il documenter ce cas, car l’alerte est assez anxiogène alors que le SSD semble sain ?
Je cherche surtout à éviter deux erreurs :
masquer une vraie panne SSD ;
recevoir des alertes quotidiennes pour un compteur qui semble augmenter à cause d’une commande NVMe invalide ou non supportée.
Merci pour vos avis.
Share relevant logs or error messages
SMART error (ErrorCount) detected on host: lab
Device: /dev/nvme0, number of Error Log entries increased from 114 to 116
Device info:
OM3PDP3-AD NVMe KDI 512GB, S/N:50026B72831379B4, FW:10100002, 512 GB
Error Information (NVMe Log 0x01, 16 of 16 entries)
Num ErrCount SQId CmdId Status PELoc LBA NSID VS
0 116 0 0x4019 0x4005 0x028 0 0 -