Lancer un fsck des partitions sur un RAID

Mon serveur YunoHost

Matériel: Raspberry Pi à la maison
Version de YunoHost: x.x.x
J’ai accès à mon serveur : En SSH
Êtes-vous dans un contexte particulier ou avez-vous effectué des modificiations particulières sur votre instance ? : non

Description du problème

Bonjour, je rencontre des problèmes de filesystem (des badblocks) sur mon installation yunohost. Le serveur est un raspberrypi sur lequel est branché un RAID 1 avec 2 HDD dans un boitier USB. Le raid comporte 3 partitions LVM montées sur /tmp /home et /var.
ça ressemble à ça:

NAME                MAJ:MIN RM   SIZE RO TYPE  MOUNTPOINT
sda                   8:0    0   1.8T  0 disk  
└─sda1                8:1    0   1.8T  0 part  
  └─md0               9:0    0   1.8T  0 raid1 
    ├─vg--raid-tmp  253:0    0    10G  0 lvm   /tmp
    ├─vg--raid-home 253:1    0   900G  0 lvm   /home
    └─vg--raid-var  253:2    0 952.9G  0 lvm   /var
sdb                   8:16   0   1.8T  0 disk  
└─sdb1                8:17   0   1.8T  0 part  
  └─md0               9:0    0   1.8T  0 raid1 
    ├─vg--raid-tmp  253:0    0    10G  0 lvm   /tmp
    ├─vg--raid-home 253:1    0   900G  0 lvm   /home
    └─vg--raid-var  253:2    0 952.9G  0 lvm   /var
mmcblk0             179:0    0  14.9G  0 disk  
├─mmcblk0p1         179:1    0  43.9M  0 part  /boot
└─mmcblk0p2         179:2    0  14.8G  0 part  /

Il semble que le problème vienne du RAID

[  315.369415] EXT4-fs (dm-2): error count since last fsck: 27
[  315.369440] EXT4-fs (dm-2): initial error at time 1609485436: ext4_dx_find_entry:1525: inode 15597569: block 3
[  315.369482] EXT4-fs (dm-2): last error at time 1615187739: ext4_validate_block_bitmap:390
[86808.041056] EXT4-fs (dm-2): error count since last fsck: 27
[86808.041128] EXT4-fs (dm-2): initial error at time 1609485436: ext4_dx_find_entry:1525: inode 15597569: block 3
[86808.041212] EXT4-fs (dm-2): last error at time 1615187739: ext4_validate_block_bitmap:390
[173316.092558] EXT4-fs (dm-2): error count since last fsck: 27
[173316.092609] EXT4-fs (dm-2): initial error at time 1609485436: ext4_dx_find_entry:1525: inode 15597569: block 3
[173316.092708] EXT4-fs (dm-2): last error at time 1615187739: ext4_validate_block_bitmap:390

Il faudrait que je puisse lancer un e2fsck mais pour ça je dois démonter mes partitions.
Or, je n’arrive pas à les démonter car yunohost tourne et je me prend une erreur BUSY (logique).
D’où ma question dans le titre du sujet, est il possible de couper yunohost pour pouvoir démonter mes partitions et lancer un scan.
Ça serait beaucoup plus simple de le faire en SSH… sinon je vais devoir recréer le raid sur un autre ordi pour lancer efck, et je suis clairement moins emballé…

Merci à vous.

Je suis une quiche la dedans (du coup j’ai pris un boitier externe qui gère lui même le raid), mais la est ce que tu ne peux pas démonter un des deux disques juste ?
Puis faire le check dessus, puis le monter et démonter l’autre pour recommencer ?

Si j’ai bien compris le concept, la il y a un des 2 disques qui a du mal et il faudrait déterminer lequel pour pouvoir le remplacer ?

Non pas vraiment un mdam me dit bien que mon RAID est OK:

sudo mdadm --detail /dev/md0
/dev/md0:
           Version : 1.2
     Creation Time : Mon Jun 15 18:35:14 2020
        Raid Level : raid1
        Array Size : 1953382464 (1862.89 GiB 2000.26 GB)
     Used Dev Size : 1953382464 (1862.89 GiB 2000.26 GB)
      Raid Devices : 2
     Total Devices : 2
       Persistence : Superblock is persistent

     Intent Bitmap : Internal

       Update Time : Wed Mar 10 15:01:19 2021
             State : clean 
    Active Devices : 2
   Working Devices : 2
    Failed Devices : 0
     Spare Devices : 0

Consistency Policy : bitmap

              Name : xxxxxxxxx:0  (local to host xxxxxxxxx)
              UUID : 5f6fc4d7:74110a6f:c6bd0643:8fa1f3bb
            Events : 264890

    Number   Major   Minor   RaidDevice State
       0       8        1        0      active sync   /dev/sda1
       1       8       17        1      active sync   /dev/sdb1

Là c’est vraiment un problème de système de fichier, le raid n’y est pas pour grand chose. Je pourrai avoir le problème avec un seul disque.
Là où c’est plus compliqué, c’est qu’avec un seul disque j’aurais juste eu à le débrancher, tester sur un autre ordi et c’était bon. Là comme c’est un RAID logiciel, si je veux tester sur un autre ordi il faut que j’arrive à reconstruire le raid sans rien péter, donc je préfèrerais trouver un moyen de lancer fsk sans rien débrancher…

Pour désactiver le daemon yunohost:

systemctl stop yunohost-api

Mais pas sûr que ça suffise, tu as /var dans ton raid… C’est utilisé par plein de programme.

La solution de reconstruire le raid sur un autre système est probablement ce qui est à faire.
Mais je t’accorde ça fait toujours peur quand on réassemble la grappe raid car on a peur de l’effacer. Il y a des tutos qui explique comment faire ça.

@ljf effectivement ça n’a pas suffit, /var restait busy malgré tout.

J’ai donc reconstruit mon raid sur mon ordi perso (c’était relativement facile au final) puis j’ai lancé mon scan qui a trouvé et corrigé des erreurs sur mes partitions.
Une fois le raid rebranché sur le serveur, je n’ai plus d’erreurs dans les logs! :tada:

Par contre je m’interroge sur la fiabilité, j’ai l’impression que RAID logiciel sur un pi pas très puissant + disques (de portable, pas serveurs) eux même dans un boitier usb externe et branchés en USB n’est PAS une bonne idée pour avoir un serveur fiable… :roll_eyes:

De ma petite expérience quand j’avais mon serveur sur un raspberry : il vaut vraiment mieux que tes disques aient leur propre alimentation, le raspi ne tiendra pas la charge.

Ah et j’ai vu plusieurs articles qui disaient que l’USB c’était tout nul pour gérer des disques et que certains types de partitions n’étaient pas recommandés dessus (genre btrfs), du coup je suppose que globalement ce n’est pas idéal.
(Mais j’ai aussi mes disques en USB, suite à un choix de matériel qui était obligatoire à l’époque où j’ai changé de serveur, pas la place de mettre des disques dedans, enfin pas plus d’un petit)

Les disques sont dans un boitier qui a sa propre alimentation (je suis même pas sûr que ça marcherait sans ça)

Mes partitions sont du LVM, c’était peut être pas une bonne idée avec de l’USB? Je vais chercher.

This topic was automatically closed 15 days after the last reply. New replies are no longer allowed.