raid5: introduce MD_BROKEN

author Mariusz Tkaczyk <mariusz.tkaczyk@linux.intel.com>

Tue, 22 Mar 2022 15:23:39 +0000 (16:23 +0100)

committer Song Liu <song@kernel.org>

Mon, 25 Apr 2022 21:00:35 +0000 (14:00 -0700)
author Mariusz Tkaczyk <mariusz.tkaczyk@linux.intel.com>
Tue, 22 Mar 2022 15:23:39 +0000 (16:23 +0100)
committer Song Liu <song@kernel.org>
Mon, 25 Apr 2022 21:00:35 +0000 (14:00 -0700)
diff --git a/drivers/md/raid5.c b/drivers/md/raid5.c

index 59f91e3..f22e0da 100644 (file)
--- a/drivers/md/raid5.c
+++ b/drivers/md/raid5.c
@@ -686,17 +686,17 @@ int raid5_calc_degraded(struct r5conf *conf)
         return degraded;
  }
  
-static int has_failed(struct r5conf *conf)
+static bool has_failed(struct r5conf *conf)
  {
-       int degraded;
+       int degraded = conf->mddev->degraded;
  
-       if (conf->mddev->reshape_position == MaxSector)
-               return conf->mddev->degraded > conf->max_degraded;
+       if (test_bit(MD_BROKEN, &conf->mddev->flags))
+               return true;
  
-       degraded = raid5_calc_degraded(conf);
-       if (degraded > conf->max_degraded)
-               return 1;
-       return 0;
+       if (conf->mddev->reshape_position != MaxSector)
+               degraded = raid5_calc_degraded(conf);
+
+       return degraded > conf->max_degraded;
  }
  
  struct stripe_head *
@@ -2863,34 +2863,31 @@ static void raid5_error(struct mddev *mddev, struct md_rdev *rdev)
         unsigned long flags;
         pr_debug("raid456: error called\n");
  
+       pr_crit("md/raid:%s: Disk failure on %s, disabling device.\n",
+               mdname(mddev), bdevname(rdev->bdev, b));
+
         spin_lock_irqsave(&conf->device_lock, flags);
+       set_bit(Faulty, &rdev->flags);
+       clear_bit(In_sync, &rdev->flags);
+       mddev->degraded = raid5_calc_degraded(conf);
  
-       if (test_bit(In_sync, &rdev->flags) &&
-           mddev->degraded == conf->max_degraded) {
-               /*
-                * Don't allow to achieve failed state
-                * Don't try to recover this device
-                */
+       if (has_failed(conf)) {
+               set_bit(MD_BROKEN, &conf->mddev->flags);
                 conf->recovery_disabled = mddev->recovery_disabled;
-               spin_unlock_irqrestore(&conf->device_lock, flags);
-               return;
+
+               pr_crit("md/raid:%s: Cannot continue operation (%d/%d failed).\n",
+                       mdname(mddev), mddev->degraded, conf->raid_disks);
+       } else {
+               pr_crit("md/raid:%s: Operation continuing on %d devices.\n",
+                       mdname(mddev), conf->raid_disks - mddev->degraded);
         }
  
-       set_bit(Faulty, &rdev->flags);
-       clear_bit(In_sync, &rdev->flags);
-       mddev->degraded = raid5_calc_degraded(conf);
         spin_unlock_irqrestore(&conf->device_lock, flags);
         set_bit(MD_RECOVERY_INTR, &mddev->recovery);
  
         set_bit(Blocked, &rdev->flags);
         set_mask_bits(&mddev->sb_flags, 0,
                       BIT(MD_SB_CHANGE_DEVS) | BIT(MD_SB_CHANGE_PENDING));
-       pr_crit("md/raid:%s: Disk failure on %s, disabling device.\n"
-               "md/raid:%s: Operation continuing on %d devices.\n",
-               mdname(mddev),
-               bdevname(rdev->bdev, b),
-               mdname(mddev),
-               conf->raid_disks - mddev->degraded);
         r5c_update_on_rdev_error(mddev, rdev);
  }
author	Mariusz Tkaczyk <mariusz.tkaczyk@linux.intel.com>
	Tue, 22 Mar 2022 15:23:39 +0000 (16:23 +0100)
committer	Song Liu <song@kernel.org>
	Mon, 25 Apr 2022 21:00:35 +0000 (14:00 -0700)