mm/mglru: try to stop at high watermarks

author Yu Zhao <yuzhao@google.com>

Fri, 8 Dec 2023 06:14:05 +0000 (23:14 -0700)

committer Greg Kroah-Hartman <gregkh@linuxfoundation.org>

Wed, 20 Dec 2023 16:02:02 +0000 (17:02 +0100)
author Yu Zhao <yuzhao@google.com>
Fri, 8 Dec 2023 06:14:05 +0000 (23:14 -0700)
committer Greg Kroah-Hartman <gregkh@linuxfoundation.org>
Wed, 20 Dec 2023 16:02:02 +0000 (17:02 +0100)
diff --git a/mm/vmscan.c b/mm/vmscan.c

index 65ef14146c851f0e1fa50b131b662ff780701a82..a4f599ea3e06355fff149393516fcaf77f2602a1 100644 (file)
--- a/mm/vmscan.c
+++ b/mm/vmscan.c
@@ -5341,20 +5341,41 @@ static long get_nr_to_scan(struct lruvec *lruvec, struct scan_control *sc, bool
         return try_to_inc_max_seq(lruvec, max_seq, sc, can_swap, false) ? -1 : 0;
  }
  
-static unsigned long get_nr_to_reclaim(struct scan_control *sc)
+static bool should_abort_scan(struct lruvec *lruvec, struct scan_control *sc)
  {
+       int i;
+       enum zone_watermarks mark;
+
         /* don't abort memcg reclaim to ensure fairness */
         if (!root_reclaim(sc))
-               return -1;
+               return false;
+
+       if (sc->nr_reclaimed >= max(sc->nr_to_reclaim, compact_gap(sc->order)))
+               return true;
+
+       /* check the order to exclude compaction-induced reclaim */
+       if (!current_is_kswapd() || sc->order)
+               return false;
  
-       return max(sc->nr_to_reclaim, compact_gap(sc->order));
+       mark = sysctl_numa_balancing_mode & NUMA_BALANCING_MEMORY_TIERING ?
+              WMARK_PROMO : WMARK_HIGH;
+
+       for (i = 0; i <= sc->reclaim_idx; i++) {
+               struct zone *zone = lruvec_pgdat(lruvec)->node_zones + i;
+               unsigned long size = wmark_pages(zone, mark) + MIN_LRU_BATCH;
+
+               if (managed_zone(zone) && !zone_watermark_ok(zone, 0, size, sc->reclaim_idx, 0))
+                       return false;
+       }
+
+       /* kswapd should abort if all eligible zones are safe */
+       return true;
  }
  
  static bool try_to_shrink_lruvec(struct lruvec *lruvec, struct scan_control *sc)
  {
         long nr_to_scan;
         unsigned long scanned = 0;
-       unsigned long nr_to_reclaim = get_nr_to_reclaim(sc);
         int swappiness = get_swappiness(lruvec, sc);
  
         /* clean file folios are more likely to exist */
@@ -5376,7 +5397,7 @@ static bool try_to_shrink_lruvec(struct lruvec *lruvec, struct scan_control *sc)
                 if (scanned >= nr_to_scan)
                         break;
  
-               if (sc->nr_reclaimed >= nr_to_reclaim)
+               if (should_abort_scan(lruvec, sc))
                         break;
  
                 cond_resched();
@@ -5437,7 +5458,6 @@ static void shrink_many(struct pglist_data *pgdat, struct scan_control *sc)
         struct lru_gen_folio *lrugen;
         struct mem_cgroup *memcg;
         const struct hlist_nulls_node *pos;
-       unsigned long nr_to_reclaim = get_nr_to_reclaim(sc);
  
         bin = first_bin = get_random_u32_below(MEMCG_NR_BINS);
  restart:
@@ -5470,7 +5490,7 @@ restart:
  
                 rcu_read_lock();
  
-               if (sc->nr_reclaimed >= nr_to_reclaim)
+               if (should_abort_scan(lruvec, sc))
                         break;
         }
  
@@ -5481,7 +5501,7 @@ restart:
  
         mem_cgroup_put(memcg);
  
-       if (sc->nr_reclaimed >= nr_to_reclaim)
+       if (!is_a_nulls(pos))
                 return;
  
         /* restart if raced with lru_gen_rotate_memcg() */
author	Yu Zhao <yuzhao@google.com>
	Fri, 8 Dec 2023 06:14:05 +0000 (23:14 -0700)
committer	Greg Kroah-Hartman <gregkh@linuxfoundation.org>
	Wed, 20 Dec 2023 16:02:02 +0000 (17:02 +0100)