gfs2: Fix lru_count going negative
authorRoss Lagerwall <ross.lagerwall@citrix.com>
Wed, 27 Mar 2019 17:09:17 +0000 (17:09 +0000)
committerAndreas Gruenbacher <agruenba@redhat.com>
Tue, 7 May 2019 20:33:53 +0000 (22:33 +0200)
commit7881ef3f33bb80f459ea6020d1e021fc524a6348
treecfab62f5bb0959a8800e6cb4082700c2dbf86ab0
parent71921ef85928e95e3d942c747c9d40443a5ff775
gfs2: Fix lru_count going negative

Under certain conditions, lru_count may drop below zero resulting in
a large amount of log spam like this:

vmscan: shrink_slab: gfs2_dump_glock+0x3b0/0x630 [gfs2] \
    negative objects to delete nr=-1

This happens as follows:
1) A glock is moved from lru_list to the dispose list and lru_count is
   decremented.
2) The dispose function calls cond_resched() and drops the lru lock.
3) Another thread takes the lru lock and tries to add the same glock to
   lru_list, checking if the glock is on an lru list.
4) It is on a list (actually the dispose list) and so it avoids
   incrementing lru_count.
5) The glock is moved to lru_list.
5) The original thread doesn't dispose it because it has been re-added
   to the lru list but the lru_count has still decreased by one.

Fix by checking if the LRU flag is set on the glock rather than checking
if the glock is on some list and rearrange the code so that the LRU flag
is added/removed precisely when the glock is added/removed from lru_list.

Signed-off-by: Ross Lagerwall <ross.lagerwall@citrix.com>
Signed-off-by: Andreas Gruenbacher <agruenba@redhat.com>
fs/gfs2/glock.c