GFS2: Flush work queue before clearing glock hash tables
authorBob Peterson <rpeterso@redhat.com>
Thu, 25 Apr 2013 16:49:17 +0000 (12:49 -0400)
committerSteven Whitehouse <swhiteho@redhat.com>
Fri, 26 Apr 2013 09:09:04 +0000 (10:09 +0100)
commit222cb538f5f18741466dc27cc6cf4375bccf1f89
treea1cd04d4703bd7b436dce16e391012ef09e1e7fd
parent7bd8b2eb32c404ebe61986083ce02642b6ff3bf6
GFS2: Flush work queue before clearing glock hash tables

There was a timing window when a GFS2 file system was unmounted
that caused GFS2 to call BUG() and panic the kernel. The call
to BUG() is meant to ensure that the glock reference count,
gl_ref, never gets down to zero and bounce back up again. What was
happening during umount is that function gfs2_put_super was dequeing
its glocks for well-known files. In particular, we saw it on the
journal glock, sd_jinode_gh. The dequeue caused delayed work to be
queued for the glock state machine, to transition the lock to an
"unlocked" state. While the work was still queued, gfs2_put_super
called gfs2_gl_hash_clear to clear out the glock hash tables.
If the timing was just so, the glock work function would drop the
reference count at the time when it was being checked for zero,
and that caused BUG() to be called. This patch calls
flush_workqueue before clearing the glock hash tables, thereby
ensuring that the delayed work is executed before the hash tables
are cleared, and therefore the reference count never goes to zero
until the glock is cleared.

Signed-off-by: Bob Peterson <rpeterso@redhat.com>
Signed-off-by: Steven Whitehouse <swhiteho@redhat.com>
fs/gfs2/glock.c