ocfs2/cluster: Increase the live threshold for global heartbeat
authorSunil Mushran <sunil.mushran@oracle.com>
Wed, 4 May 2011 17:28:00 +0000 (10:28 -0700)
committerJoel Becker <jlbec@evilplan.org>
Fri, 13 May 2011 18:26:48 +0000 (11:26 -0700)
commit76d9fc2954d057b19bf5d7b854df2b621b00fdec
treeca6725a08b9ffd79030d0bb22ec4c162f341f40e
parent4da6dc293604f55d156148b8f60b94053e3195fc
ocfs2/cluster: Increase the live threshold for global heartbeat

We have seen isolated cases (very few, I might add) of o2hb not detecting all
live nodes on startup. One plausible reasoning for it is that other node had
a hb io delay at the same time. The live threshold set at 2 (as low as it can
be) could be increased to ameliorate the situation.

But increasing the threshold directly affects mount time. Currently it takes
around 5 secs to mount a volume in o2cb cluster with local heartbeat. Increasing
the threshold will make mounts even slower. As the issue itself is rare, we have
left things as they are for the local heartbeat mode.

However we can improve the situation for global heartbeat mode as in that mode,
we start the heartbeat much before the mount.

This patch doubles the live threshold for the start of the first region in
global heartbeat mode.

Addresses internal Oracle bug#10635585.

Signed-off-by: Sunil Mushran <sunil.mushran@oracle.com>
Acked-by: Mark Fasheh <mfasheh@suse.com>
Signed-off-by: Joel Becker <jlbec@evilplan.org>
fs/ocfs2/cluster/heartbeat.c