ocfs2: Allow smaller allocations during large writes
authorMark Fasheh <mark.fasheh@oracle.com>
Mon, 17 Sep 2007 03:10:16 +0000 (20:10 -0700)
committerMark Fasheh <mark.fasheh@oracle.com>
Thu, 20 Sep 2007 22:06:09 +0000 (15:06 -0700)
commit415cb800375cc4e89fb5a6a454e484bd4adbffb4
tree816021a5279047702d5fa8180783b1c710f31746
parent6d0b842d3bf0cc027dcff57a89fb8a6b1fd610e1
ocfs2: Allow smaller allocations during large writes

The ocfs2 write code loops through a page much like the block code, except
that ocfs2 allocation units can be any size, including larger than page
size. Typically it's equal to or larger than page size - most kernels run 4k
pages, the minimum ocfs2 allocation (cluster) size.

Some changes introduced during 2.6.23 changed the way writes to pages are
handled, and inadvertantly broke support for > 4k page size. Instead of just
writing one cluster at a time, we now handle the whole page in one pass.

This means that multiple (small) seperate allocations might happen in the
same pass. The allocation code howver typically optimizes by getting the
maximum which was reserved. This triggered a BUG_ON in the extend code where
it'd ask for a single bit (for one part of a > 4k page) and get back more
than it asked for.

Fix this by providing a variant of the high level allocation function which
allows the caller to specify a maximum. The traditional function remains and
just calls the new one with a maximum determined from the initial
reservation.

Signed-off-by: Mark Fasheh <mark.fasheh@oracle.com>
fs/ocfs2/file.c
fs/ocfs2/localalloc.c
fs/ocfs2/localalloc.h
fs/ocfs2/suballoc.c
fs/ocfs2/suballoc.h