btrfs: prefetch chunk tree leaves at mount
authorDavid Sterba <dsterba@suse.com>
Wed, 8 Jul 2020 20:55:14 +0000 (22:55 +0200)
committerDavid Sterba <dsterba@suse.com>
Mon, 27 Jul 2020 10:55:43 +0000 (12:55 +0200)
The whole chunk tree is read at mount time so we can utilize readahead
to get the tree blocks to memory before we read the items. The idea is
from Robbie, but instead of updating search slot readahead, this patch
implements the chunk tree readahead manually from nodes on level 1.

We've decided to do specific readahead optimizations and then unify them
under a common API so we don't break everything by changing the search
slot readahead logic.

Higher chunk trees grow on large filesystems (many terabytes), and
prefetching just level 1 seems to be sufficient. Provided example was
from a 200TiB filesystem with chunk tree level 2.

CC: Robbie Ko <robbieko@synology.com>
Reviewed-by: Josef Bacik <josef@toxicpanda.com>
Signed-off-by: David Sterba <dsterba@suse.com>
fs/btrfs/volumes.c

index 1921334..c1a4dab 100644 (file)
@@ -7013,6 +7013,19 @@ out:
        return ret;
 }
 
+static void readahead_tree_node_children(struct extent_buffer *node)
+{
+       int i;
+       const int nr_items = btrfs_header_nritems(node);
+
+       for (i = 0; i < nr_items; i++) {
+               u64 start;
+
+               start = btrfs_node_blockptr(node, i);
+               readahead_tree_block(node->fs_info, start);
+       }
+}
+
 int btrfs_read_chunk_tree(struct btrfs_fs_info *fs_info)
 {
        struct btrfs_root *root = fs_info->chunk_root;
@@ -7023,6 +7036,7 @@ int btrfs_read_chunk_tree(struct btrfs_fs_info *fs_info)
        int ret;
        int slot;
        u64 total_dev = 0;
+       u64 last_ra_node = 0;
 
        path = btrfs_alloc_path();
        if (!path)
@@ -7056,6 +7070,8 @@ int btrfs_read_chunk_tree(struct btrfs_fs_info *fs_info)
        if (ret < 0)
                goto error;
        while (1) {
+               struct extent_buffer *node;
+
                leaf = path->nodes[0];
                slot = path->slots[0];
                if (slot >= btrfs_header_nritems(leaf)) {
@@ -7066,6 +7082,17 @@ int btrfs_read_chunk_tree(struct btrfs_fs_info *fs_info)
                                goto error;
                        break;
                }
+               /*
+                * The nodes on level 1 are not locked but we don't need to do
+                * that during mount time as nothing else can access the tree
+                */
+               node = path->nodes[1];
+               if (node) {
+                       if (last_ra_node != node->start) {
+                               readahead_tree_node_children(node);
+                               last_ra_node = node->start;
+                       }
+               }
                btrfs_item_key_to_cpu(leaf, &found_key, slot);
                if (found_key.type == BTRFS_DEV_ITEM_KEY) {
                        struct btrfs_dev_item *dev_item;