block: don't allow the same type rq_qos add more than once
authorJinke Han <hanjinke.666@bytedance.com>
Wed, 20 Jul 2022 09:36:16 +0000 (17:36 +0800)
committerJens Axboe <axboe@kernel.dk>
Wed, 20 Jul 2022 12:44:14 +0000 (06:44 -0600)
commit14a6e2eb7df5c7897c15b109cba29ab0c4a791b6
treecdd54c468148f2449898595522e500995046ad5f
parentbf14fad19ffbb3d37a1bb1324f966973e7d4a7b6
block: don't allow the same type rq_qos add more than once

In our test of iocost, we encountered some list add/del corruptions of
inner_walk list in ioc_timer_fn.

The reason can be described as follows:

cpu 0 cpu 1
ioc_qos_write ioc_qos_write

ioc = q_to_ioc(queue);
if (!ioc) {
        ioc = kzalloc();
ioc = q_to_ioc(queue);
if (!ioc) {
ioc = kzalloc();
...
rq_qos_add(q, rqos);
}
        ...
        rq_qos_add(q, rqos);
        ...
}

When the io.cost.qos file is written by two cpus concurrently, rq_qos may
be added to one disk twice. In that case, there will be two iocs enabled
and running on one disk. They own different iocgs on their active list. In
the ioc_timer_fn function, because of the iocgs from two iocs have the
same root iocg, the root iocg's walk_list may be overwritten by each other
and this leads to list add/del corruptions in building or destroying the
inner_walk list.

And so far, the blk-rq-qos framework works in case that one instance for
one type rq_qos per queue by default. This patch make this explicit and
also fix the crash above.

Signed-off-by: Jinke Han <hanjinke.666@bytedance.com>
Reviewed-by: Muchun Song <songmuchun@bytedance.com>
Acked-by: Tejun Heo <tj@kernel.org>
Cc: <stable@vger.kernel.org>
Link: https://lore.kernel.org/r/20220720093616.70584-1-hanjinke.666@bytedance.com
Signed-off-by: Jens Axboe <axboe@kernel.dk>
block/blk-iocost.c
block/blk-iolatency.c
block/blk-rq-qos.h
block/blk-wbt.c