3 --dir=FWD_B --batch=conv_tails
4 --dir=BWD_D --batch=conv_tails
5 --dir=BWD_WB --batch=conv_tails
8 --reset --cfg=f32_wino --alg=wino
9 --allow-unimpl=true # allow unimplemented for groups > 1
10 --match=.*kh3[^0-9].* # only 3x3 convolutions so far
11 --dir=FWD_B --batch=conv_tails
12 --dir=BWD_D --batch=conv_tails
13 --dir=BWD_WB --batch=conv_tails