aco: use and swizzle mask in dpp quad perm
authorGeorg Lehmann <dadschoorse@gmail.com>
Thu, 23 Feb 2023 10:35:13 +0000 (11:35 +0100)
committerMarge Bot <emma+marge@anholt.net>
Mon, 27 Feb 2023 11:09:42 +0000 (11:09 +0000)
Reviewed-by: Rhys Perry <pendingchaos02@gmail.com>
Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/21412>

src/amd/compiler/aco_instruction_selection.cpp

index 9a47f3d..2d01343 100644 (file)
@@ -253,10 +253,10 @@ emit_masked_swizzle(isel_context* ctx, Builder& bld, Temp src, unsigned mask)
        * because DPP16 supports modifiers and v_permlane
        * can't be folded into valu instructions.
        */
-      if (and_mask == 0x1f && or_mask < 4 && xor_mask < 4) {
+      if ((and_mask & 0x1c) == 0x1c && or_mask < 4 && xor_mask < 4) {
          unsigned res[4] = {0, 1, 2, 3};
          for (unsigned i = 0; i < 4; i++)
-            res[i] = ((res[i] | or_mask) ^ xor_mask) & 0x3;
+            res[i] = (((res[i] & and_mask) | or_mask) ^ xor_mask) & 0x3;
          dpp_ctrl = dpp_quad_perm(res[0], res[1], res[2], res[3]);
       } else if (and_mask == 0x1f && !or_mask && xor_mask == 8) {
          dpp_ctrl = dpp_row_rr(8);