[nvptx] Add bar.warp.sync

author Tom de Vries <tdevries@suse.de>

Thu, 27 Jan 2022 14:03:59 +0000 (15:03 +0100)

committer Tom de Vries <tdevries@suse.de>

Tue, 1 Feb 2022 18:28:57 +0000 (19:28 +0100)
author Tom de Vries <tdevries@suse.de>
Thu, 27 Jan 2022 14:03:59 +0000 (15:03 +0100)
committer Tom de Vries <tdevries@suse.de>
Tue, 1 Feb 2022 18:28:57 +0000 (19:28 +0100)
diff --git a/gcc/config/nvptx/nvptx.cc b/gcc/config/nvptx/nvptx.cc

index 262e8f9..1b91990 100644 (file)
--- a/gcc/config/nvptx/nvptx.cc
+++ b/gcc/config/nvptx/nvptx.cc
@@ -4598,6 +4598,7 @@ nvptx_single (unsigned mask, basic_block from, basic_block to)
    rtx_insn *neuter_start = NULL;
    rtx_insn *worker_label = NULL, *vector_label = NULL;
    rtx_insn *worker_jump = NULL, *vector_jump = NULL;
+  rtx_insn *warp_sync = NULL;
    for (mode = GOMP_DIM_WORKER; mode <= GOMP_DIM_VECTOR; mode++)
      if (GOMP_DIM_MASK (mode) & skip_mask)
        {
@@ -4630,11 +4631,15 @@ nvptx_single (unsigned mask, basic_block from, basic_block to)
         if (tail_branch)
           {
             label_insn = emit_label_before (label, before);
+           if (TARGET_PTX_6_0 && mode == GOMP_DIM_VECTOR)
+             warp_sync = emit_insn_after (gen_nvptx_warpsync (), label_insn);
             before = label_insn;
           }
         else
           {
             label_insn = emit_label_after (label, tail);
+           if (TARGET_PTX_6_0 && mode == GOMP_DIM_VECTOR)
+             warp_sync = emit_insn_after (gen_nvptx_warpsync (), label_insn);
             if ((mode == GOMP_DIM_VECTOR || mode == GOMP_DIM_WORKER)
                 && CALL_P (tail) && find_reg_note (tail, REG_NORETURN, NULL))
               emit_insn_after (gen_exit (), label_insn);
@@ -4702,6 +4707,8 @@ nvptx_single (unsigned mask, basic_block from, basic_block to)
                  setp.ne.u32 %rcond,%rcondu32,0;
           */
           rtx_insn *label = PREV_INSN (tail);
+         if (label == warp_sync)
+           label = PREV_INSN (label);
           gcc_assert (label && LABEL_P (label));
           rtx tmp = gen_reg_rtx (BImode);
           emit_insn_before (gen_movbi (tmp, const0_rtx),
diff --git a/gcc/config/nvptx/nvptx.md b/gcc/config/nvptx/nvptx.md

index b391165..b4c7cd6 100644 (file)
--- a/gcc/config/nvptx/nvptx.md
+++ b/gcc/config/nvptx/nvptx.md
@@ -56,6 +56,7 @@
     UNSPECV_CAS
     UNSPECV_XCHG
     UNSPECV_BARSYNC
+   UNSPECV_WARPSYNC
     UNSPECV_MEMBAR
     UNSPECV_MEMBAR_CTA
     UNSPECV_MEMBAR_GL
@@ -1978,6 +1979,12 @@
    }
    [(set_attr "predicable" "false")])
  
+(define_insn "nvptx_warpsync"
+  [(unspec_volatile [(const_int 0)] UNSPECV_WARPSYNC)]
+  "TARGET_PTX_6_0"
+  "\\tbar.warp.sync\\t0xffffffff;"
+  [(set_attr "predicable" "false")])
+
  (define_expand "memory_barrier"
    [(set (match_dup 0)
         (unspec_volatile:BLK [(match_dup 0)] UNSPECV_MEMBAR))]
author	Tom de Vries <tdevries@suse.de>
	Thu, 27 Jan 2022 14:03:59 +0000 (15:03 +0100)
committer	Tom de Vries <tdevries@suse.de>
	Tue, 1 Feb 2022 18:28:57 +0000 (19:28 +0100)
gcc/config/nvptx/nvptx.cc		patch \| blob \| history
gcc/config/nvptx/nvptx.md		patch \| blob \| history