[nvptx] Workaround sub.u16 driver JIT bug

author Tom de Vries <tdevries@suse.de>

Mon, 7 Feb 2022 13:12:34 +0000 (14:12 +0100)

committer Tom de Vries <tdevries@suse.de>

Thu, 10 Feb 2022 08:50:49 +0000 (09:50 +0100)
author Tom de Vries <tdevries@suse.de>
Mon, 7 Feb 2022 13:12:34 +0000 (14:12 +0100)
committer Tom de Vries <tdevries@suse.de>
Thu, 10 Feb 2022 08:50:49 +0000 (09:50 +0100)
diff --git a/gcc/config/nvptx/nvptx.md b/gcc/config/nvptx/nvptx.md

index bb0c0b3..cced68e 100644 (file)
--- a/gcc/config/nvptx/nvptx.md
+++ b/gcc/config/nvptx/nvptx.md
@@ -506,7 +506,14 @@
         (minus:HSDIM (match_operand:HSDIM 1 "nvptx_register_operand" "R")
                      (match_operand:HSDIM 2 "nvptx_register_operand" "R")))]
    ""
-  "%.\\tsub%t0\\t%0, %1, %2;")
+  {
+    if (GET_MODE (operands[0]) == HImode)
+      /* Workaround https://developer.nvidia.com/nvidia_bug/3527713.
+        See PR97005.  */
+      return "%.\\tsub.s16\\t%0, %1, %2;";
+
+    return "%.\\tsub%t0\\t%0, %1, %2;";
+  })
  
  (define_insn "mul<mode>3"
    [(set (match_operand:HSDIM 0 "nvptx_register_operand" "=R")
author	Tom de Vries <tdevries@suse.de>
	Mon, 7 Feb 2022 13:12:34 +0000 (14:12 +0100)
committer	Tom de Vries <tdevries@suse.de>
	Thu, 10 Feb 2022 08:50:49 +0000 (09:50 +0100)