AArch32: Add support for sign differing dot-product usdot for NEON.

author Tamar Christina <tamar.christina@arm.com>

Wed, 14 Jul 2021 14:20:45 +0000 (15:20 +0100)

committer Tamar Christina <tamar.christina@arm.com>

Wed, 14 Jul 2021 14:20:45 +0000 (15:20 +0100)
author Tamar Christina <tamar.christina@arm.com>
Wed, 14 Jul 2021 14:20:45 +0000 (15:20 +0100)
committer Tamar Christina <tamar.christina@arm.com>
Wed, 14 Jul 2021 14:20:45 +0000 (15:20 +0100)
diff --git a/gcc/config/arm/neon.md b/gcc/config/arm/neon.md

index 64365e0..8b0a396 100644 (file)
--- a/gcc/config/arm/neon.md
+++ b/gcc/config/arm/neon.md
@@ -2969,6 +2969,18 @@
    DONE;
  })
  
+;; Auto-vectorizer pattern for usdot
+(define_expand "usdot_prod<vsi2qi>"
+  [(set (match_operand:VCVTI 0 "register_operand")
+       (plus:VCVTI (unspec:VCVTI [(match_operand:<VSI2QI> 1
+                                                       "register_operand")
+                                  (match_operand:<VSI2QI> 2
+                                                       "register_operand")]
+                    UNSPEC_DOT_US)
+                   (match_operand:VCVTI 3 "register_operand")))]
+  "TARGET_I8MM"
+)
+
  (define_expand "neon_copysignf<mode>"
    [(match_operand:VCVTF 0 "register_operand")
     (match_operand:VCVTF 1 "register_operand")
diff --git a/gcc/testsuite/gcc.target/arm/simd/vusdot-autovec.c b/gcc/testsuite/gcc.target/arm/simd/vusdot-autovec.c

new file mode 100644 (file)

index 0000000..7cc56f6
--- /dev/null
+++ b/gcc/testsuite/gcc.target/arm/simd/vusdot-autovec.c
@@ -0,0 +1,38 @@
+/* { dg-do compile } */
+/* { dg-options "-O3 -march=armv8.2-a+i8mm" } */
+
+#define N 480
+#define SIGNEDNESS_1 unsigned
+#define SIGNEDNESS_2 signed
+#define SIGNEDNESS_3 signed
+#define SIGNEDNESS_4 unsigned
+
+SIGNEDNESS_1 int __attribute__ ((noipa))
+f (SIGNEDNESS_1 int res, SIGNEDNESS_3 char *restrict a,
+   SIGNEDNESS_4 char *restrict b)
+{
+  for (__INTPTR_TYPE__ i = 0; i < N; ++i)
+    {
+      int av = a[i];
+      int bv = b[i];
+      SIGNEDNESS_2 short mult = av * bv;
+      res += mult;
+    }
+  return res;
+}
+
+SIGNEDNESS_1 int __attribute__ ((noipa))
+g (SIGNEDNESS_1 int res, SIGNEDNESS_3 char *restrict b,
+   SIGNEDNESS_4 char *restrict a)
+{
+  for (__INTPTR_TYPE__ i = 0; i < N; ++i)
+    {
+      int av = a[i];
+      int bv = b[i];
+      SIGNEDNESS_2 short mult = av * bv;
+      res += mult;
+    }
+  return res;
+}
+
+/* { dg-final { scan-assembler-times {vusdot.s8} 2 { target { arm-*-*-gnueabihf } } } } */
author	Tamar Christina <tamar.christina@arm.com>
	Wed, 14 Jul 2021 14:20:45 +0000 (15:20 +0100)
committer	Tamar Christina <tamar.christina@arm.com>
	Wed, 14 Jul 2021 14:20:45 +0000 (15:20 +0100)
gcc/config/arm/neon.md		patch \| blob \| history
gcc/testsuite/gcc.target/arm/simd/vusdot-autovec.c	[new file with mode: 0644]	patch \| blob