[AArch64_BE 1/4] Big-Endian lane numbering fix
authorAlex Velenko <Alex.Velenko@arm.com>
Thu, 23 Jan 2014 14:46:31 +0000 (14:46 +0000)
committerKyrylo Tkachov <ktkachov@gcc.gnu.org>
Thu, 23 Jan 2014 14:46:31 +0000 (14:46 +0000)
[gcc/]
2014-01-23  Alex Velenko  <Alex.Velenko@arm.com>

* config/aarch64/aarch64-simd.md (aarch64_be_ld1<mode>):
New define_insn.
(aarch64_be_st1<mode>): Likewise.
(aarch_ld1<VALL:mode>): Define_expand modified.
(aarch_st1<VALL:mode>): Likewise.
* config/aarch64/aarch64.md (UNSPEC_LD1): New unspec definition.
(UNSPEC_ST1): Likewise.

[gcc/testsuite/]
2014-01-23  Alex Velenko  <Alex.Velenko@arm.com>

* gcc.target/aarch64/vld1-vst1_1.c: New test_case.

From-SVN: r206968

gcc/ChangeLog
gcc/config/aarch64/aarch64-simd.md
gcc/config/aarch64/aarch64.md
gcc/testsuite/ChangeLog
gcc/testsuite/gcc.target/aarch64/vld1-vst1_1.c [new file with mode: 0644]

index f52752d..28e4162 100644 (file)
@@ -1,3 +1,13 @@
+2014-01-23  Alex Velenko  <Alex.Velenko@arm.com>
+
+       * config/aarch64/aarch64-simd.md (aarch64_be_ld1<mode>):
+       New define_insn.
+       (aarch64_be_st1<mode>): Likewise.
+       (aarch_ld1<VALL:mode>): Define_expand modified.
+       (aarch_st1<VALL:mode>): Likewise.
+       * config/aarch64/aarch64.md (UNSPEC_LD1): New unspec definition.
+       (UNSPEC_ST1): Likewise.
+
 2014-01-23  David Holsgrove <david.holsgrove@xilinx.com>
 
        * config/microblaze/microblaze.md: Add trap insn and attribute
index 43a9c5b..1454a7e 100644 (file)
    (set (attr "length") (symbol_ref "aarch64_simd_attr_length_move (insn)"))]
 )
 
+(define_insn "aarch64_be_ld1<mode>"
+  [(set (match_operand:VALLDI 0        "register_operand" "=w")
+       (unspec:VALLDI [(match_operand:VALLDI 1 "aarch64_simd_struct_operand" "Utv")]
+       UNSPEC_LD1))]
+  "TARGET_SIMD"
+  "ld1\\t{%0<Vmtype>}, %1"
+  [(set_attr "type" "neon_load1_1reg<q>")]
+)
+
+(define_insn "aarch64_be_st1<mode>"
+  [(set (match_operand:VALLDI 0 "aarch64_simd_struct_operand" "=Utv")
+       (unspec:VALLDI [(match_operand:VALLDI 1 "register_operand" "w")]
+       UNSPEC_ST1))]
+  "TARGET_SIMD"
+  "st1\\t{%1<Vmtype>}, %0"
+  [(set_attr "type" "neon_store1_1reg<q>")]
+)
+
 (define_split
   [(set (match_operand:OI 0 "register_operand" "")
        (match_operand:OI 1 "register_operand" ""))]
 {
   enum machine_mode mode = <VALL:MODE>mode;
   rtx mem = gen_rtx_MEM (mode, operands[1]);
-  emit_move_insn (operands[0], mem);
+
+  if (BYTES_BIG_ENDIAN)
+    emit_insn (gen_aarch64_be_ld1<VALL:mode> (operands[0], mem));
+  else
+    emit_move_insn (operands[0], mem);
   DONE;
 })
 
 {
   enum machine_mode mode = <VALL:MODE>mode;
   rtx mem = gen_rtx_MEM (mode, operands[0]);
-  emit_move_insn (mem, operands[1]);
+
+  if (BYTES_BIG_ENDIAN)
+    emit_insn (gen_aarch64_be_st1<VALL:mode> (mem, operands[1]));
+  else
+    emit_move_insn (mem, operands[1]);
   DONE;
 })
 
index 3b5e92e..8657b16 100644 (file)
@@ -81,6 +81,7 @@
     UNSPEC_GOTSMALLPIC
     UNSPEC_GOTSMALLTLS
     UNSPEC_GOTTINYPIC
+    UNSPEC_LD1
     UNSPEC_LD2
     UNSPEC_LD3
     UNSPEC_LD4
@@ -92,6 +93,7 @@
     UNSPEC_SISD_SSHL
     UNSPEC_SISD_USHL
     UNSPEC_SSHL_2S
+    UNSPEC_ST1
     UNSPEC_ST2
     UNSPEC_ST3
     UNSPEC_ST4
index 5b33fbb..d45d3dd 100644 (file)
@@ -1,3 +1,7 @@
+2014-01-23  Alex Velenko  <Alex.Velenko@arm.com>
+
+       * gcc.target/aarch64/vld1-vst1_1.c: New test_case.
+
 2014-01-23  David Holsgrove <david.holsgrove@xilinx.com>
 
        * gcc.target/microblaze/others/builtin-trap.c: New test,
diff --git a/gcc/testsuite/gcc.target/aarch64/vld1-vst1_1.c b/gcc/testsuite/gcc.target/aarch64/vld1-vst1_1.c
new file mode 100644 (file)
index 0000000..d1834a2
--- /dev/null
@@ -0,0 +1,52 @@
+/* Test vld1 and vst1 maintain consistent indexing.  */
+/* { dg-do run } */
+/* { dg-options "-O3" } */
+#include <arm_neon.h>
+
+extern void abort (void);
+
+int __attribute__ ((noinline))
+test_vld1_vst1 ()
+{
+  int8x8_t a;
+  int8x8_t b;
+  int i = 0;
+  int8_t c[8] = { 0, 1, 2, 3, 4, 5, 6, 7 };
+  int8_t d[8];
+  a = vld1_s8 (c);
+  asm volatile ("":::"memory");
+  vst1_s8 (d, a);
+  asm volatile ("":::"memory");
+  for (; i < 8; i++)
+    if (c[i] != d[i])
+      return 1;
+  return 0;
+}
+
+int __attribute__ ((noinline))
+test_vld1q_vst1q ()
+{
+  int16x8_t a;
+  int16x8_t b;
+  int i = 0;
+  int16_t c[8] = { 0, 1, 2, 3, 4, 5, 6, 7 };
+  int16_t d[8];
+  a = vld1q_s16 (c);
+  asm volatile ("":::"memory");
+  vst1q_s16 (d, a);
+  asm volatile ("":::"memory");
+  for (; i < 8; i++)
+    if (c[i] != d[i])
+      return 1;
+  return 0;
+}
+
+int
+main ()
+{
+  if (test_vld1_vst1 ())
+    abort ();
+  if (test_vld1q_vst1q ())
+    abort ();
+  return 0;
+}