[Hexagon] Add patterns for vector shift-and-accumulate
authorKrzysztof Parzyszek <kparzysz@codeaurora.org>
Wed, 9 May 2018 21:10:41 +0000 (21:10 +0000)
committerKrzysztof Parzyszek <kparzysz@codeaurora.org>
Wed, 9 May 2018 21:10:41 +0000 (21:10 +0000)
llvm-svn: 331918

llvm/lib/Target/Hexagon/HexagonPatternsHVX.td
llvm/test/CodeGen/Hexagon/autohvx/shift-128b.ll
llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll

index 9c313ab..3bde002 100644 (file)
@@ -348,6 +348,11 @@ let Predicates = [UseHVX] in {
   def: Pat<(HexagonVLSR HVI16:$Vs, I32:$Rt), (V6_vlsrh HvxVR:$Vs, I32:$Rt)>;
   def: Pat<(HexagonVLSR HVI32:$Vs, I32:$Rt), (V6_vlsrw HvxVR:$Vs, I32:$Rt)>;
 
+  def: Pat<(add HVI32:$Vx, (HexagonVASL HVI32:$Vu, I32:$Rt)),
+           (V6_vaslw_acc HvxVR:$Vx, HvxVR:$Vu, I32:$Rt)>;
+  def: Pat<(add HVI32:$Vx, (HexagonVASR HVI32:$Vu, I32:$Rt)),
+           (V6_vasrw_acc HvxVR:$Vx, HvxVR:$Vu, I32:$Rt)>;
+
   def: Pat<(shl HVI16:$Vs, HVI16:$Vt), (V6_vaslhv HvxVR:$Vs, HvxVR:$Vt)>;
   def: Pat<(shl HVI32:$Vs, HVI32:$Vt), (V6_vaslwv HvxVR:$Vs, HvxVR:$Vt)>;
   def: Pat<(sra HVI16:$Vs, HVI16:$Vt), (V6_vasrhv HvxVR:$Vs, HvxVR:$Vt)>;
index 2bf1ba9..d1eab22 100644 (file)
@@ -4,70 +4,8 @@
 ; CHECK: v0.h = vasl(v0.h,r0)
 define <64 x i16> @test0000(<64 x i16> %a0, i16 %a1) #0 {
   %b0 = insertelement <64 x i16> zeroinitializer, i16 %a1, i32 0
-  %b1 = insertelement <64 x i16> %b0, i16 %a1, i32 1
-  %b2 = insertelement <64 x i16> %b1, i16 %a1, i32 2
-  %b3 = insertelement <64 x i16> %b2, i16 %a1, i32 3
-  %b4 = insertelement <64 x i16> %b3, i16 %a1, i32 4
-  %b5 = insertelement <64 x i16> %b4, i16 %a1, i32 5
-  %b6 = insertelement <64 x i16> %b5, i16 %a1, i32 6
-  %b7 = insertelement <64 x i16> %b6, i16 %a1, i32 7
-  %b8 = insertelement <64 x i16> %b7, i16 %a1, i32 8
-  %b9 = insertelement <64 x i16> %b8, i16 %a1, i32 9
-  %b10 = insertelement <64 x i16> %b9, i16 %a1, i32 10
-  %b11 = insertelement <64 x i16> %b10, i16 %a1, i32 11
-  %b12 = insertelement <64 x i16> %b11, i16 %a1, i32 12
-  %b13 = insertelement <64 x i16> %b12, i16 %a1, i32 13
-  %b14 = insertelement <64 x i16> %b13, i16 %a1, i32 14
-  %b15 = insertelement <64 x i16> %b14, i16 %a1, i32 15
-  %b16 = insertelement <64 x i16> %b15, i16 %a1, i32 16
-  %b17 = insertelement <64 x i16> %b16, i16 %a1, i32 17
-  %b18 = insertelement <64 x i16> %b17, i16 %a1, i32 18
-  %b19 = insertelement <64 x i16> %b18, i16 %a1, i32 19
-  %b20 = insertelement <64 x i16> %b19, i16 %a1, i32 20
-  %b21 = insertelement <64 x i16> %b20, i16 %a1, i32 21
-  %b22 = insertelement <64 x i16> %b21, i16 %a1, i32 22
-  %b23 = insertelement <64 x i16> %b22, i16 %a1, i32 23
-  %b24 = insertelement <64 x i16> %b23, i16 %a1, i32 24
-  %b25 = insertelement <64 x i16> %b24, i16 %a1, i32 25
-  %b26 = insertelement <64 x i16> %b25, i16 %a1, i32 26
-  %b27 = insertelement <64 x i16> %b26, i16 %a1, i32 27
-  %b28 = insertelement <64 x i16> %b27, i16 %a1, i32 28
-  %b29 = insertelement <64 x i16> %b28, i16 %a1, i32 29
-  %b30 = insertelement <64 x i16> %b29, i16 %a1, i32 30
-  %b31 = insertelement <64 x i16> %b30, i16 %a1, i32 31
-  %b32 = insertelement <64 x i16> %b31, i16 %a1, i32 32
-  %b33 = insertelement <64 x i16> %b32, i16 %a1, i32 33
-  %b34 = insertelement <64 x i16> %b33, i16 %a1, i32 34
-  %b35 = insertelement <64 x i16> %b34, i16 %a1, i32 35
-  %b36 = insertelement <64 x i16> %b35, i16 %a1, i32 36
-  %b37 = insertelement <64 x i16> %b36, i16 %a1, i32 37
-  %b38 = insertelement <64 x i16> %b37, i16 %a1, i32 38
-  %b39 = insertelement <64 x i16> %b38, i16 %a1, i32 39
-  %b40 = insertelement <64 x i16> %b39, i16 %a1, i32 40
-  %b41 = insertelement <64 x i16> %b40, i16 %a1, i32 41
-  %b42 = insertelement <64 x i16> %b41, i16 %a1, i32 42
-  %b43 = insertelement <64 x i16> %b42, i16 %a1, i32 43
-  %b44 = insertelement <64 x i16> %b43, i16 %a1, i32 44
-  %b45 = insertelement <64 x i16> %b44, i16 %a1, i32 45
-  %b46 = insertelement <64 x i16> %b45, i16 %a1, i32 46
-  %b47 = insertelement <64 x i16> %b46, i16 %a1, i32 47
-  %b48 = insertelement <64 x i16> %b47, i16 %a1, i32 48
-  %b49 = insertelement <64 x i16> %b48, i16 %a1, i32 49
-  %b50 = insertelement <64 x i16> %b49, i16 %a1, i32 50
-  %b51 = insertelement <64 x i16> %b50, i16 %a1, i32 51
-  %b52 = insertelement <64 x i16> %b51, i16 %a1, i32 52
-  %b53 = insertelement <64 x i16> %b52, i16 %a1, i32 53
-  %b54 = insertelement <64 x i16> %b53, i16 %a1, i32 54
-  %b55 = insertelement <64 x i16> %b54, i16 %a1, i32 55
-  %b56 = insertelement <64 x i16> %b55, i16 %a1, i32 56
-  %b57 = insertelement <64 x i16> %b56, i16 %a1, i32 57
-  %b58 = insertelement <64 x i16> %b57, i16 %a1, i32 58
-  %b59 = insertelement <64 x i16> %b58, i16 %a1, i32 59
-  %b60 = insertelement <64 x i16> %b59, i16 %a1, i32 60
-  %b61 = insertelement <64 x i16> %b60, i16 %a1, i32 61
-  %b62 = insertelement <64 x i16> %b61, i16 %a1, i32 62
-  %b63 = insertelement <64 x i16> %b62, i16 %a1, i32 63
-  %v0 = shl <64 x i16> %a0, %b63
+  %b1 = shufflevector <64 x i16> %b0, <64 x i16> undef, <64 x i32> zeroinitializer
+  %v0 = shl <64 x i16> %a0, %b1
   ret <64 x i16> %v0
 }
 
@@ -75,70 +13,8 @@ define <64 x i16> @test0000(<64 x i16> %a0, i16 %a1) #0 {
 ; CHECK: v0.h = vasr(v0.h,r0)
 define <64 x i16> @test0001(<64 x i16> %a0, i16 %a1) #0 {
   %b0 = insertelement <64 x i16> zeroinitializer, i16 %a1, i32 0
-  %b1 = insertelement <64 x i16> %b0, i16 %a1, i32 1
-  %b2 = insertelement <64 x i16> %b1, i16 %a1, i32 2
-  %b3 = insertelement <64 x i16> %b2, i16 %a1, i32 3
-  %b4 = insertelement <64 x i16> %b3, i16 %a1, i32 4
-  %b5 = insertelement <64 x i16> %b4, i16 %a1, i32 5
-  %b6 = insertelement <64 x i16> %b5, i16 %a1, i32 6
-  %b7 = insertelement <64 x i16> %b6, i16 %a1, i32 7
-  %b8 = insertelement <64 x i16> %b7, i16 %a1, i32 8
-  %b9 = insertelement <64 x i16> %b8, i16 %a1, i32 9
-  %b10 = insertelement <64 x i16> %b9, i16 %a1, i32 10
-  %b11 = insertelement <64 x i16> %b10, i16 %a1, i32 11
-  %b12 = insertelement <64 x i16> %b11, i16 %a1, i32 12
-  %b13 = insertelement <64 x i16> %b12, i16 %a1, i32 13
-  %b14 = insertelement <64 x i16> %b13, i16 %a1, i32 14
-  %b15 = insertelement <64 x i16> %b14, i16 %a1, i32 15
-  %b16 = insertelement <64 x i16> %b15, i16 %a1, i32 16
-  %b17 = insertelement <64 x i16> %b16, i16 %a1, i32 17
-  %b18 = insertelement <64 x i16> %b17, i16 %a1, i32 18
-  %b19 = insertelement <64 x i16> %b18, i16 %a1, i32 19
-  %b20 = insertelement <64 x i16> %b19, i16 %a1, i32 20
-  %b21 = insertelement <64 x i16> %b20, i16 %a1, i32 21
-  %b22 = insertelement <64 x i16> %b21, i16 %a1, i32 22
-  %b23 = insertelement <64 x i16> %b22, i16 %a1, i32 23
-  %b24 = insertelement <64 x i16> %b23, i16 %a1, i32 24
-  %b25 = insertelement <64 x i16> %b24, i16 %a1, i32 25
-  %b26 = insertelement <64 x i16> %b25, i16 %a1, i32 26
-  %b27 = insertelement <64 x i16> %b26, i16 %a1, i32 27
-  %b28 = insertelement <64 x i16> %b27, i16 %a1, i32 28
-  %b29 = insertelement <64 x i16> %b28, i16 %a1, i32 29
-  %b30 = insertelement <64 x i16> %b29, i16 %a1, i32 30
-  %b31 = insertelement <64 x i16> %b30, i16 %a1, i32 31
-  %b32 = insertelement <64 x i16> %b31, i16 %a1, i32 32
-  %b33 = insertelement <64 x i16> %b32, i16 %a1, i32 33
-  %b34 = insertelement <64 x i16> %b33, i16 %a1, i32 34
-  %b35 = insertelement <64 x i16> %b34, i16 %a1, i32 35
-  %b36 = insertelement <64 x i16> %b35, i16 %a1, i32 36
-  %b37 = insertelement <64 x i16> %b36, i16 %a1, i32 37
-  %b38 = insertelement <64 x i16> %b37, i16 %a1, i32 38
-  %b39 = insertelement <64 x i16> %b38, i16 %a1, i32 39
-  %b40 = insertelement <64 x i16> %b39, i16 %a1, i32 40
-  %b41 = insertelement <64 x i16> %b40, i16 %a1, i32 41
-  %b42 = insertelement <64 x i16> %b41, i16 %a1, i32 42
-  %b43 = insertelement <64 x i16> %b42, i16 %a1, i32 43
-  %b44 = insertelement <64 x i16> %b43, i16 %a1, i32 44
-  %b45 = insertelement <64 x i16> %b44, i16 %a1, i32 45
-  %b46 = insertelement <64 x i16> %b45, i16 %a1, i32 46
-  %b47 = insertelement <64 x i16> %b46, i16 %a1, i32 47
-  %b48 = insertelement <64 x i16> %b47, i16 %a1, i32 48
-  %b49 = insertelement <64 x i16> %b48, i16 %a1, i32 49
-  %b50 = insertelement <64 x i16> %b49, i16 %a1, i32 50
-  %b51 = insertelement <64 x i16> %b50, i16 %a1, i32 51
-  %b52 = insertelement <64 x i16> %b51, i16 %a1, i32 52
-  %b53 = insertelement <64 x i16> %b52, i16 %a1, i32 53
-  %b54 = insertelement <64 x i16> %b53, i16 %a1, i32 54
-  %b55 = insertelement <64 x i16> %b54, i16 %a1, i32 55
-  %b56 = insertelement <64 x i16> %b55, i16 %a1, i32 56
-  %b57 = insertelement <64 x i16> %b56, i16 %a1, i32 57
-  %b58 = insertelement <64 x i16> %b57, i16 %a1, i32 58
-  %b59 = insertelement <64 x i16> %b58, i16 %a1, i32 59
-  %b60 = insertelement <64 x i16> %b59, i16 %a1, i32 60
-  %b61 = insertelement <64 x i16> %b60, i16 %a1, i32 61
-  %b62 = insertelement <64 x i16> %b61, i16 %a1, i32 62
-  %b63 = insertelement <64 x i16> %b62, i16 %a1, i32 63
-  %v0 = ashr <64 x i16> %a0, %b63
+  %b1 = shufflevector <64 x i16> %b0, <64 x i16> undef, <64 x i32> zeroinitializer
+  %v0 = ashr <64 x i16> %a0, %b1
   ret <64 x i16> %v0
 }
 
@@ -146,70 +22,8 @@ define <64 x i16> @test0001(<64 x i16> %a0, i16 %a1) #0 {
 ; CHECK: v0.uh = vlsr(v0.uh,r0)
 define <64 x i16> @test0002(<64 x i16> %a0, i16 %a1) #0 {
   %b0 = insertelement <64 x i16> zeroinitializer, i16 %a1, i32 0
-  %b1 = insertelement <64 x i16> %b0, i16 %a1, i32 1
-  %b2 = insertelement <64 x i16> %b1, i16 %a1, i32 2
-  %b3 = insertelement <64 x i16> %b2, i16 %a1, i32 3
-  %b4 = insertelement <64 x i16> %b3, i16 %a1, i32 4
-  %b5 = insertelement <64 x i16> %b4, i16 %a1, i32 5
-  %b6 = insertelement <64 x i16> %b5, i16 %a1, i32 6
-  %b7 = insertelement <64 x i16> %b6, i16 %a1, i32 7
-  %b8 = insertelement <64 x i16> %b7, i16 %a1, i32 8
-  %b9 = insertelement <64 x i16> %b8, i16 %a1, i32 9
-  %b10 = insertelement <64 x i16> %b9, i16 %a1, i32 10
-  %b11 = insertelement <64 x i16> %b10, i16 %a1, i32 11
-  %b12 = insertelement <64 x i16> %b11, i16 %a1, i32 12
-  %b13 = insertelement <64 x i16> %b12, i16 %a1, i32 13
-  %b14 = insertelement <64 x i16> %b13, i16 %a1, i32 14
-  %b15 = insertelement <64 x i16> %b14, i16 %a1, i32 15
-  %b16 = insertelement <64 x i16> %b15, i16 %a1, i32 16
-  %b17 = insertelement <64 x i16> %b16, i16 %a1, i32 17
-  %b18 = insertelement <64 x i16> %b17, i16 %a1, i32 18
-  %b19 = insertelement <64 x i16> %b18, i16 %a1, i32 19
-  %b20 = insertelement <64 x i16> %b19, i16 %a1, i32 20
-  %b21 = insertelement <64 x i16> %b20, i16 %a1, i32 21
-  %b22 = insertelement <64 x i16> %b21, i16 %a1, i32 22
-  %b23 = insertelement <64 x i16> %b22, i16 %a1, i32 23
-  %b24 = insertelement <64 x i16> %b23, i16 %a1, i32 24
-  %b25 = insertelement <64 x i16> %b24, i16 %a1, i32 25
-  %b26 = insertelement <64 x i16> %b25, i16 %a1, i32 26
-  %b27 = insertelement <64 x i16> %b26, i16 %a1, i32 27
-  %b28 = insertelement <64 x i16> %b27, i16 %a1, i32 28
-  %b29 = insertelement <64 x i16> %b28, i16 %a1, i32 29
-  %b30 = insertelement <64 x i16> %b29, i16 %a1, i32 30
-  %b31 = insertelement <64 x i16> %b30, i16 %a1, i32 31
-  %b32 = insertelement <64 x i16> %b31, i16 %a1, i32 32
-  %b33 = insertelement <64 x i16> %b32, i16 %a1, i32 33
-  %b34 = insertelement <64 x i16> %b33, i16 %a1, i32 34
-  %b35 = insertelement <64 x i16> %b34, i16 %a1, i32 35
-  %b36 = insertelement <64 x i16> %b35, i16 %a1, i32 36
-  %b37 = insertelement <64 x i16> %b36, i16 %a1, i32 37
-  %b38 = insertelement <64 x i16> %b37, i16 %a1, i32 38
-  %b39 = insertelement <64 x i16> %b38, i16 %a1, i32 39
-  %b40 = insertelement <64 x i16> %b39, i16 %a1, i32 40
-  %b41 = insertelement <64 x i16> %b40, i16 %a1, i32 41
-  %b42 = insertelement <64 x i16> %b41, i16 %a1, i32 42
-  %b43 = insertelement <64 x i16> %b42, i16 %a1, i32 43
-  %b44 = insertelement <64 x i16> %b43, i16 %a1, i32 44
-  %b45 = insertelement <64 x i16> %b44, i16 %a1, i32 45
-  %b46 = insertelement <64 x i16> %b45, i16 %a1, i32 46
-  %b47 = insertelement <64 x i16> %b46, i16 %a1, i32 47
-  %b48 = insertelement <64 x i16> %b47, i16 %a1, i32 48
-  %b49 = insertelement <64 x i16> %b48, i16 %a1, i32 49
-  %b50 = insertelement <64 x i16> %b49, i16 %a1, i32 50
-  %b51 = insertelement <64 x i16> %b50, i16 %a1, i32 51
-  %b52 = insertelement <64 x i16> %b51, i16 %a1, i32 52
-  %b53 = insertelement <64 x i16> %b52, i16 %a1, i32 53
-  %b54 = insertelement <64 x i16> %b53, i16 %a1, i32 54
-  %b55 = insertelement <64 x i16> %b54, i16 %a1, i32 55
-  %b56 = insertelement <64 x i16> %b55, i16 %a1, i32 56
-  %b57 = insertelement <64 x i16> %b56, i16 %a1, i32 57
-  %b58 = insertelement <64 x i16> %b57, i16 %a1, i32 58
-  %b59 = insertelement <64 x i16> %b58, i16 %a1, i32 59
-  %b60 = insertelement <64 x i16> %b59, i16 %a1, i32 60
-  %b61 = insertelement <64 x i16> %b60, i16 %a1, i32 61
-  %b62 = insertelement <64 x i16> %b61, i16 %a1, i32 62
-  %b63 = insertelement <64 x i16> %b62, i16 %a1, i32 63
-  %v0 = lshr <64 x i16> %a0, %b63
+  %b1 = shufflevector <64 x i16> %b0, <64 x i16> undef, <64 x i32> zeroinitializer
+  %v0 = lshr <64 x i16> %a0, %b1
   ret <64 x i16> %v0
 }
 
@@ -217,38 +31,8 @@ define <64 x i16> @test0002(<64 x i16> %a0, i16 %a1) #0 {
 ; CHECK: v0.w = vasl(v0.w,r0)
 define <32 x i32> @test0010(<32 x i32> %a0, i32 %a1) #0 {
   %b0 = insertelement <32 x i32> zeroinitializer, i32 %a1, i32 0
-  %b1 = insertelement <32 x i32> %b0, i32 %a1, i32 1
-  %b2 = insertelement <32 x i32> %b1, i32 %a1, i32 2
-  %b3 = insertelement <32 x i32> %b2, i32 %a1, i32 3
-  %b4 = insertelement <32 x i32> %b3, i32 %a1, i32 4
-  %b5 = insertelement <32 x i32> %b4, i32 %a1, i32 5
-  %b6 = insertelement <32 x i32> %b5, i32 %a1, i32 6
-  %b7 = insertelement <32 x i32> %b6, i32 %a1, i32 7
-  %b8 = insertelement <32 x i32> %b7, i32 %a1, i32 8
-  %b9 = insertelement <32 x i32> %b8, i32 %a1, i32 9
-  %b10 = insertelement <32 x i32> %b9, i32 %a1, i32 10
-  %b11 = insertelement <32 x i32> %b10, i32 %a1, i32 11
-  %b12 = insertelement <32 x i32> %b11, i32 %a1, i32 12
-  %b13 = insertelement <32 x i32> %b12, i32 %a1, i32 13
-  %b14 = insertelement <32 x i32> %b13, i32 %a1, i32 14
-  %b15 = insertelement <32 x i32> %b14, i32 %a1, i32 15
-  %b16 = insertelement <32 x i32> %b15, i32 %a1, i32 16
-  %b17 = insertelement <32 x i32> %b16, i32 %a1, i32 17
-  %b18 = insertelement <32 x i32> %b17, i32 %a1, i32 18
-  %b19 = insertelement <32 x i32> %b18, i32 %a1, i32 19
-  %b20 = insertelement <32 x i32> %b19, i32 %a1, i32 20
-  %b21 = insertelement <32 x i32> %b20, i32 %a1, i32 21
-  %b22 = insertelement <32 x i32> %b21, i32 %a1, i32 22
-  %b23 = insertelement <32 x i32> %b22, i32 %a1, i32 23
-  %b24 = insertelement <32 x i32> %b23, i32 %a1, i32 24
-  %b25 = insertelement <32 x i32> %b24, i32 %a1, i32 25
-  %b26 = insertelement <32 x i32> %b25, i32 %a1, i32 26
-  %b27 = insertelement <32 x i32> %b26, i32 %a1, i32 27
-  %b28 = insertelement <32 x i32> %b27, i32 %a1, i32 28
-  %b29 = insertelement <32 x i32> %b28, i32 %a1, i32 29
-  %b30 = insertelement <32 x i32> %b29, i32 %a1, i32 30
-  %b31 = insertelement <32 x i32> %b30, i32 %a1, i32 31
-  %v0 = shl <32 x i32> %a0, %b31
+  %b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer
+  %v0 = shl <32 x i32> %a0, %b1
   ret <32 x i32> %v0
 }
 
@@ -256,38 +40,8 @@ define <32 x i32> @test0010(<32 x i32> %a0, i32 %a1) #0 {
 ; CHECK: v0.w = vasr(v0.w,r0)
 define <32 x i32> @test0011(<32 x i32> %a0, i32 %a1) #0 {
   %b0 = insertelement <32 x i32> zeroinitializer, i32 %a1, i32 0
-  %b1 = insertelement <32 x i32> %b0, i32 %a1, i32 1
-  %b2 = insertelement <32 x i32> %b1, i32 %a1, i32 2
-  %b3 = insertelement <32 x i32> %b2, i32 %a1, i32 3
-  %b4 = insertelement <32 x i32> %b3, i32 %a1, i32 4
-  %b5 = insertelement <32 x i32> %b4, i32 %a1, i32 5
-  %b6 = insertelement <32 x i32> %b5, i32 %a1, i32 6
-  %b7 = insertelement <32 x i32> %b6, i32 %a1, i32 7
-  %b8 = insertelement <32 x i32> %b7, i32 %a1, i32 8
-  %b9 = insertelement <32 x i32> %b8, i32 %a1, i32 9
-  %b10 = insertelement <32 x i32> %b9, i32 %a1, i32 10
-  %b11 = insertelement <32 x i32> %b10, i32 %a1, i32 11
-  %b12 = insertelement <32 x i32> %b11, i32 %a1, i32 12
-  %b13 = insertelement <32 x i32> %b12, i32 %a1, i32 13
-  %b14 = insertelement <32 x i32> %b13, i32 %a1, i32 14
-  %b15 = insertelement <32 x i32> %b14, i32 %a1, i32 15
-  %b16 = insertelement <32 x i32> %b15, i32 %a1, i32 16
-  %b17 = insertelement <32 x i32> %b16, i32 %a1, i32 17
-  %b18 = insertelement <32 x i32> %b17, i32 %a1, i32 18
-  %b19 = insertelement <32 x i32> %b18, i32 %a1, i32 19
-  %b20 = insertelement <32 x i32> %b19, i32 %a1, i32 20
-  %b21 = insertelement <32 x i32> %b20, i32 %a1, i32 21
-  %b22 = insertelement <32 x i32> %b21, i32 %a1, i32 22
-  %b23 = insertelement <32 x i32> %b22, i32 %a1, i32 23
-  %b24 = insertelement <32 x i32> %b23, i32 %a1, i32 24
-  %b25 = insertelement <32 x i32> %b24, i32 %a1, i32 25
-  %b26 = insertelement <32 x i32> %b25, i32 %a1, i32 26
-  %b27 = insertelement <32 x i32> %b26, i32 %a1, i32 27
-  %b28 = insertelement <32 x i32> %b27, i32 %a1, i32 28
-  %b29 = insertelement <32 x i32> %b28, i32 %a1, i32 29
-  %b30 = insertelement <32 x i32> %b29, i32 %a1, i32 30
-  %b31 = insertelement <32 x i32> %b30, i32 %a1, i32 31
-  %v0 = ashr <32 x i32> %a0, %b31
+  %b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer
+  %v0 = ashr <32 x i32> %a0, %b1
   ret <32 x i32> %v0
 }
 
@@ -295,41 +49,31 @@ define <32 x i32> @test0011(<32 x i32> %a0, i32 %a1) #0 {
 ; CHECK: v0.uw = vlsr(v0.uw,r0)
 define <32 x i32> @test0012(<32 x i32> %a0, i32 %a1) #0 {
   %b0 = insertelement <32 x i32> zeroinitializer, i32 %a1, i32 0
-  %b1 = insertelement <32 x i32> %b0, i32 %a1, i32 1
-  %b2 = insertelement <32 x i32> %b1, i32 %a1, i32 2
-  %b3 = insertelement <32 x i32> %b2, i32 %a1, i32 3
-  %b4 = insertelement <32 x i32> %b3, i32 %a1, i32 4
-  %b5 = insertelement <32 x i32> %b4, i32 %a1, i32 5
-  %b6 = insertelement <32 x i32> %b5, i32 %a1, i32 6
-  %b7 = insertelement <32 x i32> %b6, i32 %a1, i32 7
-  %b8 = insertelement <32 x i32> %b7, i32 %a1, i32 8
-  %b9 = insertelement <32 x i32> %b8, i32 %a1, i32 9
-  %b10 = insertelement <32 x i32> %b9, i32 %a1, i32 10
-  %b11 = insertelement <32 x i32> %b10, i32 %a1, i32 11
-  %b12 = insertelement <32 x i32> %b11, i32 %a1, i32 12
-  %b13 = insertelement <32 x i32> %b12, i32 %a1, i32 13
-  %b14 = insertelement <32 x i32> %b13, i32 %a1, i32 14
-  %b15 = insertelement <32 x i32> %b14, i32 %a1, i32 15
-  %b16 = insertelement <32 x i32> %b15, i32 %a1, i32 16
-  %b17 = insertelement <32 x i32> %b16, i32 %a1, i32 17
-  %b18 = insertelement <32 x i32> %b17, i32 %a1, i32 18
-  %b19 = insertelement <32 x i32> %b18, i32 %a1, i32 19
-  %b20 = insertelement <32 x i32> %b19, i32 %a1, i32 20
-  %b21 = insertelement <32 x i32> %b20, i32 %a1, i32 21
-  %b22 = insertelement <32 x i32> %b21, i32 %a1, i32 22
-  %b23 = insertelement <32 x i32> %b22, i32 %a1, i32 23
-  %b24 = insertelement <32 x i32> %b23, i32 %a1, i32 24
-  %b25 = insertelement <32 x i32> %b24, i32 %a1, i32 25
-  %b26 = insertelement <32 x i32> %b25, i32 %a1, i32 26
-  %b27 = insertelement <32 x i32> %b26, i32 %a1, i32 27
-  %b28 = insertelement <32 x i32> %b27, i32 %a1, i32 28
-  %b29 = insertelement <32 x i32> %b28, i32 %a1, i32 29
-  %b30 = insertelement <32 x i32> %b29, i32 %a1, i32 30
-  %b31 = insertelement <32 x i32> %b30, i32 %a1, i32 31
-  %v0 = lshr <32 x i32> %a0, %b31
+  %b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer
+  %v0 = lshr <32 x i32> %a0, %b1
   ret <32 x i32> %v0
 }
 
+; CHECK-LABEL: test0013:
+; CHECK: v0.w += vasl(v1.w,r0)
+define <32 x i32> @test0013(<32 x i32> %a0, <32 x i32> %a1, i32 %a2) #0 {
+  %b0 = insertelement <32 x i32> zeroinitializer, i32 %a2, i32 0
+  %b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer
+  %v0 = shl <32 x i32> %a1, %b1
+  %v1 = add <32 x i32> %a0, %v0
+  ret <32 x i32> %v1
+}
+
+; CHECK-LABEL: test0014:
+; CHECK: v0.w += vasr(v1.w,r0)
+define <32 x i32> @test0014(<32 x i32> %a0, <32 x i32> %a1, i32 %a2) #0 {
+  %b0 = insertelement <32 x i32> zeroinitializer, i32 %a2, i32 0
+  %b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer
+  %v0 = ashr <32 x i32> %a1, %b1
+  %v1 = add <32 x i32> %a0, %v0
+  ret <32 x i32> %v1
+}
+
 ; CHECK-LABEL: test0020:
 ; CHECK: v0.h = vasl(v0.h,v1.h)
 define <64 x i16> @test0020(<64 x i16> %a0, <64 x i16> %a1) #0 {
index a43a854..678a97c 100644 (file)
@@ -4,38 +4,9 @@
 ; CHECK: v0.h = vasl(v0.h,r0)
 define <32 x i16> @test0000(<32 x i16> %a0, i16 %a1) #0 {
   %b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0
-  %b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1
-  %b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2
-  %b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3
-  %b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4
-  %b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5
-  %b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6
-  %b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7
-  %b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8
-  %b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9
-  %b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10
-  %b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11
-  %b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12
-  %b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13
-  %b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14
-  %b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15
-  %b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16
-  %b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17
-  %b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18
-  %b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19
-  %b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20
-  %b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21
-  %b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22
-  %b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23
-  %b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24
-  %b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25
-  %b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26
-  %b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27
-  %b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28
-  %b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29
-  %b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30
-  %b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31
-  %v0 = shl <32 x i16> %a0, %b31
+  %b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer
+
+  %v0 = shl <32 x i16> %a0, %b1
   ret <32 x i16> %v0
 }
 
@@ -43,38 +14,8 @@ define <32 x i16> @test0000(<32 x i16> %a0, i16 %a1) #0 {
 ; CHECK: v0.h = vasr(v0.h,r0)
 define <32 x i16> @test0001(<32 x i16> %a0, i16 %a1) #0 {
   %b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0
-  %b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1
-  %b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2
-  %b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3
-  %b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4
-  %b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5
-  %b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6
-  %b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7
-  %b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8
-  %b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9
-  %b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10
-  %b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11
-  %b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12
-  %b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13
-  %b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14
-  %b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15
-  %b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16
-  %b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17
-  %b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18
-  %b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19
-  %b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20
-  %b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21
-  %b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22
-  %b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23
-  %b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24
-  %b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25
-  %b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26
-  %b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27
-  %b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28
-  %b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29
-  %b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30
-  %b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31
-  %v0 = ashr <32 x i16> %a0, %b31
+  %b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer
+  %v0 = ashr <32 x i16> %a0, %b1
   ret <32 x i16> %v0
 }
 
@@ -82,38 +23,8 @@ define <32 x i16> @test0001(<32 x i16> %a0, i16 %a1) #0 {
 ; CHECK: v0.uh = vlsr(v0.uh,r0)
 define <32 x i16> @test0002(<32 x i16> %a0, i16 %a1) #0 {
   %b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0
-  %b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1
-  %b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2
-  %b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3
-  %b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4
-  %b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5
-  %b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6
-  %b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7
-  %b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8
-  %b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9
-  %b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10
-  %b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11
-  %b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12
-  %b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13
-  %b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14
-  %b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15
-  %b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16
-  %b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17
-  %b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18
-  %b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19
-  %b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20
-  %b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21
-  %b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22
-  %b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23
-  %b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24
-  %b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25
-  %b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26
-  %b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27
-  %b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28
-  %b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29
-  %b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30
-  %b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31
-  %v0 = lshr <32 x i16> %a0, %b31
+  %b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer
+  %v0 = lshr <32 x i16> %a0, %b1
   ret <32 x i16> %v0
 }
 
@@ -121,22 +32,8 @@ define <32 x i16> @test0002(<32 x i16> %a0, i16 %a1) #0 {
 ; CHECK: v0.w = vasl(v0.w,r0)
 define <16 x i32> @test0010(<16 x i32> %a0, i32 %a1) #0 {
   %b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0
-  %b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1
-  %b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2
-  %b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3
-  %b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4
-  %b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5
-  %b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6
-  %b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7
-  %b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8
-  %b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9
-  %b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10
-  %b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11
-  %b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12
-  %b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13
-  %b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14
-  %b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15
-  %v0 = shl <16 x i32> %a0, %b15
+  %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer
+  %v0 = shl <16 x i32> %a0, %b1
   ret <16 x i32> %v0
 }
 
@@ -144,22 +41,8 @@ define <16 x i32> @test0010(<16 x i32> %a0, i32 %a1) #0 {
 ; CHECK: v0.w = vasr(v0.w,r0)
 define <16 x i32> @test0011(<16 x i32> %a0, i32 %a1) #0 {
   %b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0
-  %b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1
-  %b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2
-  %b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3
-  %b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4
-  %b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5
-  %b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6
-  %b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7
-  %b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8
-  %b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9
-  %b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10
-  %b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11
-  %b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12
-  %b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13
-  %b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14
-  %b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15
-  %v0 = ashr <16 x i32> %a0, %b15
+  %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer
+  %v0 = ashr <16 x i32> %a0, %b1
   ret <16 x i32> %v0
 }
 
@@ -167,25 +50,31 @@ define <16 x i32> @test0011(<16 x i32> %a0, i32 %a1) #0 {
 ; CHECK: v0.uw = vlsr(v0.uw,r0)
 define <16 x i32> @test0012(<16 x i32> %a0, i32 %a1) #0 {
   %b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0
-  %b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1
-  %b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2
-  %b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3
-  %b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4
-  %b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5
-  %b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6
-  %b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7
-  %b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8
-  %b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9
-  %b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10
-  %b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11
-  %b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12
-  %b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13
-  %b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14
-  %b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15
-  %v0 = lshr <16 x i32> %a0, %b15
+  %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer
+  %v0 = lshr <16 x i32> %a0, %b1
   ret <16 x i32> %v0
 }
 
+; CHECK-LABEL: test0013:
+; CHECK: v0.w += vasl(v1.w,r0)
+define <16 x i32> @test0013(<16 x i32> %a0, <16 x i32> %a1, i32 %a2) #0 {
+  %b0 = insertelement <16 x i32> zeroinitializer, i32 %a2, i32 0
+  %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer
+  %v0 = shl <16 x i32> %a1, %b1
+  %v1 = add <16 x i32> %a0, %v0
+  ret <16 x i32> %v1
+}
+
+; CHECK-LABEL: test0014:
+; CHECK: v0.w += vasr(v1.w,r0)
+define <16 x i32> @test0014(<16 x i32> %a0, <16 x i32> %a1, i32 %a2) #0 {
+  %b0 = insertelement <16 x i32> zeroinitializer, i32 %a2, i32 0
+  %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer
+  %v0 = ashr <16 x i32> %a1, %b1
+  %v1 = add <16 x i32> %a0, %v0
+  ret <16 x i32> %v1
+}
+
 ; CHECK-LABEL: test0020:
 ; CHECK: v0.h = vasl(v0.h,v1.h)
 define <32 x i16> @test0020(<32 x i16> %a0, <32 x i16> %a1) #0 {