[AArch64] Add tests for bitcast to and mask reduction (NFC)
authorNikita Popov <npopov@redhat.com>
Tue, 21 Mar 2023 10:59:56 +0000 (11:59 +0100)
committerNikita Popov <npopov@redhat.com>
Tue, 21 Mar 2023 12:18:25 +0000 (13:18 +0100)
This is a copy of the vecreduce_or tests but with comparison
to -1 rather than 0.

llvm/test/CodeGen/AArch64/dag-combine-setcc.ll

index 60bd2a3..6ec5e3b 100644 (file)
@@ -5,7 +5,7 @@ define i1 @combine_setcc_eq_vecreduce_or_v8i1(<8 x i8> %a) {
 ; CHECK-LABEL: combine_setcc_eq_vecreduce_or_v8i1:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    cmeq v0.8b, v0.8b, #0
-; CHECK-NEXT:    mov w8, #1
+; CHECK-NEXT:    mov w8, #1 // =0x1
 ; CHECK-NEXT:    umaxv b0, v0.8b
 ; CHECK-NEXT:    fmov w9, s0
 ; CHECK-NEXT:    bic w0, w8, w9
@@ -20,7 +20,7 @@ define i1 @combine_setcc_eq_vecreduce_or_v16i1(<16 x i8> %a) {
 ; CHECK-LABEL: combine_setcc_eq_vecreduce_or_v16i1:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    cmeq v0.16b, v0.16b, #0
-; CHECK-NEXT:    mov w8, #1
+; CHECK-NEXT:    mov w8, #1 // =0x1
 ; CHECK-NEXT:    umaxv b0, v0.16b
 ; CHECK-NEXT:    fmov w9, s0
 ; CHECK-NEXT:    bic w0, w8, w9
@@ -35,7 +35,7 @@ define i1 @combine_setcc_eq_vecreduce_or_v32i1(<32 x i8> %a) {
 ; CHECK-LABEL: combine_setcc_eq_vecreduce_or_v32i1:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    cmeq v1.16b, v1.16b, #0
-; CHECK-NEXT:    mov w8, #1
+; CHECK-NEXT:    mov w8, #1 // =0x1
 ; CHECK-NEXT:    cmeq v0.16b, v0.16b, #0
 ; CHECK-NEXT:    orr v0.16b, v0.16b, v1.16b
 ; CHECK-NEXT:    umaxv b0, v0.16b
@@ -52,7 +52,7 @@ define i1 @combine_setcc_eq_vecreduce_or_v64i1(<64 x i8> %a) {
 ; CHECK-LABEL: combine_setcc_eq_vecreduce_or_v64i1:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    cmeq v2.16b, v2.16b, #0
-; CHECK-NEXT:    mov w8, #1
+; CHECK-NEXT:    mov w8, #1 // =0x1
 ; CHECK-NEXT:    cmeq v3.16b, v3.16b, #0
 ; CHECK-NEXT:    cmeq v1.16b, v1.16b, #0
 ; CHECK-NEXT:    cmeq v0.16b, v0.16b, #0
@@ -129,6 +129,774 @@ define i1 @combine_setcc_ne_vecreduce_or_v64i1(<64 x i8> %a) {
   ret i1 %cmp2
 }
 
+define i1 @combine_setcc_eq_vecreduce_and_v8i1(<8 x i8> %a) {
+; CHECK-LABEL: combine_setcc_eq_vecreduce_and_v8i1:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    sub sp, sp, #16
+; CHECK-NEXT:    .cfi_def_cfa_offset 16
+; CHECK-NEXT:    cmeq v0.8b, v0.8b, #0
+; CHECK-NEXT:    mov w8, #255 // =0xff
+; CHECK-NEXT:    umov w9, v0.b[0]
+; CHECK-NEXT:    umov w10, v0.b[1]
+; CHECK-NEXT:    umov w11, v0.b[2]
+; CHECK-NEXT:    umov w12, v0.b[3]
+; CHECK-NEXT:    umov w13, v0.b[4]
+; CHECK-NEXT:    umov w14, v0.b[6]
+; CHECK-NEXT:    and w9, w9, #0x1
+; CHECK-NEXT:    bfi w9, w10, #1, #1
+; CHECK-NEXT:    umov w10, v0.b[5]
+; CHECK-NEXT:    bfi w9, w11, #2, #1
+; CHECK-NEXT:    umov w11, v0.b[7]
+; CHECK-NEXT:    bfi w9, w12, #3, #1
+; CHECK-NEXT:    and w12, w14, #0x1
+; CHECK-NEXT:    bfi w9, w13, #4, #1
+; CHECK-NEXT:    bfi w9, w10, #5, #1
+; CHECK-NEXT:    orr w9, w9, w12, lsl #6
+; CHECK-NEXT:    orr w9, w9, w11, lsl #7
+; CHECK-NEXT:    bics wzr, w8, w9
+; CHECK-NEXT:    cset w0, eq
+; CHECK-NEXT:    add sp, sp, #16
+; CHECK-NEXT:    ret
+  %cmp1 = icmp eq <8 x i8> %a, zeroinitializer
+  %cast = bitcast <8 x i1> %cmp1 to i8
+  %cmp2 = icmp eq i8 %cast, -1
+  ret i1 %cmp2
+}
+
+define i1 @combine_setcc_eq_vecreduce_and_v16i1(<16 x i8> %a) {
+; CHECK-LABEL: combine_setcc_eq_vecreduce_and_v16i1:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    sub sp, sp, #16
+; CHECK-NEXT:    .cfi_def_cfa_offset 16
+; CHECK-NEXT:    cmeq v0.16b, v0.16b, #0
+; CHECK-NEXT:    mov w8, #65535 // =0xffff
+; CHECK-NEXT:    umov w9, v0.b[0]
+; CHECK-NEXT:    umov w10, v0.b[1]
+; CHECK-NEXT:    umov w11, v0.b[2]
+; CHECK-NEXT:    umov w12, v0.b[3]
+; CHECK-NEXT:    umov w13, v0.b[4]
+; CHECK-NEXT:    umov w14, v0.b[5]
+; CHECK-NEXT:    and w9, w9, #0x1
+; CHECK-NEXT:    bfi w9, w10, #1, #1
+; CHECK-NEXT:    umov w10, v0.b[6]
+; CHECK-NEXT:    bfi w9, w11, #2, #1
+; CHECK-NEXT:    umov w11, v0.b[7]
+; CHECK-NEXT:    bfi w9, w12, #3, #1
+; CHECK-NEXT:    umov w12, v0.b[8]
+; CHECK-NEXT:    bfi w9, w13, #4, #1
+; CHECK-NEXT:    umov w13, v0.b[9]
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    bfi w9, w14, #5, #1
+; CHECK-NEXT:    umov w14, v0.b[10]
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    orr w9, w9, w10, lsl #6
+; CHECK-NEXT:    umov w10, v0.b[11]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    orr w9, w9, w11, lsl #7
+; CHECK-NEXT:    umov w11, v0.b[12]
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    orr w9, w9, w12, lsl #8
+; CHECK-NEXT:    umov w12, v0.b[13]
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    orr w9, w9, w13, lsl #9
+; CHECK-NEXT:    umov w13, v0.b[14]
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    orr w9, w9, w14, lsl #10
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    orr w9, w9, w10, lsl #11
+; CHECK-NEXT:    and w10, w12, #0x1
+; CHECK-NEXT:    umov w12, v0.b[15]
+; CHECK-NEXT:    orr w9, w9, w11, lsl #12
+; CHECK-NEXT:    and w11, w13, #0x1
+; CHECK-NEXT:    orr w9, w9, w10, lsl #13
+; CHECK-NEXT:    orr w9, w9, w11, lsl #14
+; CHECK-NEXT:    orr w9, w9, w12, lsl #15
+; CHECK-NEXT:    bics wzr, w8, w9
+; CHECK-NEXT:    cset w0, eq
+; CHECK-NEXT:    add sp, sp, #16
+; CHECK-NEXT:    ret
+  %cmp1 = icmp eq <16 x i8> %a, zeroinitializer
+  %cast = bitcast <16 x i1> %cmp1 to i16
+  %cmp2 = icmp eq i16 %cast, -1
+  ret i1 %cmp2
+}
+
+define i1 @combine_setcc_eq_vecreduce_and_v32i1(<32 x i8> %a) {
+; CHECK-LABEL: combine_setcc_eq_vecreduce_and_v32i1:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    sub sp, sp, #16
+; CHECK-NEXT:    .cfi_def_cfa_offset 16
+; CHECK-NEXT:    cmeq v1.16b, v1.16b, #0
+; CHECK-NEXT:    mov w8, #65535 // =0xffff
+; CHECK-NEXT:    cmeq v0.16b, v0.16b, #0
+; CHECK-NEXT:    umov w9, v1.b[0]
+; CHECK-NEXT:    umov w10, v1.b[1]
+; CHECK-NEXT:    umov w11, v1.b[2]
+; CHECK-NEXT:    umov w12, v1.b[3]
+; CHECK-NEXT:    umov w13, v1.b[4]
+; CHECK-NEXT:    umov w14, v1.b[5]
+; CHECK-NEXT:    umov w15, v1.b[6]
+; CHECK-NEXT:    and w9, w9, #0x1
+; CHECK-NEXT:    umov w16, v1.b[7]
+; CHECK-NEXT:    bfi w9, w10, #1, #1
+; CHECK-NEXT:    umov w10, v1.b[8]
+; CHECK-NEXT:    bfi w9, w11, #2, #1
+; CHECK-NEXT:    umov w11, v1.b[9]
+; CHECK-NEXT:    bfi w9, w12, #3, #1
+; CHECK-NEXT:    umov w12, v1.b[10]
+; CHECK-NEXT:    bfi w9, w13, #4, #1
+; CHECK-NEXT:    umov w13, v0.b[0]
+; CHECK-NEXT:    bfi w9, w14, #5, #1
+; CHECK-NEXT:    umov w14, v0.b[1]
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    and w16, w16, #0x1
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    orr w9, w9, w15, lsl #6
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    bfi w13, w14, #1, #1
+; CHECK-NEXT:    orr w9, w9, w16, lsl #7
+; CHECK-NEXT:    umov w14, v0.b[2]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    orr w9, w9, w10, lsl #8
+; CHECK-NEXT:    umov w10, v0.b[3]
+; CHECK-NEXT:    orr w9, w9, w11, lsl #9
+; CHECK-NEXT:    umov w11, v0.b[4]
+; CHECK-NEXT:    orr w9, w9, w12, lsl #10
+; CHECK-NEXT:    umov w12, v0.b[6]
+; CHECK-NEXT:    bfi w13, w14, #2, #1
+; CHECK-NEXT:    umov w14, v0.b[5]
+; CHECK-NEXT:    umov w16, v1.b[12]
+; CHECK-NEXT:    bfi w13, w10, #3, #1
+; CHECK-NEXT:    umov w10, v0.b[7]
+; CHECK-NEXT:    umov w15, v1.b[11]
+; CHECK-NEXT:    bfi w13, w11, #4, #1
+; CHECK-NEXT:    and w11, w12, #0x1
+; CHECK-NEXT:    umov w12, v0.b[8]
+; CHECK-NEXT:    bfi w13, w14, #5, #1
+; CHECK-NEXT:    orr w11, w13, w11, lsl #6
+; CHECK-NEXT:    umov w13, v0.b[9]
+; CHECK-NEXT:    and w14, w16, #0x1
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    umov w16, v0.b[10]
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    orr w10, w11, w10, lsl #7
+; CHECK-NEXT:    orr w9, w9, w15, lsl #11
+; CHECK-NEXT:    and w11, w13, #0x1
+; CHECK-NEXT:    orr w10, w10, w12, lsl #8
+; CHECK-NEXT:    umov w12, v0.b[11]
+; CHECK-NEXT:    orr w9, w9, w14, lsl #12
+; CHECK-NEXT:    and w13, w16, #0x1
+; CHECK-NEXT:    umov w14, v0.b[12]
+; CHECK-NEXT:    orr w10, w10, w11, lsl #9
+; CHECK-NEXT:    umov w15, v1.b[13]
+; CHECK-NEXT:    orr w10, w10, w13, lsl #10
+; CHECK-NEXT:    umov w13, v0.b[13]
+; CHECK-NEXT:    umov w11, v1.b[14]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    umov w16, v0.b[14]
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    orr w10, w10, w12, lsl #11
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    umov w12, v1.b[15]
+; CHECK-NEXT:    orr w10, w10, w14, lsl #12
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    umov w14, v0.b[15]
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    and w16, w16, #0x1
+; CHECK-NEXT:    orr w9, w9, w15, lsl #13
+; CHECK-NEXT:    orr w10, w10, w13, lsl #13
+; CHECK-NEXT:    orr w9, w9, w11, lsl #14
+; CHECK-NEXT:    orr w10, w10, w16, lsl #14
+; CHECK-NEXT:    orr w9, w9, w12, lsl #15
+; CHECK-NEXT:    orr w10, w10, w14, lsl #15
+; CHECK-NEXT:    and w9, w10, w9
+; CHECK-NEXT:    bics wzr, w8, w9
+; CHECK-NEXT:    cset w0, eq
+; CHECK-NEXT:    add sp, sp, #16
+; CHECK-NEXT:    ret
+  %cmp1 = icmp eq <32 x i8> %a, zeroinitializer
+  %cast = bitcast <32 x i1> %cmp1 to i32
+  %cmp2 = icmp eq i32 %cast, -1
+  ret i1 %cmp2
+}
+
+define i1 @combine_setcc_eq_vecreduce_and_v64i1(<64 x i8> %a) {
+; CHECK-LABEL: combine_setcc_eq_vecreduce_and_v64i1:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    sub sp, sp, #16
+; CHECK-NEXT:    .cfi_def_cfa_offset 16
+; CHECK-NEXT:    cmeq v3.16b, v3.16b, #0
+; CHECK-NEXT:    mov w8, #-1 // =0xffffffff
+; CHECK-NEXT:    cmeq v2.16b, v2.16b, #0
+; CHECK-NEXT:    umov w10, v3.b[0]
+; CHECK-NEXT:    umov w9, v3.b[1]
+; CHECK-NEXT:    umov w11, v3.b[2]
+; CHECK-NEXT:    umov w12, v3.b[3]
+; CHECK-NEXT:    umov w13, v3.b[4]
+; CHECK-NEXT:    umov w15, v3.b[6]
+; CHECK-NEXT:    umov w14, v3.b[5]
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    umov w16, v3.b[7]
+; CHECK-NEXT:    lsl w10, w10, #16
+; CHECK-NEXT:    umov w17, v3.b[8]
+; CHECK-NEXT:    bfi w10, w9, #17, #1
+; CHECK-NEXT:    umov w18, v3.b[9]
+; CHECK-NEXT:    bfi w10, w11, #18, #1
+; CHECK-NEXT:    umov w9, v3.b[10]
+; CHECK-NEXT:    bfi w10, w12, #19, #1
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    bfi w10, w13, #20, #1
+; CHECK-NEXT:    umov w11, v3.b[11]
+; CHECK-NEXT:    bfi w10, w14, #21, #1
+; CHECK-NEXT:    and w16, w16, #0x1
+; CHECK-NEXT:    umov w12, v3.b[12]
+; CHECK-NEXT:    and w17, w17, #0x1
+; CHECK-NEXT:    orr w10, w10, w15, lsl #22
+; CHECK-NEXT:    umov w13, v3.b[13]
+; CHECK-NEXT:    and w18, w18, #0x1
+; CHECK-NEXT:    orr w10, w10, w16, lsl #23
+; CHECK-NEXT:    umov w14, v3.b[14]
+; CHECK-NEXT:    and w9, w9, #0x1
+; CHECK-NEXT:    orr w10, w10, w17, lsl #24
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    orr w10, w10, w18, lsl #25
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    orr w9, w10, w9, lsl #26
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    orr w9, w9, w11, lsl #27
+; CHECK-NEXT:    umov w11, v2.b[0]
+; CHECK-NEXT:    and w10, w14, #0x1
+; CHECK-NEXT:    orr w9, w9, w12, lsl #28
+; CHECK-NEXT:    umov w12, v2.b[1]
+; CHECK-NEXT:    orr w9, w9, w13, lsl #29
+; CHECK-NEXT:    umov w13, v2.b[2]
+; CHECK-NEXT:    orr w9, w9, w10, lsl #30
+; CHECK-NEXT:    umov w10, v2.b[3]
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    umov w14, v2.b[4]
+; CHECK-NEXT:    umov w16, v2.b[10]
+; CHECK-NEXT:    bfi w11, w12, #1, #1
+; CHECK-NEXT:    umov w12, v2.b[5]
+; CHECK-NEXT:    bfi w11, w13, #2, #1
+; CHECK-NEXT:    umov w13, v2.b[6]
+; CHECK-NEXT:    bfi w11, w10, #3, #1
+; CHECK-NEXT:    umov w10, v2.b[7]
+; CHECK-NEXT:    bfi w11, w14, #4, #1
+; CHECK-NEXT:    umov w14, v2.b[9]
+; CHECK-NEXT:    bfi w11, w12, #5, #1
+; CHECK-NEXT:    umov w12, v2.b[8]
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    umov w15, v3.b[15]
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    orr w11, w11, w13, lsl #6
+; CHECK-NEXT:    umov w13, v2.b[11]
+; CHECK-NEXT:    orr w10, w11, w10, lsl #7
+; CHECK-NEXT:    and w11, w12, #0x1
+; CHECK-NEXT:    and w12, w14, #0x1
+; CHECK-NEXT:    umov w14, v2.b[14]
+; CHECK-NEXT:    orr w10, w10, w11, lsl #8
+; CHECK-NEXT:    and w11, w16, #0x1
+; CHECK-NEXT:    orr w10, w10, w12, lsl #9
+; CHECK-NEXT:    umov w12, v2.b[12]
+; CHECK-NEXT:    orr w10, w10, w11, lsl #10
+; CHECK-NEXT:    umov w11, v2.b[13]
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    orr w9, w9, w15, lsl #31
+; CHECK-NEXT:    cmeq v1.16b, v1.16b, #0
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    orr w10, w10, w13, lsl #11
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    umov w13, v1.b[0]
+; CHECK-NEXT:    orr w10, w10, w12, lsl #12
+; CHECK-NEXT:    and w12, w14, #0x1
+; CHECK-NEXT:    orr w10, w10, w11, lsl #13
+; CHECK-NEXT:    umov w11, v1.b[1]
+; CHECK-NEXT:    umov w14, v1.b[2]
+; CHECK-NEXT:    umov w15, v1.b[3]
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    orr w10, w10, w12, lsl #14
+; CHECK-NEXT:    lsl w13, w13, #16
+; CHECK-NEXT:    umov w12, v2.b[15]
+; CHECK-NEXT:    bfi w13, w11, #17, #1
+; CHECK-NEXT:    umov w11, v1.b[4]
+; CHECK-NEXT:    umov w17, v1.b[6]
+; CHECK-NEXT:    umov w16, v1.b[5]
+; CHECK-NEXT:    bfi w13, w14, #18, #1
+; CHECK-NEXT:    umov w14, v1.b[7]
+; CHECK-NEXT:    bfi w13, w15, #19, #1
+; CHECK-NEXT:    orr w10, w10, w12, lsl #15
+; CHECK-NEXT:    bfi w13, w11, #20, #1
+; CHECK-NEXT:    umov w11, v1.b[8]
+; CHECK-NEXT:    and w12, w17, #0x1
+; CHECK-NEXT:    bfi w13, w16, #21, #1
+; CHECK-NEXT:    umov w15, v1.b[9]
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    orr w12, w13, w12, lsl #22
+; CHECK-NEXT:    umov w13, v1.b[10]
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    orr w12, w12, w14, lsl #23
+; CHECK-NEXT:    cmeq v0.16b, v0.16b, #0
+; CHECK-NEXT:    umov w18, v1.b[12]
+; CHECK-NEXT:    orr w11, w12, w11, lsl #24
+; CHECK-NEXT:    and w12, w15, #0x1
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    umov w14, v0.b[0]
+; CHECK-NEXT:    orr w11, w11, w12, lsl #25
+; CHECK-NEXT:    umov w12, v0.b[1]
+; CHECK-NEXT:    orr w11, w11, w13, lsl #26
+; CHECK-NEXT:    umov w13, v0.b[2]
+; CHECK-NEXT:    umov w16, v0.b[3]
+; CHECK-NEXT:    umov w17, v0.b[4]
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    umov w15, v1.b[11]
+; CHECK-NEXT:    bfi w14, w12, #1, #1
+; CHECK-NEXT:    umov w12, v0.b[6]
+; CHECK-NEXT:    bfi w14, w13, #2, #1
+; CHECK-NEXT:    umov w13, v0.b[5]
+; CHECK-NEXT:    bfi w14, w16, #3, #1
+; CHECK-NEXT:    umov w16, v0.b[7]
+; CHECK-NEXT:    bfi w14, w17, #4, #1
+; CHECK-NEXT:    umov w17, v0.b[8]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    bfi w14, w13, #5, #1
+; CHECK-NEXT:    and w13, w18, #0x1
+; CHECK-NEXT:    orr w12, w14, w12, lsl #6
+; CHECK-NEXT:    and w14, w16, #0x1
+; CHECK-NEXT:    umov w16, v0.b[9]
+; CHECK-NEXT:    umov w18, v0.b[10]
+; CHECK-NEXT:    and w17, w17, #0x1
+; CHECK-NEXT:    orr w11, w11, w15, lsl #27
+; CHECK-NEXT:    orr w12, w12, w14, lsl #7
+; CHECK-NEXT:    orr w11, w11, w13, lsl #28
+; CHECK-NEXT:    umov w14, v0.b[11]
+; CHECK-NEXT:    orr w12, w12, w17, lsl #8
+; CHECK-NEXT:    and w13, w16, #0x1
+; CHECK-NEXT:    and w15, w18, #0x1
+; CHECK-NEXT:    umov w16, v0.b[12]
+; CHECK-NEXT:    umov w17, v1.b[13]
+; CHECK-NEXT:    orr w12, w12, w13, lsl #9
+; CHECK-NEXT:    umov w18, v0.b[14]
+; CHECK-NEXT:    orr w12, w12, w15, lsl #10
+; CHECK-NEXT:    umov w15, v0.b[13]
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    umov w13, v1.b[14]
+; CHECK-NEXT:    and w16, w16, #0x1
+; CHECK-NEXT:    and w17, w17, #0x1
+; CHECK-NEXT:    orr w12, w12, w14, lsl #11
+; CHECK-NEXT:    umov w14, v1.b[15]
+; CHECK-NEXT:    orr w12, w12, w16, lsl #12
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    umov w16, v0.b[15]
+; CHECK-NEXT:    and w18, w18, #0x1
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    orr w12, w12, w15, lsl #13
+; CHECK-NEXT:    orr w11, w11, w17, lsl #29
+; CHECK-NEXT:    orr w12, w12, w18, lsl #14
+; CHECK-NEXT:    orr w11, w11, w13, lsl #30
+; CHECK-NEXT:    and w10, w10, #0xffff
+; CHECK-NEXT:    orr w12, w12, w16, lsl #15
+; CHECK-NEXT:    orr w11, w11, w14, lsl #31
+; CHECK-NEXT:    and w12, w12, #0xffff
+; CHECK-NEXT:    orr w9, w10, w9
+; CHECK-NEXT:    orr w10, w12, w11
+; CHECK-NEXT:    and x9, x9, x10
+; CHECK-NEXT:    cmp x9, x8
+; CHECK-NEXT:    cset w0, eq
+; CHECK-NEXT:    add sp, sp, #16
+; CHECK-NEXT:    ret
+  %cmp1 = icmp eq <64 x i8> %a, zeroinitializer
+  %cast = bitcast <64 x i1> %cmp1 to i64
+  %cmp2 = icmp eq i64 %cast, -1
+  ret i1 %cmp2
+}
+
+define i1 @combine_setcc_ne_vecreduce_and_v8i1(<8 x i8> %a) {
+; CHECK-LABEL: combine_setcc_ne_vecreduce_and_v8i1:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    sub sp, sp, #16
+; CHECK-NEXT:    .cfi_def_cfa_offset 16
+; CHECK-NEXT:    cmtst v0.8b, v0.8b, v0.8b
+; CHECK-NEXT:    mov w8, #255 // =0xff
+; CHECK-NEXT:    umov w9, v0.b[0]
+; CHECK-NEXT:    umov w10, v0.b[1]
+; CHECK-NEXT:    umov w11, v0.b[2]
+; CHECK-NEXT:    umov w12, v0.b[3]
+; CHECK-NEXT:    umov w13, v0.b[4]
+; CHECK-NEXT:    umov w14, v0.b[6]
+; CHECK-NEXT:    and w9, w9, #0x1
+; CHECK-NEXT:    bfi w9, w10, #1, #1
+; CHECK-NEXT:    umov w10, v0.b[5]
+; CHECK-NEXT:    bfi w9, w11, #2, #1
+; CHECK-NEXT:    umov w11, v0.b[7]
+; CHECK-NEXT:    bfi w9, w12, #3, #1
+; CHECK-NEXT:    and w12, w14, #0x1
+; CHECK-NEXT:    bfi w9, w13, #4, #1
+; CHECK-NEXT:    bfi w9, w10, #5, #1
+; CHECK-NEXT:    orr w9, w9, w12, lsl #6
+; CHECK-NEXT:    orr w9, w9, w11, lsl #7
+; CHECK-NEXT:    bics wzr, w8, w9
+; CHECK-NEXT:    cset w0, ne
+; CHECK-NEXT:    add sp, sp, #16
+; CHECK-NEXT:    ret
+  %cmp1 = icmp ne <8 x i8> %a, zeroinitializer
+  %cast = bitcast <8 x i1> %cmp1 to i8
+  %cmp2 = icmp ne i8 %cast, -1
+  ret i1 %cmp2
+}
+
+define i1 @combine_setcc_ne_vecreduce_and_v16i1(<16 x i8> %a) {
+; CHECK-LABEL: combine_setcc_ne_vecreduce_and_v16i1:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    sub sp, sp, #16
+; CHECK-NEXT:    .cfi_def_cfa_offset 16
+; CHECK-NEXT:    cmtst v0.16b, v0.16b, v0.16b
+; CHECK-NEXT:    mov w8, #65535 // =0xffff
+; CHECK-NEXT:    umov w9, v0.b[0]
+; CHECK-NEXT:    umov w10, v0.b[1]
+; CHECK-NEXT:    umov w11, v0.b[2]
+; CHECK-NEXT:    umov w12, v0.b[3]
+; CHECK-NEXT:    umov w13, v0.b[4]
+; CHECK-NEXT:    umov w14, v0.b[5]
+; CHECK-NEXT:    and w9, w9, #0x1
+; CHECK-NEXT:    bfi w9, w10, #1, #1
+; CHECK-NEXT:    umov w10, v0.b[6]
+; CHECK-NEXT:    bfi w9, w11, #2, #1
+; CHECK-NEXT:    umov w11, v0.b[7]
+; CHECK-NEXT:    bfi w9, w12, #3, #1
+; CHECK-NEXT:    umov w12, v0.b[8]
+; CHECK-NEXT:    bfi w9, w13, #4, #1
+; CHECK-NEXT:    umov w13, v0.b[9]
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    bfi w9, w14, #5, #1
+; CHECK-NEXT:    umov w14, v0.b[10]
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    orr w9, w9, w10, lsl #6
+; CHECK-NEXT:    umov w10, v0.b[11]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    orr w9, w9, w11, lsl #7
+; CHECK-NEXT:    umov w11, v0.b[12]
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    orr w9, w9, w12, lsl #8
+; CHECK-NEXT:    umov w12, v0.b[13]
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    orr w9, w9, w13, lsl #9
+; CHECK-NEXT:    umov w13, v0.b[14]
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    orr w9, w9, w14, lsl #10
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    orr w9, w9, w10, lsl #11
+; CHECK-NEXT:    and w10, w12, #0x1
+; CHECK-NEXT:    umov w12, v0.b[15]
+; CHECK-NEXT:    orr w9, w9, w11, lsl #12
+; CHECK-NEXT:    and w11, w13, #0x1
+; CHECK-NEXT:    orr w9, w9, w10, lsl #13
+; CHECK-NEXT:    orr w9, w9, w11, lsl #14
+; CHECK-NEXT:    orr w9, w9, w12, lsl #15
+; CHECK-NEXT:    bics wzr, w8, w9
+; CHECK-NEXT:    cset w0, ne
+; CHECK-NEXT:    add sp, sp, #16
+; CHECK-NEXT:    ret
+  %cmp1 = icmp ne <16 x i8> %a, zeroinitializer
+  %cast = bitcast <16 x i1> %cmp1 to i16
+  %cmp2 = icmp ne i16 %cast, -1
+  ret i1 %cmp2
+}
+
+define i1 @combine_setcc_ne_vecreduce_and_v32i1(<32 x i8> %a) {
+; CHECK-LABEL: combine_setcc_ne_vecreduce_and_v32i1:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    sub sp, sp, #16
+; CHECK-NEXT:    .cfi_def_cfa_offset 16
+; CHECK-NEXT:    cmtst v1.16b, v1.16b, v1.16b
+; CHECK-NEXT:    mov w8, #65535 // =0xffff
+; CHECK-NEXT:    cmtst v0.16b, v0.16b, v0.16b
+; CHECK-NEXT:    umov w10, v1.b[0]
+; CHECK-NEXT:    umov w9, v1.b[1]
+; CHECK-NEXT:    umov w11, v1.b[2]
+; CHECK-NEXT:    umov w12, v1.b[3]
+; CHECK-NEXT:    umov w13, v1.b[4]
+; CHECK-NEXT:    umov w14, v1.b[5]
+; CHECK-NEXT:    umov w15, v1.b[6]
+; CHECK-NEXT:    umov w16, v1.b[7]
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    umov w17, v1.b[8]
+; CHECK-NEXT:    bfi w10, w9, #1, #1
+; CHECK-NEXT:    umov w9, v1.b[9]
+; CHECK-NEXT:    bfi w10, w11, #2, #1
+; CHECK-NEXT:    umov w11, v0.b[0]
+; CHECK-NEXT:    bfi w10, w12, #3, #1
+; CHECK-NEXT:    umov w12, v0.b[1]
+; CHECK-NEXT:    bfi w10, w13, #4, #1
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    bfi w10, w14, #5, #1
+; CHECK-NEXT:    umov w14, v0.b[2]
+; CHECK-NEXT:    umov w13, v1.b[10]
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    orr w10, w10, w15, lsl #6
+; CHECK-NEXT:    and w15, w16, #0x1
+; CHECK-NEXT:    bfi w11, w12, #1, #1
+; CHECK-NEXT:    and w16, w17, #0x1
+; CHECK-NEXT:    and w9, w9, #0x1
+; CHECK-NEXT:    bfi w11, w14, #2, #1
+; CHECK-NEXT:    orr w10, w10, w15, lsl #7
+; CHECK-NEXT:    umov w14, v0.b[3]
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    orr w10, w10, w16, lsl #8
+; CHECK-NEXT:    umov w15, v0.b[4]
+; CHECK-NEXT:    orr w9, w10, w9, lsl #9
+; CHECK-NEXT:    umov w10, v0.b[6]
+; CHECK-NEXT:    orr w9, w9, w13, lsl #10
+; CHECK-NEXT:    umov w13, v0.b[5]
+; CHECK-NEXT:    bfi w11, w14, #3, #1
+; CHECK-NEXT:    umov w14, v0.b[7]
+; CHECK-NEXT:    umov w16, v1.b[12]
+; CHECK-NEXT:    umov w12, v1.b[11]
+; CHECK-NEXT:    bfi w11, w15, #4, #1
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    umov w15, v0.b[8]
+; CHECK-NEXT:    bfi w11, w13, #5, #1
+; CHECK-NEXT:    orr w10, w11, w10, lsl #6
+; CHECK-NEXT:    and w11, w14, #0x1
+; CHECK-NEXT:    umov w14, v0.b[9]
+; CHECK-NEXT:    and w13, w16, #0x1
+; CHECK-NEXT:    umov w16, v0.b[10]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    orr w10, w10, w11, lsl #7
+; CHECK-NEXT:    orr w9, w9, w12, lsl #11
+; CHECK-NEXT:    umov w12, v0.b[11]
+; CHECK-NEXT:    and w11, w14, #0x1
+; CHECK-NEXT:    orr w9, w9, w13, lsl #12
+; CHECK-NEXT:    orr w10, w10, w15, lsl #8
+; CHECK-NEXT:    and w13, w16, #0x1
+; CHECK-NEXT:    umov w14, v0.b[12]
+; CHECK-NEXT:    orr w10, w10, w11, lsl #9
+; CHECK-NEXT:    umov w15, v1.b[13]
+; CHECK-NEXT:    orr w10, w10, w13, lsl #10
+; CHECK-NEXT:    umov w13, v0.b[13]
+; CHECK-NEXT:    umov w11, v1.b[14]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    umov w16, v0.b[14]
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    orr w10, w10, w12, lsl #11
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    umov w12, v1.b[15]
+; CHECK-NEXT:    orr w10, w10, w14, lsl #12
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    umov w14, v0.b[15]
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    and w16, w16, #0x1
+; CHECK-NEXT:    orr w9, w9, w15, lsl #13
+; CHECK-NEXT:    orr w10, w10, w13, lsl #13
+; CHECK-NEXT:    orr w9, w9, w11, lsl #14
+; CHECK-NEXT:    orr w10, w10, w16, lsl #14
+; CHECK-NEXT:    orr w9, w9, w12, lsl #15
+; CHECK-NEXT:    orr w10, w10, w14, lsl #15
+; CHECK-NEXT:    and w9, w10, w9
+; CHECK-NEXT:    bics wzr, w8, w9
+; CHECK-NEXT:    cset w0, ne
+; CHECK-NEXT:    add sp, sp, #16
+; CHECK-NEXT:    ret
+  %cmp1 = icmp ne <32 x i8> %a, zeroinitializer
+  %cast = bitcast <32 x i1> %cmp1 to i32
+  %cmp2 = icmp ne i32 %cast, -1
+  ret i1 %cmp2
+}
+
+define i1 @combine_setcc_ne_vecreduce_and_v64i1(<64 x i8> %a) {
+; CHECK-LABEL: combine_setcc_ne_vecreduce_and_v64i1:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    sub sp, sp, #16
+; CHECK-NEXT:    .cfi_def_cfa_offset 16
+; CHECK-NEXT:    cmtst v3.16b, v3.16b, v3.16b
+; CHECK-NEXT:    mov w8, #-1 // =0xffffffff
+; CHECK-NEXT:    cmtst v2.16b, v2.16b, v2.16b
+; CHECK-NEXT:    cmtst v1.16b, v1.16b, v1.16b
+; CHECK-NEXT:    umov w10, v3.b[0]
+; CHECK-NEXT:    umov w9, v3.b[1]
+; CHECK-NEXT:    umov w11, v3.b[2]
+; CHECK-NEXT:    umov w12, v3.b[3]
+; CHECK-NEXT:    umov w13, v3.b[4]
+; CHECK-NEXT:    umov w15, v3.b[6]
+; CHECK-NEXT:    umov w14, v3.b[5]
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    umov w16, v3.b[7]
+; CHECK-NEXT:    lsl w10, w10, #16
+; CHECK-NEXT:    umov w17, v3.b[8]
+; CHECK-NEXT:    bfi w10, w9, #17, #1
+; CHECK-NEXT:    umov w18, v3.b[9]
+; CHECK-NEXT:    bfi w10, w11, #18, #1
+; CHECK-NEXT:    umov w9, v3.b[10]
+; CHECK-NEXT:    bfi w10, w12, #19, #1
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    bfi w10, w13, #20, #1
+; CHECK-NEXT:    and w16, w16, #0x1
+; CHECK-NEXT:    bfi w10, w14, #21, #1
+; CHECK-NEXT:    umov w11, v3.b[11]
+; CHECK-NEXT:    and w17, w17, #0x1
+; CHECK-NEXT:    orr w10, w10, w15, lsl #22
+; CHECK-NEXT:    and w18, w18, #0x1
+; CHECK-NEXT:    umov w13, v2.b[0]
+; CHECK-NEXT:    orr w10, w10, w16, lsl #23
+; CHECK-NEXT:    and w9, w9, #0x1
+; CHECK-NEXT:    umov w15, v2.b[1]
+; CHECK-NEXT:    orr w10, w10, w17, lsl #24
+; CHECK-NEXT:    orr w10, w10, w18, lsl #25
+; CHECK-NEXT:    umov w16, v2.b[2]
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    orr w9, w10, w9, lsl #26
+; CHECK-NEXT:    umov w10, v2.b[3]
+; CHECK-NEXT:    umov w12, v3.b[12]
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    umov w14, v3.b[13]
+; CHECK-NEXT:    orr w9, w9, w11, lsl #27
+; CHECK-NEXT:    umov w11, v2.b[4]
+; CHECK-NEXT:    bfi w13, w15, #1, #1
+; CHECK-NEXT:    umov w15, v2.b[5]
+; CHECK-NEXT:    bfi w13, w16, #2, #1
+; CHECK-NEXT:    umov w16, v2.b[6]
+; CHECK-NEXT:    bfi w13, w10, #3, #1
+; CHECK-NEXT:    umov w10, v2.b[7]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    bfi w13, w11, #4, #1
+; CHECK-NEXT:    and w11, w14, #0x1
+; CHECK-NEXT:    umov w14, v2.b[8]
+; CHECK-NEXT:    orr w9, w9, w12, lsl #28
+; CHECK-NEXT:    bfi w13, w15, #5, #1
+; CHECK-NEXT:    and w12, w16, #0x1
+; CHECK-NEXT:    umov w15, v2.b[9]
+; CHECK-NEXT:    and w10, w10, #0x1
+; CHECK-NEXT:    umov w16, v3.b[14]
+; CHECK-NEXT:    orr w12, w13, w12, lsl #6
+; CHECK-NEXT:    orr w9, w9, w11, lsl #29
+; CHECK-NEXT:    orr w10, w12, w10, lsl #7
+; CHECK-NEXT:    and w11, w14, #0x1
+; CHECK-NEXT:    umov w12, v2.b[10]
+; CHECK-NEXT:    and w13, w15, #0x1
+; CHECK-NEXT:    umov w14, v2.b[11]
+; CHECK-NEXT:    orr w10, w10, w11, lsl #8
+; CHECK-NEXT:    orr w10, w10, w13, lsl #9
+; CHECK-NEXT:    umov w13, v2.b[12]
+; CHECK-NEXT:    and w15, w16, #0x1
+; CHECK-NEXT:    umov w16, v2.b[13]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    umov w11, v3.b[15]
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    orr w9, w9, w15, lsl #30
+; CHECK-NEXT:    orr w10, w10, w12, lsl #10
+; CHECK-NEXT:    and w12, w13, #0x1
+; CHECK-NEXT:    orr w10, w10, w14, lsl #11
+; CHECK-NEXT:    umov w14, v1.b[0]
+; CHECK-NEXT:    and w13, w16, #0x1
+; CHECK-NEXT:    orr w9, w9, w11, lsl #31
+; CHECK-NEXT:    orr w10, w10, w12, lsl #12
+; CHECK-NEXT:    umov w11, v1.b[1]
+; CHECK-NEXT:    orr w10, w10, w13, lsl #13
+; CHECK-NEXT:    umov w13, v1.b[2]
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    umov w15, v1.b[3]
+; CHECK-NEXT:    lsl w14, w14, #16
+; CHECK-NEXT:    umov w16, v1.b[4]
+; CHECK-NEXT:    umov w12, v2.b[14]
+; CHECK-NEXT:    bfi w14, w11, #17, #1
+; CHECK-NEXT:    umov w11, v1.b[6]
+; CHECK-NEXT:    bfi w14, w13, #18, #1
+; CHECK-NEXT:    umov w13, v1.b[5]
+; CHECK-NEXT:    bfi w14, w15, #19, #1
+; CHECK-NEXT:    bfi w14, w16, #20, #1
+; CHECK-NEXT:    umov w15, v1.b[7]
+; CHECK-NEXT:    umov w16, v1.b[8]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    and w11, w11, #0x1
+; CHECK-NEXT:    umov w18, v1.b[12]
+; CHECK-NEXT:    bfi w14, w13, #21, #1
+; CHECK-NEXT:    orr w10, w10, w12, lsl #14
+; CHECK-NEXT:    umov w12, v2.b[15]
+; CHECK-NEXT:    orr w11, w14, w11, lsl #22
+; CHECK-NEXT:    umov w14, v1.b[9]
+; CHECK-NEXT:    and w13, w15, #0x1
+; CHECK-NEXT:    and w15, w16, #0x1
+; CHECK-NEXT:    umov w16, v1.b[10]
+; CHECK-NEXT:    cmtst v0.16b, v0.16b, v0.16b
+; CHECK-NEXT:    orr w11, w11, w13, lsl #23
+; CHECK-NEXT:    orr w10, w10, w12, lsl #15
+; CHECK-NEXT:    orr w11, w11, w15, lsl #24
+; CHECK-NEXT:    and w12, w14, #0x1
+; CHECK-NEXT:    umov w15, v1.b[11]
+; CHECK-NEXT:    and w13, w16, #0x1
+; CHECK-NEXT:    umov w14, v0.b[0]
+; CHECK-NEXT:    orr w11, w11, w12, lsl #25
+; CHECK-NEXT:    umov w12, v0.b[1]
+; CHECK-NEXT:    orr w11, w11, w13, lsl #26
+; CHECK-NEXT:    umov w13, v0.b[2]
+; CHECK-NEXT:    umov w16, v0.b[3]
+; CHECK-NEXT:    umov w17, v0.b[4]
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    bfi w14, w12, #1, #1
+; CHECK-NEXT:    umov w12, v0.b[6]
+; CHECK-NEXT:    bfi w14, w13, #2, #1
+; CHECK-NEXT:    umov w13, v0.b[5]
+; CHECK-NEXT:    bfi w14, w16, #3, #1
+; CHECK-NEXT:    umov w16, v0.b[7]
+; CHECK-NEXT:    bfi w14, w17, #4, #1
+; CHECK-NEXT:    umov w17, v0.b[8]
+; CHECK-NEXT:    and w12, w12, #0x1
+; CHECK-NEXT:    orr w11, w11, w15, lsl #27
+; CHECK-NEXT:    bfi w14, w13, #5, #1
+; CHECK-NEXT:    and w13, w18, #0x1
+; CHECK-NEXT:    orr w12, w14, w12, lsl #6
+; CHECK-NEXT:    and w14, w16, #0x1
+; CHECK-NEXT:    umov w16, v0.b[9]
+; CHECK-NEXT:    umov w18, v0.b[10]
+; CHECK-NEXT:    and w17, w17, #0x1
+; CHECK-NEXT:    orr w12, w12, w14, lsl #7
+; CHECK-NEXT:    orr w11, w11, w13, lsl #28
+; CHECK-NEXT:    umov w14, v0.b[11]
+; CHECK-NEXT:    orr w12, w12, w17, lsl #8
+; CHECK-NEXT:    umov w17, v1.b[13]
+; CHECK-NEXT:    and w13, w16, #0x1
+; CHECK-NEXT:    and w15, w18, #0x1
+; CHECK-NEXT:    umov w16, v0.b[12]
+; CHECK-NEXT:    umov w18, v0.b[14]
+; CHECK-NEXT:    orr w12, w12, w13, lsl #9
+; CHECK-NEXT:    and w14, w14, #0x1
+; CHECK-NEXT:    orr w12, w12, w15, lsl #10
+; CHECK-NEXT:    umov w15, v0.b[13]
+; CHECK-NEXT:    umov w13, v1.b[14]
+; CHECK-NEXT:    orr w12, w12, w14, lsl #11
+; CHECK-NEXT:    and w16, w16, #0x1
+; CHECK-NEXT:    and w17, w17, #0x1
+; CHECK-NEXT:    umov w14, v1.b[15]
+; CHECK-NEXT:    and w18, w18, #0x1
+; CHECK-NEXT:    orr w12, w12, w16, lsl #12
+; CHECK-NEXT:    and w15, w15, #0x1
+; CHECK-NEXT:    umov w16, v0.b[15]
+; CHECK-NEXT:    and w13, w13, #0x1
+; CHECK-NEXT:    orr w12, w12, w15, lsl #13
+; CHECK-NEXT:    orr w11, w11, w17, lsl #29
+; CHECK-NEXT:    orr w12, w12, w18, lsl #14
+; CHECK-NEXT:    orr w11, w11, w13, lsl #30
+; CHECK-NEXT:    orr w11, w11, w14, lsl #31
+; CHECK-NEXT:    and w10, w10, #0xffff
+; CHECK-NEXT:    orr w12, w12, w16, lsl #15
+; CHECK-NEXT:    orr w9, w10, w9
+; CHECK-NEXT:    and w12, w12, #0xffff
+; CHECK-NEXT:    orr w10, w12, w11
+; CHECK-NEXT:    and x9, x9, x10
+; CHECK-NEXT:    cmp x9, x8
+; CHECK-NEXT:    cset w0, ne
+; CHECK-NEXT:    add sp, sp, #16
+; CHECK-NEXT:    ret
+  %cmp1 = icmp ne <64 x i8> %a, zeroinitializer
+  %cast = bitcast <64 x i1> %cmp1 to i64
+  %cmp2 = icmp ne i64 %cast, -1
+  ret i1 %cmp2
+}
+
 define i1 @combine_setcc_eq0_conjunction_xor_or(ptr %a, ptr %b) {
 ; CHECK-LABEL: combine_setcc_eq0_conjunction_xor_or:
 ; CHECK:       // %bb.0:
@@ -164,11 +932,11 @@ define i32 @combine_setcc_multiuse(i32 %0, i32 %1, i32 %2, i32 %3) {
 ; CHECK-NEXT:    eor w8, w1, w0
 ; CHECK-NEXT:    eor w9, w3, w2
 ; CHECK-NEXT:    orr w8, w9, w8
-; CHECK-NEXT:    cbz w8, .LBB10_2
+; CHECK-NEXT:    cbz w8, .LBB18_2
 ; CHECK-NEXT:  // %bb.1:
 ; CHECK-NEXT:    mov w0, w8
 ; CHECK-NEXT:    b use
-; CHECK-NEXT:  .LBB10_2:
+; CHECK-NEXT:  .LBB18_2:
 ; CHECK-NEXT:    ret
   %5 = xor i32 %1, %0
   %6 = xor i32 %3, %2
@@ -209,7 +977,7 @@ define [2 x i64] @PR58675(i128 %a.addr, i128 %b.addr) {
 ; CHECK:       // %bb.0: // %entry
 ; CHECK-NEXT:    mov x8, xzr
 ; CHECK-NEXT:    mov x9, xzr
-; CHECK-NEXT:  .LBB12_1: // %do.body
+; CHECK-NEXT:  .LBB20_1: // %do.body
 ; CHECK-NEXT:    // =>This Inner Loop Header: Depth=1
 ; CHECK-NEXT:    cmp x0, x8
 ; CHECK-NEXT:    csel x10, x0, x8, lo
@@ -221,7 +989,7 @@ define [2 x i64] @PR58675(i128 %a.addr, i128 %b.addr) {
 ; CHECK-NEXT:    sbc x9, x3, x11
 ; CHECK-NEXT:    cmp x3, x11
 ; CHECK-NEXT:    ccmp x2, x10, #0, eq
-; CHECK-NEXT:    b.ne .LBB12_1
+; CHECK-NEXT:    b.ne .LBB20_1
 ; CHECK-NEXT:  // %bb.2: // %do.end
 ; CHECK-NEXT:    mov x0, xzr
 ; CHECK-NEXT:    mov x1, xzr