[X86] Add AND/OR/XOR signed-comparison overflow test cases for PR48768
authorSimon Pilgrim <llvm-dev@redking.me.uk>
Wed, 7 Apr 2021 12:27:41 +0000 (13:27 +0100)
committerSimon Pilgrim <llvm-dev@redking.me.uk>
Wed, 7 Apr 2021 12:31:54 +0000 (13:31 +0100)
D94856 covered the BMI cases where we had existing tests, this adds missing AND/OR/XOR test cases

llvm/test/CodeGen/X86/and-with-overflow.ll [new file with mode: 0644]
llvm/test/CodeGen/X86/or-with-overflow.ll [new file with mode: 0644]
llvm/test/CodeGen/X86/xor-with-overflow.ll [new file with mode: 0644]

diff --git a/llvm/test/CodeGen/X86/and-with-overflow.ll b/llvm/test/CodeGen/X86/and-with-overflow.ll
new file mode 100644 (file)
index 0000000..a6565d6
--- /dev/null
@@ -0,0 +1,233 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc < %s -mtriple=i686-unknown-unknown | FileCheck %s --check-prefix=X86
+; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+cmov | FileCheck %s --check-prefix=X64
+
+;
+; PR48768 - 'and' clears the overflow flag, so we don't need a separate 'test'.
+;
+
+define i8 @and_i8_ri(i8 %0, i8 %1) {
+; X86-LABEL: and_i8_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    movb {{[0-9]+}}(%esp), %al
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    andb $-17, %cl
+; X86-NEXT:    je .LBB0_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB0_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: and_i8_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %edi, %eax
+; X64-NEXT:    andb $-17, %al
+; X64-NEXT:    movzbl %al, %eax
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $al killed $al killed $eax
+; X64-NEXT:    retq
+  %3 = and i8 %0, -17
+  %4 = icmp eq i8 %3, 0
+  %5 = select i1 %4, i8 %0, i8 %3
+  ret i8 %5
+}
+
+define i8 @and_i8_rr(i8 %0, i8 %1) {
+; X86-LABEL: and_i8_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    movb {{[0-9]+}}(%esp), %al
+; X86-NEXT:    movb {{[0-9]+}}(%esp), %cl
+; X86-NEXT:    andb %al, %cl
+; X86-NEXT:    je .LBB1_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB1_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: and_i8_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %esi, %eax
+; X64-NEXT:    andl %edi, %eax
+; X64-NEXT:    testb %al, %al
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $al killed $al killed $eax
+; X64-NEXT:    retq
+  %3 = and i8 %1, %0
+  %4 = icmp eq i8 %3, 0
+  %5 = select i1 %4, i8 %0, i8 %3
+  ret i8 %5
+}
+
+define i16 @and_i16_ri(i16 %0, i16 %1) {
+; X86-LABEL: and_i16_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    andl $-17, %ecx
+; X86-NEXT:    testw %cx, %cx
+; X86-NEXT:    je .LBB2_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB2_2:
+; X86-NEXT:    # kill: def $ax killed $ax killed $eax
+; X86-NEXT:    retl
+;
+; X64-LABEL: and_i16_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %edi, %eax
+; X64-NEXT:    andl $-17, %eax
+; X64-NEXT:    testw %ax, %ax
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $ax killed $ax killed $eax
+; X64-NEXT:    retq
+  %3 = and i16 %0, -17
+  %4 = icmp eq i16 %3, 0
+  %5 = select i1 %4, i16 %0, i16 %3
+  ret i16 %5
+}
+
+define i16 @and_i16_rr(i16 %0, i16 %1) {
+; X86-LABEL: and_i16_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movzwl {{[0-9]+}}(%esp), %ecx
+; X86-NEXT:    andw %ax, %cx
+; X86-NEXT:    je .LBB3_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB3_2:
+; X86-NEXT:    # kill: def $ax killed $ax killed $eax
+; X86-NEXT:    retl
+;
+; X64-LABEL: and_i16_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %esi, %eax
+; X64-NEXT:    andl %edi, %eax
+; X64-NEXT:    testw %ax, %ax
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $ax killed $ax killed $eax
+; X64-NEXT:    retq
+  %3 = and i16 %1, %0
+  %4 = icmp eq i16 %3, 0
+  %5 = select i1 %4, i16 %0, i16 %3
+  ret i16 %5
+}
+
+define i32 @and_i32_ri(i32 %0, i32 %1) {
+; X86-LABEL: and_i32_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    andl $-17, %ecx
+; X86-NEXT:    testl %ecx, %ecx
+; X86-NEXT:    jle .LBB4_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB4_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: and_i32_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %edi, %eax
+; X64-NEXT:    andl $-17, %eax
+; X64-NEXT:    testl %eax, %eax
+; X64-NEXT:    cmovlel %edi, %eax
+; X64-NEXT:    retq
+  %3 = and i32 %0, -17
+  %4 = icmp slt i32 %3, 1
+  %5 = select i1 %4, i32 %0, i32 %3
+  ret i32 %5
+}
+
+define i32 @and_i32_rr(i32 %0, i32 %1) {
+; X86-LABEL: and_i32_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
+; X86-NEXT:    andl %eax, %ecx
+; X86-NEXT:    testl %ecx, %ecx
+; X86-NEXT:    jle .LBB5_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB5_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: and_i32_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %esi, %eax
+; X64-NEXT:    andl %edi, %eax
+; X64-NEXT:    testl %eax, %eax
+; X64-NEXT:    cmovlel %edi, %eax
+; X64-NEXT:    retq
+  %3 = and i32 %1, %0
+  %4 = icmp slt i32 %3, 1
+  %5 = select i1 %4, i32 %0, i32 %3
+  ret i32 %5
+}
+
+define i64 @and_i64_ri(i64 %0, i64 %1) nounwind {
+; X86-LABEL: and_i64_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    pushl %esi
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    andl $-17, %ecx
+; X86-NEXT:    cmpl $1, %ecx
+; X86-NEXT:    movl %edx, %esi
+; X86-NEXT:    sbbl $0, %esi
+; X86-NEXT:    jl .LBB6_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB6_2:
+; X86-NEXT:    popl %esi
+; X86-NEXT:    retl
+;
+; X64-LABEL: and_i64_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movq %rdi, %rax
+; X64-NEXT:    andq $-17, %rax
+; X64-NEXT:    testq %rax, %rax
+; X64-NEXT:    cmovleq %rdi, %rax
+; X64-NEXT:    retq
+  %3 = and i64 %0, -17
+  %4 = icmp slt i64 %3, 1
+  %5 = select i1 %4, i64 %0, i64 %3
+  ret i64 %5
+}
+
+define i64 @and_i64_rr(i64 %0, i64 %1) nounwind {
+; X86-LABEL: and_i64_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    pushl %edi
+; X86-NEXT:    pushl %esi
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
+; X86-NEXT:    andl %edx, %ecx
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %esi
+; X86-NEXT:    andl %eax, %esi
+; X86-NEXT:    cmpl $1, %esi
+; X86-NEXT:    movl %ecx, %edi
+; X86-NEXT:    sbbl $0, %edi
+; X86-NEXT:    jl .LBB7_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %esi, %eax
+; X86-NEXT:    movl %ecx, %edx
+; X86-NEXT:  .LBB7_2:
+; X86-NEXT:    popl %esi
+; X86-NEXT:    popl %edi
+; X86-NEXT:    retl
+;
+; X64-LABEL: and_i64_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movq %rsi, %rax
+; X64-NEXT:    andq %rdi, %rax
+; X64-NEXT:    testq %rax, %rax
+; X64-NEXT:    cmovleq %rdi, %rax
+; X64-NEXT:    retq
+  %3 = and i64 %1, %0
+  %4 = icmp slt i64 %3, 1
+  %5 = select i1 %4, i64 %0, i64 %3
+  ret i64 %5
+}
diff --git a/llvm/test/CodeGen/X86/or-with-overflow.ll b/llvm/test/CodeGen/X86/or-with-overflow.ll
new file mode 100644 (file)
index 0000000..c98c79d
--- /dev/null
@@ -0,0 +1,236 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc < %s -mtriple=i686-unknown-unknown | FileCheck %s --check-prefix=X86
+; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+cmov | FileCheck %s --check-prefix=X64
+
+;
+; PR48768 - 'or' clears the overflow flag, so we don't need a separate 'test'.
+;
+
+define i8 @or_i8_ri(i8 %0, i8 %1) {
+; X86-LABEL: or_i8_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    movb {{[0-9]+}}(%esp), %al
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    orb $-17, %cl
+; X86-NEXT:    je .LBB0_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB0_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: or_i8_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %edi, %eax
+; X64-NEXT:    orb $-17, %al
+; X64-NEXT:    movzbl %al, %eax
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $al killed $al killed $eax
+; X64-NEXT:    retq
+  %3 = or i8 %0, -17
+  %4 = icmp eq i8 %3, 0
+  %5 = select i1 %4, i8 %0, i8 %3
+  ret i8 %5
+}
+
+define i8 @or_i8_rr(i8 %0, i8 %1) {
+; X86-LABEL: or_i8_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    movb {{[0-9]+}}(%esp), %al
+; X86-NEXT:    movb {{[0-9]+}}(%esp), %cl
+; X86-NEXT:    orb %al, %cl
+; X86-NEXT:    je .LBB1_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB1_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: or_i8_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %esi, %eax
+; X64-NEXT:    orl %edi, %eax
+; X64-NEXT:    testb %al, %al
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $al killed $al killed $eax
+; X64-NEXT:    retq
+  %3 = or i8 %1, %0
+  %4 = icmp eq i8 %3, 0
+  %5 = select i1 %4, i8 %0, i8 %3
+  ret i8 %5
+}
+
+define i16 @or_i16_ri(i16 %0, i16 %1) {
+; X86-LABEL: or_i16_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    orl $-17, %ecx
+; X86-NEXT:    testw %cx, %cx
+; X86-NEXT:    je .LBB2_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB2_2:
+; X86-NEXT:    # kill: def $ax killed $ax killed $eax
+; X86-NEXT:    retl
+;
+; X64-LABEL: or_i16_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %edi, %eax
+; X64-NEXT:    orl $-17, %eax
+; X64-NEXT:    testw %ax, %ax
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $ax killed $ax killed $eax
+; X64-NEXT:    retq
+  %3 = or i16 %0, -17
+  %4 = icmp eq i16 %3, 0
+  %5 = select i1 %4, i16 %0, i16 %3
+  ret i16 %5
+}
+
+define i16 @or_i16_rr(i16 %0, i16 %1) {
+; X86-LABEL: or_i16_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movzwl {{[0-9]+}}(%esp), %ecx
+; X86-NEXT:    orw %ax, %cx
+; X86-NEXT:    je .LBB3_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB3_2:
+; X86-NEXT:    # kill: def $ax killed $ax killed $eax
+; X86-NEXT:    retl
+;
+; X64-LABEL: or_i16_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %esi, %eax
+; X64-NEXT:    orl %edi, %eax
+; X64-NEXT:    testw %ax, %ax
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $ax killed $ax killed $eax
+; X64-NEXT:    retq
+  %3 = or i16 %1, %0
+  %4 = icmp eq i16 %3, 0
+  %5 = select i1 %4, i16 %0, i16 %3
+  ret i16 %5
+}
+
+define i32 @or_i32_ri(i32 %0, i32 %1) {
+; X86-LABEL: or_i32_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    orl $-17, %ecx
+; X86-NEXT:    testl %ecx, %ecx
+; X86-NEXT:    jle .LBB4_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB4_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: or_i32_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %edi, %eax
+; X64-NEXT:    orl $-17, %eax
+; X64-NEXT:    testl %eax, %eax
+; X64-NEXT:    cmovlel %edi, %eax
+; X64-NEXT:    retq
+  %3 = or i32 %0, -17
+  %4 = icmp slt i32 %3, 1
+  %5 = select i1 %4, i32 %0, i32 %3
+  ret i32 %5
+}
+
+define i32 @or_i32_rr(i32 %0, i32 %1) {
+; X86-LABEL: or_i32_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
+; X86-NEXT:    orl %eax, %ecx
+; X86-NEXT:    testl %ecx, %ecx
+; X86-NEXT:    jle .LBB5_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB5_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: or_i32_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %esi, %eax
+; X64-NEXT:    orl %edi, %eax
+; X64-NEXT:    testl %eax, %eax
+; X64-NEXT:    cmovlel %edi, %eax
+; X64-NEXT:    retq
+  %3 = or i32 %1, %0
+  %4 = icmp slt i32 %3, 1
+  %5 = select i1 %4, i32 %0, i32 %3
+  ret i32 %5
+}
+
+define i64 @or_i64_ri(i64 %0, i64 %1) nounwind {
+; X86-LABEL: or_i64_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    pushl %esi
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    orl $-17, %ecx
+; X86-NEXT:    cmpl $1, %ecx
+; X86-NEXT:    movl $-1, %edx
+; X86-NEXT:    movl $-1, %esi
+; X86-NEXT:    sbbl $0, %esi
+; X86-NEXT:    jl .LBB6_1
+; X86-NEXT:  # %bb.2:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:    popl %esi
+; X86-NEXT:    retl
+; X86-NEXT:  .LBB6_1:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
+; X86-NEXT:    popl %esi
+; X86-NEXT:    retl
+;
+; X64-LABEL: or_i64_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movq %rdi, %rax
+; X64-NEXT:    orq $-17, %rax
+; X64-NEXT:    testq %rax, %rax
+; X64-NEXT:    cmovleq %rdi, %rax
+; X64-NEXT:    retq
+  %3 = or i64 %0, -17
+  %4 = icmp slt i64 %3, 1
+  %5 = select i1 %4, i64 %0, i64 %3
+  ret i64 %5
+}
+
+define i64 @or_i64_rr(i64 %0, i64 %1) nounwind {
+; X86-LABEL: or_i64_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    pushl %edi
+; X86-NEXT:    pushl %esi
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
+; X86-NEXT:    orl %edx, %ecx
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %esi
+; X86-NEXT:    orl %eax, %esi
+; X86-NEXT:    cmpl $1, %esi
+; X86-NEXT:    movl %ecx, %edi
+; X86-NEXT:    sbbl $0, %edi
+; X86-NEXT:    jl .LBB7_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %esi, %eax
+; X86-NEXT:    movl %ecx, %edx
+; X86-NEXT:  .LBB7_2:
+; X86-NEXT:    popl %esi
+; X86-NEXT:    popl %edi
+; X86-NEXT:    retl
+;
+; X64-LABEL: or_i64_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movq %rsi, %rax
+; X64-NEXT:    orq %rdi, %rax
+; X64-NEXT:    testq %rax, %rax
+; X64-NEXT:    cmovleq %rdi, %rax
+; X64-NEXT:    retq
+  %3 = or i64 %1, %0
+  %4 = icmp slt i64 %3, 1
+  %5 = select i1 %4, i64 %0, i64 %3
+  ret i64 %5
+}
diff --git a/llvm/test/CodeGen/X86/xor-with-overflow.ll b/llvm/test/CodeGen/X86/xor-with-overflow.ll
new file mode 100644 (file)
index 0000000..b8107e3
--- /dev/null
@@ -0,0 +1,238 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc < %s -mtriple=i686-unknown-unknown | FileCheck %s --check-prefix=X86
+; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+cmov | FileCheck %s --check-prefix=X64
+
+;
+; PR48768 - 'xor' clears the overflow flag, so we don't need a separate 'test'.
+;
+
+define i8 @xor_i8_ri(i8 %0, i8 %1) {
+; X86-LABEL: xor_i8_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    movb {{[0-9]+}}(%esp), %al
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    xorb $-17, %cl
+; X86-NEXT:    je .LBB0_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB0_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: xor_i8_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %edi, %eax
+; X64-NEXT:    xorb $-17, %al
+; X64-NEXT:    movzbl %al, %eax
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $al killed $al killed $eax
+; X64-NEXT:    retq
+  %3 = xor i8 %0, -17
+  %4 = icmp eq i8 %3, 0
+  %5 = select i1 %4, i8 %0, i8 %3
+  ret i8 %5
+}
+
+define i8 @xor_i8_rr(i8 %0, i8 %1) {
+; X86-LABEL: xor_i8_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    movb {{[0-9]+}}(%esp), %al
+; X86-NEXT:    movb {{[0-9]+}}(%esp), %cl
+; X86-NEXT:    xorb %al, %cl
+; X86-NEXT:    je .LBB1_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB1_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: xor_i8_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %esi, %eax
+; X64-NEXT:    xorl %edi, %eax
+; X64-NEXT:    testb %al, %al
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $al killed $al killed $eax
+; X64-NEXT:    retq
+  %3 = xor i8 %1, %0
+  %4 = icmp eq i8 %3, 0
+  %5 = select i1 %4, i8 %0, i8 %3
+  ret i8 %5
+}
+
+define i16 @xor_i16_ri(i16 %0, i16 %1) {
+; X86-LABEL: xor_i16_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    xorl $-17, %ecx
+; X86-NEXT:    testw %cx, %cx
+; X86-NEXT:    je .LBB2_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB2_2:
+; X86-NEXT:    # kill: def $ax killed $ax killed $eax
+; X86-NEXT:    retl
+;
+; X64-LABEL: xor_i16_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %edi, %eax
+; X64-NEXT:    xorl $-17, %eax
+; X64-NEXT:    testw %ax, %ax
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $ax killed $ax killed $eax
+; X64-NEXT:    retq
+  %3 = xor i16 %0, -17
+  %4 = icmp eq i16 %3, 0
+  %5 = select i1 %4, i16 %0, i16 %3
+  ret i16 %5
+}
+
+define i16 @xor_i16_rr(i16 %0, i16 %1) {
+; X86-LABEL: xor_i16_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movzwl {{[0-9]+}}(%esp), %ecx
+; X86-NEXT:    xorw %ax, %cx
+; X86-NEXT:    je .LBB3_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB3_2:
+; X86-NEXT:    # kill: def $ax killed $ax killed $eax
+; X86-NEXT:    retl
+;
+; X64-LABEL: xor_i16_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %esi, %eax
+; X64-NEXT:    xorl %edi, %eax
+; X64-NEXT:    testw %ax, %ax
+; X64-NEXT:    cmovel %edi, %eax
+; X64-NEXT:    # kill: def $ax killed $ax killed $eax
+; X64-NEXT:    retq
+  %3 = xor i16 %1, %0
+  %4 = icmp eq i16 %3, 0
+  %5 = select i1 %4, i16 %0, i16 %3
+  ret i16 %5
+}
+
+define i32 @xor_i32_ri(i32 %0, i32 %1) {
+; X86-LABEL: xor_i32_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl %eax, %ecx
+; X86-NEXT:    xorl $-17, %ecx
+; X86-NEXT:    testl %ecx, %ecx
+; X86-NEXT:    jle .LBB4_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB4_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: xor_i32_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %edi, %eax
+; X64-NEXT:    xorl $-17, %eax
+; X64-NEXT:    testl %eax, %eax
+; X64-NEXT:    cmovlel %edi, %eax
+; X64-NEXT:    retq
+  %3 = xor i32 %0, -17
+  %4 = icmp slt i32 %3, 1
+  %5 = select i1 %4, i32 %0, i32 %3
+  ret i32 %5
+}
+
+define i32 @xor_i32_rr(i32 %0, i32 %1) {
+; X86-LABEL: xor_i32_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
+; X86-NEXT:    xorl %eax, %ecx
+; X86-NEXT:    testl %ecx, %ecx
+; X86-NEXT:    jle .LBB5_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %ecx, %eax
+; X86-NEXT:  .LBB5_2:
+; X86-NEXT:    retl
+;
+; X64-LABEL: xor_i32_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movl %esi, %eax
+; X64-NEXT:    xorl %edi, %eax
+; X64-NEXT:    testl %eax, %eax
+; X64-NEXT:    cmovlel %edi, %eax
+; X64-NEXT:    retq
+  %3 = xor i32 %1, %0
+  %4 = icmp slt i32 %3, 1
+  %5 = select i1 %4, i32 %0, i32 %3
+  ret i32 %5
+}
+
+define i64 @xor_i64_ri(i64 %0, i64 %1) nounwind {
+; X86-LABEL: xor_i64_ri:
+; X86:       # %bb.0:
+; X86-NEXT:    pushl %edi
+; X86-NEXT:    pushl %esi
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
+; X86-NEXT:    movl %edx, %ecx
+; X86-NEXT:    notl %ecx
+; X86-NEXT:    movl %eax, %esi
+; X86-NEXT:    xorl $-17, %esi
+; X86-NEXT:    cmpl $1, %esi
+; X86-NEXT:    movl %ecx, %edi
+; X86-NEXT:    sbbl $0, %edi
+; X86-NEXT:    jl .LBB6_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %esi, %eax
+; X86-NEXT:    movl %ecx, %edx
+; X86-NEXT:  .LBB6_2:
+; X86-NEXT:    popl %esi
+; X86-NEXT:    popl %edi
+; X86-NEXT:    retl
+;
+; X64-LABEL: xor_i64_ri:
+; X64:       # %bb.0:
+; X64-NEXT:    movq %rdi, %rax
+; X64-NEXT:    xorq $-17, %rax
+; X64-NEXT:    testq %rax, %rax
+; X64-NEXT:    cmovleq %rdi, %rax
+; X64-NEXT:    retq
+  %3 = xor i64 %0, -17
+  %4 = icmp slt i64 %3, 1
+  %5 = select i1 %4, i64 %0, i64 %3
+  ret i64 %5
+}
+
+define i64 @xor_i64_rr(i64 %0, i64 %1) nounwind {
+; X86-LABEL: xor_i64_rr:
+; X86:       # %bb.0:
+; X86-NEXT:    pushl %edi
+; X86-NEXT:    pushl %esi
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %eax
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %edx
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %ecx
+; X86-NEXT:    xorl %edx, %ecx
+; X86-NEXT:    movl {{[0-9]+}}(%esp), %esi
+; X86-NEXT:    xorl %eax, %esi
+; X86-NEXT:    cmpl $1, %esi
+; X86-NEXT:    movl %ecx, %edi
+; X86-NEXT:    sbbl $0, %edi
+; X86-NEXT:    jl .LBB7_2
+; X86-NEXT:  # %bb.1:
+; X86-NEXT:    movl %esi, %eax
+; X86-NEXT:    movl %ecx, %edx
+; X86-NEXT:  .LBB7_2:
+; X86-NEXT:    popl %esi
+; X86-NEXT:    popl %edi
+; X86-NEXT:    retl
+;
+; X64-LABEL: xor_i64_rr:
+; X64:       # %bb.0:
+; X64-NEXT:    movq %rsi, %rax
+; X64-NEXT:    xorq %rdi, %rax
+; X64-NEXT:    testq %rax, %rax
+; X64-NEXT:    cmovleq %rdi, %rax
+; X64-NEXT:    retq
+  %3 = xor i64 %1, %0
+  %4 = icmp slt i64 %3, 1
+  %5 = select i1 %4, i64 %0, i64 %3
+  ret i64 %5
+}