| ; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 6 |
| ; RUN: llc < %s -mtriple=x86_64-- -mcpu=x86-64-v2 | FileCheck %s --check-prefixes=CHECK,SSE |
| ; RUN: llc < %s -mtriple=x86_64-- -mcpu=x86-64-v3 | FileCheck %s --check-prefixes=CHECK,AVX2 |
| ; RUN: llc < %s -mtriple=x86_64-- -mcpu=knl | FileCheck %s --check-prefixes=AVX512,AVX512F |
| ; RUN: llc < %s -mtriple=x86_64-- -mcpu=x86-64-v4 | FileCheck %s --check-prefixes=AVX512,AVX512VL |
| |
| define i512 @test_sub_i512_reg_reg(i512 %a0, i512 %a1) nounwind { |
| ; SSE-LABEL: test_sub_i512_reg_reg: |
| ; SSE: # %bb.0: |
| ; SSE-NEXT: subq {{[0-9]+}}(%rsp), %rsi |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %rdx |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %rcx |
| ; SSE-NEXT: movq %rdi, %rax |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %r8 |
| ; SSE-NEXT: movq {{[0-9]+}}(%rsp), %rdi |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %r9 |
| ; SSE-NEXT: movq {{[0-9]+}}(%rsp), %r10 |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %r10 |
| ; SSE-NEXT: movq {{[0-9]+}}(%rsp), %r11 |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %rdi |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %r11 |
| ; SSE-NEXT: movq %rcx, 16(%rax) |
| ; SSE-NEXT: movq %rdx, 8(%rax) |
| ; SSE-NEXT: movq %rsi, (%rax) |
| ; SSE-NEXT: movq %r8, 24(%rax) |
| ; SSE-NEXT: movq %r9, 32(%rax) |
| ; SSE-NEXT: movq %r10, 40(%rax) |
| ; SSE-NEXT: movq %rdi, 48(%rax) |
| ; SSE-NEXT: movq %r11, 56(%rax) |
| ; SSE-NEXT: retq |
| ; |
| ; AVX2-LABEL: test_sub_i512_reg_reg: |
| ; AVX2: # %bb.0: |
| ; AVX2-NEXT: subq {{[0-9]+}}(%rsp), %rsi |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %rdx |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %rcx |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %r8 |
| ; AVX2-NEXT: movq %rdi, %rax |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %r9 |
| ; AVX2-NEXT: movq {{[0-9]+}}(%rsp), %rdi |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %rdi |
| ; AVX2-NEXT: movq {{[0-9]+}}(%rsp), %r10 |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %r10 |
| ; AVX2-NEXT: movq {{[0-9]+}}(%rsp), %r11 |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %r11 |
| ; AVX2-NEXT: movq %rcx, 16(%rax) |
| ; AVX2-NEXT: movq %rdx, 8(%rax) |
| ; AVX2-NEXT: movq %rsi, (%rax) |
| ; AVX2-NEXT: movq %r8, 24(%rax) |
| ; AVX2-NEXT: movq %r9, 32(%rax) |
| ; AVX2-NEXT: movq %rdi, 40(%rax) |
| ; AVX2-NEXT: movq %r10, 48(%rax) |
| ; AVX2-NEXT: movq %r11, 56(%rax) |
| ; AVX2-NEXT: retq |
| ; |
| ; AVX512F-LABEL: test_sub_i512_reg_reg: |
| ; AVX512F: # %bb.0: |
| ; AVX512F-NEXT: subq {{[0-9]+}}(%rsp), %rsi |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %rdx |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %rcx |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %r8 |
| ; AVX512F-NEXT: movq %rdi, %rax |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %r9 |
| ; AVX512F-NEXT: movq {{[0-9]+}}(%rsp), %rdi |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %rdi |
| ; AVX512F-NEXT: movq {{[0-9]+}}(%rsp), %r10 |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %r10 |
| ; AVX512F-NEXT: movq {{[0-9]+}}(%rsp), %r11 |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %r11 |
| ; AVX512F-NEXT: movq %rcx, 16(%rax) |
| ; AVX512F-NEXT: movq %rdx, 8(%rax) |
| ; AVX512F-NEXT: movq %rsi, (%rax) |
| ; AVX512F-NEXT: movq %r8, 24(%rax) |
| ; AVX512F-NEXT: movq %r9, 32(%rax) |
| ; AVX512F-NEXT: movq %rdi, 40(%rax) |
| ; AVX512F-NEXT: movq %r10, 48(%rax) |
| ; AVX512F-NEXT: movq %r11, 56(%rax) |
| ; AVX512F-NEXT: retq |
| ; |
| ; AVX512VL-LABEL: test_sub_i512_reg_reg: |
| ; AVX512VL: # %bb.0: |
| ; AVX512VL-NEXT: movq %rdi, %rax |
| ; AVX512VL-NEXT: movq {{[0-9]+}}(%rsp), %rdi |
| ; AVX512VL-NEXT: movq {{[0-9]+}}(%rsp), %r10 |
| ; AVX512VL-NEXT: movq {{[0-9]+}}(%rsp), %r11 |
| ; AVX512VL-NEXT: subq {{[0-9]+}}(%rsp), %rsi |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %rdx |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %rcx |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %r8 |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %r9 |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %r11 |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %rdi |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %r10 |
| ; AVX512VL-NEXT: movq %rcx, 16(%rax) |
| ; AVX512VL-NEXT: movq %rdx, 8(%rax) |
| ; AVX512VL-NEXT: movq %rsi, (%rax) |
| ; AVX512VL-NEXT: movq %r8, 24(%rax) |
| ; AVX512VL-NEXT: movq %r9, 32(%rax) |
| ; AVX512VL-NEXT: movq %r11, 40(%rax) |
| ; AVX512VL-NEXT: movq %rdi, 48(%rax) |
| ; AVX512VL-NEXT: movq %r10, 56(%rax) |
| ; AVX512VL-NEXT: retq |
| %r = sub i512 %a0, %a1 |
| ret i512 %r |
| } |
| |
| define i512 @test_sub_i512_reg_mem(i512 %a0, ptr %p1) nounwind { |
| ; SSE-LABEL: test_sub_i512_reg_mem: |
| ; SSE: # %bb.0: |
| ; SSE-NEXT: pushq %rbx |
| ; SSE-NEXT: movq {{[0-9]+}}(%rsp), %r10 |
| ; SSE-NEXT: subq (%r10), %rsi |
| ; SSE-NEXT: sbbq 8(%r10), %rdx |
| ; SSE-NEXT: sbbq 16(%r10), %rcx |
| ; SSE-NEXT: movq %rdi, %rax |
| ; SSE-NEXT: sbbq 24(%r10), %r8 |
| ; SSE-NEXT: movq {{[0-9]+}}(%rsp), %rdi |
| ; SSE-NEXT: sbbq 32(%r10), %r9 |
| ; SSE-NEXT: movq {{[0-9]+}}(%rsp), %r11 |
| ; SSE-NEXT: sbbq 40(%r10), %r11 |
| ; SSE-NEXT: movq {{[0-9]+}}(%rsp), %rbx |
| ; SSE-NEXT: sbbq 48(%r10), %rdi |
| ; SSE-NEXT: sbbq 56(%r10), %rbx |
| ; SSE-NEXT: movq %rsi, (%rax) |
| ; SSE-NEXT: movq %rdx, 8(%rax) |
| ; SSE-NEXT: movq %rcx, 16(%rax) |
| ; SSE-NEXT: movq %r8, 24(%rax) |
| ; SSE-NEXT: movq %r9, 32(%rax) |
| ; SSE-NEXT: movq %r11, 40(%rax) |
| ; SSE-NEXT: movq %rdi, 48(%rax) |
| ; SSE-NEXT: movq %rbx, 56(%rax) |
| ; SSE-NEXT: popq %rbx |
| ; SSE-NEXT: retq |
| ; |
| ; AVX2-LABEL: test_sub_i512_reg_mem: |
| ; AVX2: # %bb.0: |
| ; AVX2-NEXT: pushq %rbx |
| ; AVX2-NEXT: movq {{[0-9]+}}(%rsp), %r10 |
| ; AVX2-NEXT: subq (%r10), %rsi |
| ; AVX2-NEXT: sbbq 8(%r10), %rdx |
| ; AVX2-NEXT: sbbq 16(%r10), %rcx |
| ; AVX2-NEXT: sbbq 24(%r10), %r8 |
| ; AVX2-NEXT: movq %rdi, %rax |
| ; AVX2-NEXT: sbbq 32(%r10), %r9 |
| ; AVX2-NEXT: movq {{[0-9]+}}(%rsp), %rdi |
| ; AVX2-NEXT: sbbq 40(%r10), %rdi |
| ; AVX2-NEXT: movq {{[0-9]+}}(%rsp), %r11 |
| ; AVX2-NEXT: sbbq 48(%r10), %r11 |
| ; AVX2-NEXT: movq {{[0-9]+}}(%rsp), %rbx |
| ; AVX2-NEXT: sbbq 56(%r10), %rbx |
| ; AVX2-NEXT: movq %rsi, (%rax) |
| ; AVX2-NEXT: movq %rdx, 8(%rax) |
| ; AVX2-NEXT: movq %rcx, 16(%rax) |
| ; AVX2-NEXT: movq %r8, 24(%rax) |
| ; AVX2-NEXT: movq %r9, 32(%rax) |
| ; AVX2-NEXT: movq %rdi, 40(%rax) |
| ; AVX2-NEXT: movq %r11, 48(%rax) |
| ; AVX2-NEXT: movq %rbx, 56(%rax) |
| ; AVX2-NEXT: popq %rbx |
| ; AVX2-NEXT: retq |
| ; |
| ; AVX512F-LABEL: test_sub_i512_reg_mem: |
| ; AVX512F: # %bb.0: |
| ; AVX512F-NEXT: pushq %rbx |
| ; AVX512F-NEXT: movq {{[0-9]+}}(%rsp), %r10 |
| ; AVX512F-NEXT: subq (%r10), %rsi |
| ; AVX512F-NEXT: sbbq 8(%r10), %rdx |
| ; AVX512F-NEXT: sbbq 16(%r10), %rcx |
| ; AVX512F-NEXT: sbbq 24(%r10), %r8 |
| ; AVX512F-NEXT: movq %rdi, %rax |
| ; AVX512F-NEXT: sbbq 32(%r10), %r9 |
| ; AVX512F-NEXT: movq {{[0-9]+}}(%rsp), %rdi |
| ; AVX512F-NEXT: sbbq 40(%r10), %rdi |
| ; AVX512F-NEXT: movq {{[0-9]+}}(%rsp), %r11 |
| ; AVX512F-NEXT: sbbq 48(%r10), %r11 |
| ; AVX512F-NEXT: movq {{[0-9]+}}(%rsp), %rbx |
| ; AVX512F-NEXT: sbbq 56(%r10), %rbx |
| ; AVX512F-NEXT: movq %rsi, (%rax) |
| ; AVX512F-NEXT: movq %rdx, 8(%rax) |
| ; AVX512F-NEXT: movq %rcx, 16(%rax) |
| ; AVX512F-NEXT: movq %r8, 24(%rax) |
| ; AVX512F-NEXT: movq %r9, 32(%rax) |
| ; AVX512F-NEXT: movq %rdi, 40(%rax) |
| ; AVX512F-NEXT: movq %r11, 48(%rax) |
| ; AVX512F-NEXT: movq %rbx, 56(%rax) |
| ; AVX512F-NEXT: popq %rbx |
| ; AVX512F-NEXT: retq |
| ; |
| ; AVX512VL-LABEL: test_sub_i512_reg_mem: |
| ; AVX512VL: # %bb.0: |
| ; AVX512VL-NEXT: pushq %rbx |
| ; AVX512VL-NEXT: movq %rdi, %rax |
| ; AVX512VL-NEXT: movq {{[0-9]+}}(%rsp), %rdi |
| ; AVX512VL-NEXT: movq {{[0-9]+}}(%rsp), %r10 |
| ; AVX512VL-NEXT: movq {{[0-9]+}}(%rsp), %r11 |
| ; AVX512VL-NEXT: movq {{[0-9]+}}(%rsp), %rbx |
| ; AVX512VL-NEXT: subq (%rbx), %rsi |
| ; AVX512VL-NEXT: sbbq 8(%rbx), %rdx |
| ; AVX512VL-NEXT: sbbq 16(%rbx), %rcx |
| ; AVX512VL-NEXT: sbbq 24(%rbx), %r8 |
| ; AVX512VL-NEXT: sbbq 32(%rbx), %r9 |
| ; AVX512VL-NEXT: sbbq 40(%rbx), %r11 |
| ; AVX512VL-NEXT: sbbq 48(%rbx), %rdi |
| ; AVX512VL-NEXT: sbbq 56(%rbx), %r10 |
| ; AVX512VL-NEXT: movq %rsi, (%rax) |
| ; AVX512VL-NEXT: movq %rdx, 8(%rax) |
| ; AVX512VL-NEXT: movq %rcx, 16(%rax) |
| ; AVX512VL-NEXT: movq %r8, 24(%rax) |
| ; AVX512VL-NEXT: movq %r9, 32(%rax) |
| ; AVX512VL-NEXT: movq %r11, 40(%rax) |
| ; AVX512VL-NEXT: movq %rdi, 48(%rax) |
| ; AVX512VL-NEXT: movq %r10, 56(%rax) |
| ; AVX512VL-NEXT: popq %rbx |
| ; AVX512VL-NEXT: retq |
| %a1 = load i512, ptr %p1 |
| %r = sub i512 %a0, %a1 |
| ret i512 %r |
| } |
| |
| define i512 @test_sub_i512_mem_reg(ptr %p0, i512 %a1) nounwind { |
| ; SSE-LABEL: test_sub_i512_mem_reg: |
| ; SSE: # %bb.0: |
| ; SSE-NEXT: pushq %r14 |
| ; SSE-NEXT: pushq %rbx |
| ; SSE-NEXT: movq %rdi, %rax |
| ; SSE-NEXT: movq 56(%rsi), %rdi |
| ; SSE-NEXT: movq 24(%rsi), %r10 |
| ; SSE-NEXT: movq 16(%rsi), %r11 |
| ; SSE-NEXT: movq (%rsi), %rbx |
| ; SSE-NEXT: movq 8(%rsi), %r14 |
| ; SSE-NEXT: subq %rdx, %rbx |
| ; SSE-NEXT: sbbq %rcx, %r14 |
| ; SSE-NEXT: sbbq %r8, %r11 |
| ; SSE-NEXT: sbbq %r9, %r10 |
| ; SSE-NEXT: movq 32(%rsi), %rcx |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %rcx |
| ; SSE-NEXT: movq 40(%rsi), %rdx |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %rdx |
| ; SSE-NEXT: movq 48(%rsi), %rsi |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %rsi |
| ; SSE-NEXT: sbbq {{[0-9]+}}(%rsp), %rdi |
| ; SSE-NEXT: movq %rbx, (%rax) |
| ; SSE-NEXT: movq %r14, 8(%rax) |
| ; SSE-NEXT: movq %r11, 16(%rax) |
| ; SSE-NEXT: movq %r10, 24(%rax) |
| ; SSE-NEXT: movq %rcx, 32(%rax) |
| ; SSE-NEXT: movq %rdx, 40(%rax) |
| ; SSE-NEXT: movq %rsi, 48(%rax) |
| ; SSE-NEXT: movq %rdi, 56(%rax) |
| ; SSE-NEXT: popq %rbx |
| ; SSE-NEXT: popq %r14 |
| ; SSE-NEXT: retq |
| ; |
| ; AVX2-LABEL: test_sub_i512_mem_reg: |
| ; AVX2: # %bb.0: |
| ; AVX2-NEXT: pushq %rbx |
| ; AVX2-NEXT: movq %rdi, %rax |
| ; AVX2-NEXT: movq 24(%rsi), %rdi |
| ; AVX2-NEXT: movq 16(%rsi), %r10 |
| ; AVX2-NEXT: movq (%rsi), %r11 |
| ; AVX2-NEXT: movq 8(%rsi), %rbx |
| ; AVX2-NEXT: subq %rdx, %r11 |
| ; AVX2-NEXT: sbbq %rcx, %rbx |
| ; AVX2-NEXT: sbbq %r8, %r10 |
| ; AVX2-NEXT: sbbq %r9, %rdi |
| ; AVX2-NEXT: movq 32(%rsi), %rcx |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %rcx |
| ; AVX2-NEXT: movq 40(%rsi), %rdx |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %rdx |
| ; AVX2-NEXT: movq 48(%rsi), %r8 |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %r8 |
| ; AVX2-NEXT: movq 56(%rsi), %rsi |
| ; AVX2-NEXT: sbbq {{[0-9]+}}(%rsp), %rsi |
| ; AVX2-NEXT: movq %r11, (%rax) |
| ; AVX2-NEXT: movq %rbx, 8(%rax) |
| ; AVX2-NEXT: movq %r10, 16(%rax) |
| ; AVX2-NEXT: movq %rdi, 24(%rax) |
| ; AVX2-NEXT: movq %rcx, 32(%rax) |
| ; AVX2-NEXT: movq %rdx, 40(%rax) |
| ; AVX2-NEXT: movq %r8, 48(%rax) |
| ; AVX2-NEXT: movq %rsi, 56(%rax) |
| ; AVX2-NEXT: popq %rbx |
| ; AVX2-NEXT: retq |
| ; |
| ; AVX512F-LABEL: test_sub_i512_mem_reg: |
| ; AVX512F: # %bb.0: |
| ; AVX512F-NEXT: pushq %rbx |
| ; AVX512F-NEXT: movq %rdi, %rax |
| ; AVX512F-NEXT: movq 24(%rsi), %rdi |
| ; AVX512F-NEXT: movq 16(%rsi), %r10 |
| ; AVX512F-NEXT: movq (%rsi), %r11 |
| ; AVX512F-NEXT: movq 8(%rsi), %rbx |
| ; AVX512F-NEXT: subq %rdx, %r11 |
| ; AVX512F-NEXT: sbbq %rcx, %rbx |
| ; AVX512F-NEXT: sbbq %r8, %r10 |
| ; AVX512F-NEXT: sbbq %r9, %rdi |
| ; AVX512F-NEXT: movq 32(%rsi), %rcx |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %rcx |
| ; AVX512F-NEXT: movq 40(%rsi), %rdx |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %rdx |
| ; AVX512F-NEXT: movq 48(%rsi), %r8 |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %r8 |
| ; AVX512F-NEXT: movq 56(%rsi), %rsi |
| ; AVX512F-NEXT: sbbq {{[0-9]+}}(%rsp), %rsi |
| ; AVX512F-NEXT: movq %r11, (%rax) |
| ; AVX512F-NEXT: movq %rbx, 8(%rax) |
| ; AVX512F-NEXT: movq %r10, 16(%rax) |
| ; AVX512F-NEXT: movq %rdi, 24(%rax) |
| ; AVX512F-NEXT: movq %rcx, 32(%rax) |
| ; AVX512F-NEXT: movq %rdx, 40(%rax) |
| ; AVX512F-NEXT: movq %r8, 48(%rax) |
| ; AVX512F-NEXT: movq %rsi, 56(%rax) |
| ; AVX512F-NEXT: popq %rbx |
| ; AVX512F-NEXT: retq |
| ; |
| ; AVX512VL-LABEL: test_sub_i512_mem_reg: |
| ; AVX512VL: # %bb.0: |
| ; AVX512VL-NEXT: pushq %r15 |
| ; AVX512VL-NEXT: pushq %r14 |
| ; AVX512VL-NEXT: pushq %r12 |
| ; AVX512VL-NEXT: pushq %rbx |
| ; AVX512VL-NEXT: movq %rdi, %rax |
| ; AVX512VL-NEXT: movq 56(%rsi), %rdi |
| ; AVX512VL-NEXT: movq 48(%rsi), %r10 |
| ; AVX512VL-NEXT: movq 40(%rsi), %r11 |
| ; AVX512VL-NEXT: movq 32(%rsi), %rbx |
| ; AVX512VL-NEXT: movq 24(%rsi), %r14 |
| ; AVX512VL-NEXT: movq 16(%rsi), %r15 |
| ; AVX512VL-NEXT: movq (%rsi), %r12 |
| ; AVX512VL-NEXT: movq 8(%rsi), %rsi |
| ; AVX512VL-NEXT: subq %rdx, %r12 |
| ; AVX512VL-NEXT: sbbq %rcx, %rsi |
| ; AVX512VL-NEXT: sbbq %r8, %r15 |
| ; AVX512VL-NEXT: sbbq %r9, %r14 |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %rbx |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %r11 |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %r10 |
| ; AVX512VL-NEXT: sbbq {{[0-9]+}}(%rsp), %rdi |
| ; AVX512VL-NEXT: movq %r12, (%rax) |
| ; AVX512VL-NEXT: movq %rsi, 8(%rax) |
| ; AVX512VL-NEXT: movq %r15, 16(%rax) |
| ; AVX512VL-NEXT: movq %r14, 24(%rax) |
| ; AVX512VL-NEXT: movq %rbx, 32(%rax) |
| ; AVX512VL-NEXT: movq %r11, 40(%rax) |
| ; AVX512VL-NEXT: movq %r10, 48(%rax) |
| ; AVX512VL-NEXT: movq %rdi, 56(%rax) |
| ; AVX512VL-NEXT: popq %rbx |
| ; AVX512VL-NEXT: popq %r12 |
| ; AVX512VL-NEXT: popq %r14 |
| ; AVX512VL-NEXT: popq %r15 |
| ; AVX512VL-NEXT: retq |
| %a0 = load i512, ptr %p0 |
| %r = sub i512 %a0, %a1 |
| ret i512 %r |
| } |
| |
| define i512 @test_dec_i512_mem(ptr %p0) nounwind { |
| ; SSE-LABEL: test_dec_i512_mem: |
| ; SSE: # %bb.0: |
| ; SSE-NEXT: movq %rdi, %rax |
| ; SSE-NEXT: movq 48(%rsi), %rcx |
| ; SSE-NEXT: movq 40(%rsi), %rdx |
| ; SSE-NEXT: movq 32(%rsi), %rdi |
| ; SSE-NEXT: movq 24(%rsi), %r8 |
| ; SSE-NEXT: movq 16(%rsi), %r9 |
| ; SSE-NEXT: movq (%rsi), %r10 |
| ; SSE-NEXT: movq 8(%rsi), %r11 |
| ; SSE-NEXT: addq $-1, %r10 |
| ; SSE-NEXT: adcq $-1, %r11 |
| ; SSE-NEXT: adcq $-1, %r9 |
| ; SSE-NEXT: adcq $-1, %r8 |
| ; SSE-NEXT: adcq $-1, %rdi |
| ; SSE-NEXT: adcq $-1, %rdx |
| ; SSE-NEXT: adcq $-1, %rcx |
| ; SSE-NEXT: movq 56(%rsi), %rsi |
| ; SSE-NEXT: adcq $-1, %rsi |
| ; SSE-NEXT: movq %r10, (%rax) |
| ; SSE-NEXT: movq %r11, 8(%rax) |
| ; SSE-NEXT: movq %r9, 16(%rax) |
| ; SSE-NEXT: movq %r8, 24(%rax) |
| ; SSE-NEXT: movq %rdi, 32(%rax) |
| ; SSE-NEXT: movq %rdx, 40(%rax) |
| ; SSE-NEXT: movq %rcx, 48(%rax) |
| ; SSE-NEXT: movq %rsi, 56(%rax) |
| ; SSE-NEXT: retq |
| ; |
| ; AVX2-LABEL: test_dec_i512_mem: |
| ; AVX2: # %bb.0: |
| ; AVX2-NEXT: movq %rdi, %rax |
| ; AVX2-NEXT: movq 56(%rsi), %rcx |
| ; AVX2-NEXT: movq 48(%rsi), %rdx |
| ; AVX2-NEXT: movq 40(%rsi), %rdi |
| ; AVX2-NEXT: movq 32(%rsi), %r8 |
| ; AVX2-NEXT: movq 24(%rsi), %r9 |
| ; AVX2-NEXT: movq 16(%rsi), %r10 |
| ; AVX2-NEXT: movq (%rsi), %r11 |
| ; AVX2-NEXT: movq 8(%rsi), %rsi |
| ; AVX2-NEXT: addq $-1, %r11 |
| ; AVX2-NEXT: adcq $-1, %rsi |
| ; AVX2-NEXT: adcq $-1, %r10 |
| ; AVX2-NEXT: adcq $-1, %r9 |
| ; AVX2-NEXT: adcq $-1, %r8 |
| ; AVX2-NEXT: adcq $-1, %rdi |
| ; AVX2-NEXT: adcq $-1, %rdx |
| ; AVX2-NEXT: adcq $-1, %rcx |
| ; AVX2-NEXT: movq %r11, (%rax) |
| ; AVX2-NEXT: movq %rsi, 8(%rax) |
| ; AVX2-NEXT: movq %r10, 16(%rax) |
| ; AVX2-NEXT: movq %r9, 24(%rax) |
| ; AVX2-NEXT: movq %r8, 32(%rax) |
| ; AVX2-NEXT: movq %rdi, 40(%rax) |
| ; AVX2-NEXT: movq %rdx, 48(%rax) |
| ; AVX2-NEXT: movq %rcx, 56(%rax) |
| ; AVX2-NEXT: retq |
| ; |
| ; AVX512-LABEL: test_dec_i512_mem: |
| ; AVX512: # %bb.0: |
| ; AVX512-NEXT: movq %rdi, %rax |
| ; AVX512-NEXT: movq 56(%rsi), %rcx |
| ; AVX512-NEXT: movq 48(%rsi), %rdx |
| ; AVX512-NEXT: movq 40(%rsi), %rdi |
| ; AVX512-NEXT: movq 32(%rsi), %r8 |
| ; AVX512-NEXT: movq 24(%rsi), %r9 |
| ; AVX512-NEXT: movq 16(%rsi), %r10 |
| ; AVX512-NEXT: movq (%rsi), %r11 |
| ; AVX512-NEXT: movq 8(%rsi), %rsi |
| ; AVX512-NEXT: addq $-1, %r11 |
| ; AVX512-NEXT: adcq $-1, %rsi |
| ; AVX512-NEXT: adcq $-1, %r10 |
| ; AVX512-NEXT: adcq $-1, %r9 |
| ; AVX512-NEXT: adcq $-1, %r8 |
| ; AVX512-NEXT: adcq $-1, %rdi |
| ; AVX512-NEXT: adcq $-1, %rdx |
| ; AVX512-NEXT: adcq $-1, %rcx |
| ; AVX512-NEXT: movq %r11, (%rax) |
| ; AVX512-NEXT: movq %rsi, 8(%rax) |
| ; AVX512-NEXT: movq %r10, 16(%rax) |
| ; AVX512-NEXT: movq %r9, 24(%rax) |
| ; AVX512-NEXT: movq %r8, 32(%rax) |
| ; AVX512-NEXT: movq %rdi, 40(%rax) |
| ; AVX512-NEXT: movq %rdx, 48(%rax) |
| ; AVX512-NEXT: movq %rcx, 56(%rax) |
| ; AVX512-NEXT: retq |
| %a0 = load i512, ptr %p0 |
| %r = sub i512 %a0, 1 |
| ret i512 %r |
| } |
| |
| define void @test_dec_i512_rmw(ptr %p0) nounwind { |
| ; CHECK-LABEL: test_dec_i512_rmw: |
| ; CHECK: # %bb.0: |
| ; CHECK-NEXT: addq $-1, (%rdi) |
| ; CHECK-NEXT: adcq $-1, 8(%rdi) |
| ; CHECK-NEXT: adcq $-1, 16(%rdi) |
| ; CHECK-NEXT: adcq $-1, 24(%rdi) |
| ; CHECK-NEXT: adcq $-1, 32(%rdi) |
| ; CHECK-NEXT: adcq $-1, 40(%rdi) |
| ; CHECK-NEXT: adcq $-1, 48(%rdi) |
| ; CHECK-NEXT: adcq $-1, 56(%rdi) |
| ; CHECK-NEXT: retq |
| ; |
| ; AVX512-LABEL: test_dec_i512_rmw: |
| ; AVX512: # %bb.0: |
| ; AVX512-NEXT: addq $-1, (%rdi) |
| ; AVX512-NEXT: adcq $-1, 8(%rdi) |
| ; AVX512-NEXT: adcq $-1, 16(%rdi) |
| ; AVX512-NEXT: adcq $-1, 24(%rdi) |
| ; AVX512-NEXT: adcq $-1, 32(%rdi) |
| ; AVX512-NEXT: adcq $-1, 40(%rdi) |
| ; AVX512-NEXT: adcq $-1, 48(%rdi) |
| ; AVX512-NEXT: adcq $-1, 56(%rdi) |
| ; AVX512-NEXT: retq |
| %a0 = load i512, ptr %p0 |
| %r = sub i512 %a0, 1 |
| store i512 %r, ptr %p0 |
| ret void |
| } |