|  | ; Test the saving and restoring of GPRs in large frames. | 
|  | ; | 
|  | ; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s | 
|  |  | 
|  | ; This is the largest frame size that can use a plain LMG for %r6 and above. | 
|  | ; It is big enough to require two emergency spill slots at 160(%r15), | 
|  | ; so get a frame of size 524232 by allocating (524232 - 176) / 8 = 65507 | 
|  | ; extra doublewords. | 
|  | define void @f1(ptr %ptr, i64 %x) { | 
|  | ; CHECK-LABEL: f1: | 
|  | ; CHECK: stmg %r6, %r15, 48(%r15) | 
|  | ; CHECK: .cfi_offset %r6, -112 | 
|  | ; CHECK: .cfi_offset %r7, -104 | 
|  | ; CHECK: .cfi_offset %r8, -96 | 
|  | ; CHECK: .cfi_offset %r9, -88 | 
|  | ; CHECK: .cfi_offset %r10, -80 | 
|  | ; CHECK: .cfi_offset %r11, -72 | 
|  | ; CHECK: .cfi_offset %r12, -64 | 
|  | ; CHECK: .cfi_offset %r13, -56 | 
|  | ; CHECK: .cfi_offset %r14, -48 | 
|  | ; CHECK: .cfi_offset %r15, -40 | 
|  | ; CHECK: agfi %r15, -524232 | 
|  | ; CHECK: .cfi_def_cfa_offset 524392 | 
|  | ; ...main function body... | 
|  | ; CHECK-NOT: ag | 
|  | ; CHECK: lmg %r6, %r15, 524280(%r15) | 
|  | ; CHECK: br %r14 | 
|  | %l0 = load volatile i32, ptr %ptr | 
|  | %l1 = load volatile i32, ptr %ptr | 
|  | %l4 = load volatile i32, ptr %ptr | 
|  | %l5 = load volatile i32, ptr %ptr | 
|  | %l6 = load volatile i32, ptr %ptr | 
|  | %l7 = load volatile i32, ptr %ptr | 
|  | %l8 = load volatile i32, ptr %ptr | 
|  | %l9 = load volatile i32, ptr %ptr | 
|  | %l10 = load volatile i32, ptr %ptr | 
|  | %l11 = load volatile i32, ptr %ptr | 
|  | %l12 = load volatile i32, ptr %ptr | 
|  | %l13 = load volatile i32, ptr %ptr | 
|  | %l14 = load volatile i32, ptr %ptr | 
|  | %add0 = add i32 %l0, %l0 | 
|  | %add1 = add i32 %l1, %add0 | 
|  | %add4 = add i32 %l4, %add1 | 
|  | %add5 = add i32 %l5, %add4 | 
|  | %add6 = add i32 %l6, %add5 | 
|  | %add7 = add i32 %l7, %add6 | 
|  | %add8 = add i32 %l8, %add7 | 
|  | %add9 = add i32 %l9, %add8 | 
|  | %add10 = add i32 %l10, %add9 | 
|  | %add11 = add i32 %l11, %add10 | 
|  | %add12 = add i32 %l12, %add11 | 
|  | %add13 = add i32 %l13, %add12 | 
|  | %add14 = add i32 %l14, %add13 | 
|  | store volatile i32 %add0, ptr %ptr | 
|  | store volatile i32 %add1, ptr %ptr | 
|  | store volatile i32 %add4, ptr %ptr | 
|  | store volatile i32 %add5, ptr %ptr | 
|  | store volatile i32 %add6, ptr %ptr | 
|  | store volatile i32 %add7, ptr %ptr | 
|  | store volatile i32 %add8, ptr %ptr | 
|  | store volatile i32 %add9, ptr %ptr | 
|  | store volatile i32 %add10, ptr %ptr | 
|  | store volatile i32 %add11, ptr %ptr | 
|  | store volatile i32 %add12, ptr %ptr | 
|  | store volatile i32 %add13, ptr %ptr | 
|  | store volatile i32 %add14, ptr %ptr | 
|  | %y = alloca [65507 x i64], align 8 | 
|  | store volatile i64 %x, ptr %y | 
|  | ret void | 
|  | } | 
|  |  | 
|  | ; This is the largest frame size that can use a plain LMG for %r14 and above | 
|  | ; It is big enough to require two emergency spill slots at 160(%r15), | 
|  | ; so get a frame of size 524168 by allocating (524168 - 176) / 8 = 65499 | 
|  | ; extra doublewords. | 
|  | define void @f2(ptr %ptr, i64 %x) { | 
|  | ; CHECK-LABEL: f2: | 
|  | ; CHECK: stmg %r14, %r15, 112(%r15) | 
|  | ; CHECK: .cfi_offset %r14, -48 | 
|  | ; CHECK: .cfi_offset %r15, -40 | 
|  | ; CHECK: agfi %r15, -524168 | 
|  | ; CHECK: .cfi_def_cfa_offset 524328 | 
|  | ; ...main function body... | 
|  | ; CHECK-NOT: ag | 
|  | ; CHECK: lmg %r14, %r15, 524280(%r15) | 
|  | ; CHECK: br %r14 | 
|  | %l0 = load volatile i32, ptr %ptr | 
|  | %l1 = load volatile i32, ptr %ptr | 
|  | %l4 = load volatile i32, ptr %ptr | 
|  | %l5 = load volatile i32, ptr %ptr | 
|  | %l14 = load volatile i32, ptr %ptr | 
|  | %add0 = add i32 %l0, %l0 | 
|  | %add1 = add i32 %l1, %add0 | 
|  | %add4 = add i32 %l4, %add1 | 
|  | %add5 = add i32 %l5, %add4 | 
|  | %add14 = add i32 %l14, %add5 | 
|  | store volatile i32 %add0, ptr %ptr | 
|  | store volatile i32 %add1, ptr %ptr | 
|  | store volatile i32 %add4, ptr %ptr | 
|  | store volatile i32 %add5, ptr %ptr | 
|  | store volatile i32 %add14, ptr %ptr | 
|  | %y = alloca [65499 x i64], align 8 | 
|  | store volatile i64 %x, ptr %y | 
|  | ret void | 
|  | } | 
|  |  | 
|  | ; Like f1 but with a frame that is 8 bytes bigger.  This is the smallest | 
|  | ; frame size that needs two instructions to perform the final LMG for | 
|  | ; %r6 and above. | 
|  | define void @f3(ptr %ptr, i64 %x) { | 
|  | ; CHECK-LABEL: f3: | 
|  | ; CHECK: stmg %r6, %r15, 48(%r15) | 
|  | ; CHECK: .cfi_offset %r6, -112 | 
|  | ; CHECK: .cfi_offset %r7, -104 | 
|  | ; CHECK: .cfi_offset %r8, -96 | 
|  | ; CHECK: .cfi_offset %r9, -88 | 
|  | ; CHECK: .cfi_offset %r10, -80 | 
|  | ; CHECK: .cfi_offset %r11, -72 | 
|  | ; CHECK: .cfi_offset %r12, -64 | 
|  | ; CHECK: .cfi_offset %r13, -56 | 
|  | ; CHECK: .cfi_offset %r14, -48 | 
|  | ; CHECK: .cfi_offset %r15, -40 | 
|  | ; CHECK: agfi %r15, -524240 | 
|  | ; CHECK: .cfi_def_cfa_offset 524400 | 
|  | ; ...main function body... | 
|  | ; CHECK: aghi %r15, 8 | 
|  | ; CHECK: lmg %r6, %r15, 524280(%r15) | 
|  | ; CHECK: br %r14 | 
|  | %l0 = load volatile i32, ptr %ptr | 
|  | %l1 = load volatile i32, ptr %ptr | 
|  | %l4 = load volatile i32, ptr %ptr | 
|  | %l5 = load volatile i32, ptr %ptr | 
|  | %l6 = load volatile i32, ptr %ptr | 
|  | %l7 = load volatile i32, ptr %ptr | 
|  | %l8 = load volatile i32, ptr %ptr | 
|  | %l9 = load volatile i32, ptr %ptr | 
|  | %l10 = load volatile i32, ptr %ptr | 
|  | %l11 = load volatile i32, ptr %ptr | 
|  | %l12 = load volatile i32, ptr %ptr | 
|  | %l13 = load volatile i32, ptr %ptr | 
|  | %l14 = load volatile i32, ptr %ptr | 
|  | %add0 = add i32 %l0, %l0 | 
|  | %add1 = add i32 %l1, %add0 | 
|  | %add4 = add i32 %l4, %add1 | 
|  | %add5 = add i32 %l5, %add4 | 
|  | %add6 = add i32 %l6, %add5 | 
|  | %add7 = add i32 %l7, %add6 | 
|  | %add8 = add i32 %l8, %add7 | 
|  | %add9 = add i32 %l9, %add8 | 
|  | %add10 = add i32 %l10, %add9 | 
|  | %add11 = add i32 %l11, %add10 | 
|  | %add12 = add i32 %l12, %add11 | 
|  | %add13 = add i32 %l13, %add12 | 
|  | %add14 = add i32 %l14, %add13 | 
|  | store volatile i32 %add0, ptr %ptr | 
|  | store volatile i32 %add1, ptr %ptr | 
|  | store volatile i32 %add4, ptr %ptr | 
|  | store volatile i32 %add5, ptr %ptr | 
|  | store volatile i32 %add6, ptr %ptr | 
|  | store volatile i32 %add7, ptr %ptr | 
|  | store volatile i32 %add8, ptr %ptr | 
|  | store volatile i32 %add9, ptr %ptr | 
|  | store volatile i32 %add10, ptr %ptr | 
|  | store volatile i32 %add11, ptr %ptr | 
|  | store volatile i32 %add12, ptr %ptr | 
|  | store volatile i32 %add13, ptr %ptr | 
|  | store volatile i32 %add14, ptr %ptr | 
|  | %y = alloca [65508 x i64], align 8 | 
|  | store volatile i64 %x, ptr %y | 
|  | ret void | 
|  | } | 
|  |  | 
|  | ; Like f2 but with a frame that is 8 bytes bigger.  This is the smallest | 
|  | ; frame size that needs two instructions to perform the final LMG for | 
|  | ; %r14 and %r15. | 
|  | define void @f4(ptr %ptr, i64 %x) { | 
|  | ; CHECK-LABEL: f4: | 
|  | ; CHECK: stmg %r14, %r15, 112(%r15) | 
|  | ; CHECK: .cfi_offset %r14, -48 | 
|  | ; CHECK: .cfi_offset %r15, -40 | 
|  | ; CHECK: agfi %r15, -524176 | 
|  | ; CHECK: .cfi_def_cfa_offset 524336 | 
|  | ; ...main function body... | 
|  | ; CHECK: aghi %r15, 8 | 
|  | ; CHECK: lmg %r14, %r15, 524280(%r15) | 
|  | ; CHECK: br %r14 | 
|  | %l0 = load volatile i32, ptr %ptr | 
|  | %l1 = load volatile i32, ptr %ptr | 
|  | %l4 = load volatile i32, ptr %ptr | 
|  | %l5 = load volatile i32, ptr %ptr | 
|  | %l14 = load volatile i32, ptr %ptr | 
|  | %add0 = add i32 %l0, %l0 | 
|  | %add1 = add i32 %l1, %add0 | 
|  | %add4 = add i32 %l4, %add1 | 
|  | %add5 = add i32 %l5, %add4 | 
|  | %add14 = add i32 %l14, %add5 | 
|  | store volatile i32 %add0, ptr %ptr | 
|  | store volatile i32 %add1, ptr %ptr | 
|  | store volatile i32 %add4, ptr %ptr | 
|  | store volatile i32 %add5, ptr %ptr | 
|  | store volatile i32 %add14, ptr %ptr | 
|  | %y = alloca [65500 x i64], align 8 | 
|  | store volatile i64 %x, ptr %y | 
|  | ret void | 
|  | } | 
|  |  | 
|  | ; This is the largest frame size for which the preparatory increment for | 
|  | ; "lmg %r14, %r15, ..." can be done using AGHI. | 
|  | define void @f5(ptr %ptr, i64 %x) { | 
|  | ; CHECK-LABEL: f5: | 
|  | ; CHECK: stmg %r14, %r15, 112(%r15) | 
|  | ; CHECK: .cfi_offset %r14, -48 | 
|  | ; CHECK: .cfi_offset %r15, -40 | 
|  | ; CHECK: agfi %r15, -556928 | 
|  | ; CHECK: .cfi_def_cfa_offset 557088 | 
|  | ; ...main function body... | 
|  | ; CHECK: aghi %r15, 32760 | 
|  | ; CHECK: lmg %r14, %r15, 524280(%r15) | 
|  | ; CHECK: br %r14 | 
|  | %l0 = load volatile i32, ptr %ptr | 
|  | %l1 = load volatile i32, ptr %ptr | 
|  | %l4 = load volatile i32, ptr %ptr | 
|  | %l5 = load volatile i32, ptr %ptr | 
|  | %l14 = load volatile i32, ptr %ptr | 
|  | %add0 = add i32 %l0, %l0 | 
|  | %add1 = add i32 %l1, %add0 | 
|  | %add4 = add i32 %l4, %add1 | 
|  | %add5 = add i32 %l5, %add4 | 
|  | %add14 = add i32 %l14, %add5 | 
|  | store volatile i32 %add0, ptr %ptr | 
|  | store volatile i32 %add1, ptr %ptr | 
|  | store volatile i32 %add4, ptr %ptr | 
|  | store volatile i32 %add5, ptr %ptr | 
|  | store volatile i32 %add14, ptr %ptr | 
|  | %y = alloca [69594 x i64], align 8 | 
|  | store volatile i64 %x, ptr %y | 
|  | ret void | 
|  | } | 
|  |  | 
|  | ; This is the smallest frame size for which the preparatory increment for | 
|  | ; "lmg %r14, %r15, ..." needs to be done using AGFI. | 
|  | define void @f6(ptr %ptr, i64 %x) { | 
|  | ; CHECK-LABEL: f6: | 
|  | ; CHECK: stmg %r14, %r15, 112(%r15) | 
|  | ; CHECK: .cfi_offset %r14, -48 | 
|  | ; CHECK: .cfi_offset %r15, -40 | 
|  | ; CHECK: agfi %r15, -556936 | 
|  | ; CHECK: .cfi_def_cfa_offset 557096 | 
|  | ; ...main function body... | 
|  | ; CHECK: agfi %r15, 32768 | 
|  | ; CHECK: lmg %r14, %r15, 524280(%r15) | 
|  | ; CHECK: br %r14 | 
|  | %l0 = load volatile i32, ptr %ptr | 
|  | %l1 = load volatile i32, ptr %ptr | 
|  | %l4 = load volatile i32, ptr %ptr | 
|  | %l5 = load volatile i32, ptr %ptr | 
|  | %l14 = load volatile i32, ptr %ptr | 
|  | %add0 = add i32 %l0, %l0 | 
|  | %add1 = add i32 %l1, %add0 | 
|  | %add4 = add i32 %l4, %add1 | 
|  | %add5 = add i32 %l5, %add4 | 
|  | %add14 = add i32 %l14, %add5 | 
|  | store volatile i32 %add0, ptr %ptr | 
|  | store volatile i32 %add1, ptr %ptr | 
|  | store volatile i32 %add4, ptr %ptr | 
|  | store volatile i32 %add5, ptr %ptr | 
|  | store volatile i32 %add14, ptr %ptr | 
|  | %y = alloca [69595 x i64], align 8 | 
|  | store volatile i64 %x, ptr %y | 
|  | ret void | 
|  | } |