fix(0124): large stack arrays lower to in-place access, not first-class values

Two lowering sites materialized a local array as a whole LLVM value; the legalizer scalarizes each such op into one SelectionDAG node per element, and at ~64K elements the DAG combiner segfaults (DAGCombiner::visitMERGE_VALUES → ReplaceAllUsesWith). - lowerVarDecl: an array-typed `---` initializer emits NO store — the slot stays uninitialized instead of receiving a whole-array undef store. The tuple zero-init carve-out stays; non-array `---` keeps the undef store. The interp is unchanged either way (slots start .undef). - lowerIndexExpr: element reads on an array with addressable storage GEP the storage and load one element — the general-expression sibling of 0110's lowerFor fix — without value-lowering the object (a dead whole-array load would still reach the DAG). Storage-less arrays keep the index_get fallback. Sibling shape filed as 0125: any_to_string's per-array-type arms still pass the array by value, so a 64K+ array type + any {} print crashes. Regression: examples/0055-basic-large-stack-array.sx (sx build segfaulted pre-fix). 22 .ir snapshots re-pinned: removed undef stores and ig.tmp spills, in-place gep+load (instruction-shape-only churn, reviewed).
2026-06-12 08:19:20 +03:00
parent 7c7bb2076a
commit 837b5d375f
29 changed files with 848 additions and 1368 deletions
--- a/examples/expected/1009-errors-catch.ir
+++ b/examples/expected/1009-errors-catch.ir
@@ -758,13 +758,8 @@ entry:
  %allocaN = alloca [4 x i64], align 8
  %allocaN = alloca { ptr, i64 }, align 8
  %allocaN = alloca i64, align 8
-  %ig.tmp = alloca [4 x i64], align 8
  %allocaN = alloca i64, align 8
  %allocaN = alloca i64, align 8
-  %ig.tmp15 = alloca [4 x i64], align 8
-  %ig.tmp20 = alloca [4 x i64], align 8
-  %ig.tmp26 = alloca [4 x i64], align 8
-  %ig.tmp36 = alloca [4 x i64], align 8
  %allocaN = alloca i64, align 8
  store i64 %1, ptr %alloca, align 8
  %load = load i64, ptr %alloca, align 8
@@ -784,11 +779,9 @@ if.merge.87:                                      ; preds = %entry
  br label %while.hdr.96

 while.hdr.96:                                     ; preds = %while.exit.107, %if.merge.87
-  %loadN = load [4 x i64], ptr %allocaN, align 8
-  store [4 x i64] %loadN, ptr %ig.tmp, align 8
-  %ig.ptr = getelementptr [4 x i64], ptr %ig.tmp, i64 0, i64 0
-  %ig.val = load i64, ptr %ig.ptr, align 8
-  %icmpN = icmp ne i64 %ig.val, 0
+  %igp.ptr = getelementptr i64, ptr %allocaN, i64 0
+  %loadN = load i64, ptr %igp.ptr, align 8
+  %icmpN = icmp ne i64 %loadN, 0
  br i1 %icmpN, label %or.merge.100, label %or.rhs.99

 while.body.97:                                    ; preds = %or.merge.104
@@ -806,11 +799,9 @@ while.exit.98:                                    ; preds = %or.merge.104
  ret { ptr, i64 } %callN

 or.rhs.99:                                        ; preds = %while.hdr.96
-  %loadN = load [4 x i64], ptr %allocaN, align 8
-  store [4 x i64] %loadN, ptr %ig.tmp15, align 8
-  %ig.ptr16 = getelementptr [4 x i64], ptr %ig.tmp15, i64 0, i64 1
-  %ig.val17 = load i64, ptr %ig.ptr16, align 8
-  %icmpN = icmp ne i64 %ig.val17, 0
+  %igp.ptr14 = getelementptr i64, ptr %allocaN, i64 1
+  %loadN = load i64, ptr %igp.ptr14, align 8
+  %icmpN = icmp ne i64 %loadN, 0
  br label %or.merge.100

 or.merge.100:                                     ; preds = %or.rhs.99, %while.hdr.96
@@ -818,11 +809,9 @@ or.merge.100:                                     ; preds = %or.rhs.99, %while.h
  br i1 %bp, label %or.merge.102, label %or.rhs.101

 or.rhs.101:                                       ; preds = %or.merge.100
-  %loadN = load [4 x i64], ptr %allocaN, align 8
-  store [4 x i64] %loadN, ptr %ig.tmp20, align 8
-  %ig.ptr21 = getelementptr [4 x i64], ptr %ig.tmp20, i64 0, i64 2
-  %ig.val22 = load i64, ptr %ig.ptr21, align 8
-  %icmpN = icmp ne i64 %ig.val22, 0
+  %igp.ptr17 = getelementptr i64, ptr %allocaN, i64 2
+  %loadN = load i64, ptr %igp.ptr17, align 8
+  %icmpN = icmp ne i64 %loadN, 0
  br label %or.merge.102

 or.merge.102:                                     ; preds = %or.rhs.101, %or.merge.100
@@ -830,11 +819,9 @@ or.merge.102:                                     ; preds = %or.rhs.101, %or.mer
  br i1 %bpN, label %or.merge.104, label %or.rhs.103

 or.rhs.103:                                       ; preds = %or.merge.102
-  %loadN = load [4 x i64], ptr %allocaN, align 8
-  store [4 x i64] %loadN, ptr %ig.tmp26, align 8
-  %ig.ptr27 = getelementptr [4 x i64], ptr %ig.tmp26, i64 0, i64 3
-  %ig.val28 = load i64, ptr %ig.ptr27, align 8
-  %icmpN = icmp ne i64 %ig.val28, 0
+  %igp.ptr21 = getelementptr i64, ptr %allocaN, i64 3
+  %loadN = load i64, ptr %igp.ptr21, align 8
+  %icmpN = icmp ne i64 %loadN, 0
  br label %or.merge.104

 or.merge.104:                                     ; preds = %or.rhs.103, %or.merge.102
@@ -849,18 +836,16 @@ while.hdr.105:                                    ; preds = %while.body.106, %wh
 while.body.106:                                   ; preds = %while.hdr.105
  %loadN = load i64, ptr %allocaN, align 8
  %mul = mul i64 %loadN, 65536
-  %loadN = load [4 x i64], ptr %allocaN, align 8
  %loadN = load i64, ptr %allocaN, align 8
-  store [4 x i64] %loadN, ptr %ig.tmp36, align 8
-  %ig.ptr37 = getelementptr [4 x i64], ptr %ig.tmp36, i64 0, i64 %loadN
-  %ig.val38 = load i64, ptr %ig.ptr37, align 8
-  %addN = add i64 %mul, %ig.val38
+  %igp.ptr29 = getelementptr i64, ptr %allocaN, i64 %loadN
+  %loadN = load i64, ptr %igp.ptr29, align 8
+  %addN = add i64 %mul, %loadN
  store i64 %addN, ptr %allocaN, align 8
  %loadN = load i64, ptr %allocaN, align 8
  %sdiv = sdiv i64 %loadN, 10
  %loadN = load i64, ptr %allocaN, align 8
-  %igp.ptr = getelementptr i64, ptr %allocaN, i64 %loadN
-  store i64 %sdiv, ptr %igp.ptr, align 8
+  %igp.ptr35 = getelementptr i64, ptr %allocaN, i64 %loadN
+  store i64 %sdiv, ptr %igp.ptr35, align 8
  %loadN = load i64, ptr %allocaN, align 8
  %srem = srem i64 %loadN, 10
  store i64 %srem, ptr %allocaN, align 8
@@ -875,9 +860,9 @@ while.exit.107:                                   ; preds = %while.hdr.105
  %loadN = load i64, ptr %allocaN, align 8
  %loadN = load { ptr, i64 }, ptr %allocaN, align 8
  %igp.data = extractvalue { ptr, i64 } %loadN, 0
-  %igp.ptr50 = getelementptr i8, ptr %igp.data, i64 %loadN
+  %igp.ptr43 = getelementptr i8, ptr %igp.data, i64 %loadN
  %trunc = trunc i64 %addN to i8
-  store i8 %trunc, ptr %igp.ptr50, align 1
+  store i8 %trunc, ptr %igp.ptr43, align 1
  %loadN = load i64, ptr %allocaN, align 8
  %subN = sub i64 %loadN, 1
  store i64 %subN, ptr %allocaN, align 8
@@ -1199,7 +1184,6 @@ if.then.94:                                       ; preds = %if.merge.93
  br label %if.merge.95

 if.merge.95:                                      ; preds = %if.then.94, %if.merge.93
-  store [4 x i64] undef, ptr %allocaN, align 8
  %loadN = load i64, ptr %allocaN, align 8
  %igp.ptr = getelementptr i64, ptr %allocaN, i64 0
  store i64 %loadN, ptr %igp.ptr, align 8
@@ -1222,10 +1206,6 @@ entry:
  %alloca = alloca i64, align 8
  %allocaN = alloca [4 x i64], align 8
  %allocaN = alloca { ptr, i64 }, align 8
-  %ig.tmp = alloca [4 x i64], align 8
-  %ig.tmp9 = alloca [4 x i64], align 8
-  %ig.tmp14 = alloca [4 x i64], align 8
-  %ig.tmp19 = alloca [4 x i64], align 8
  %allocaN = alloca i64, align 8
  store i64 %1, ptr %alloca, align 8
  %load = load i64, ptr %alloca, align 8
@@ -1242,29 +1222,21 @@ if.merge.400:                                     ; preds = %entry
  %callN = call { ptr, i64 } @cstring(ptr %0, i64 16)
  store { ptr, i64 } %callN, ptr %allocaN, align 8
  %loadN = load { ptr, i64 }, ptr %allocaN, align 8
-  %loadN = load [4 x i64], ptr %allocaN, align 8
-  store [4 x i64] %loadN, ptr %ig.tmp, align 8
-  %ig.ptr = getelementptr [4 x i64], ptr %ig.tmp, i64 0, i64 0
-  %ig.val = load i64, ptr %ig.ptr, align 8
-  call void @hex_group(ptr %0, { ptr, i64 } %loadN, i64 0, i64 %ig.val)
+  %igp.ptr = getelementptr i64, ptr %allocaN, i64 0
+  %loadN = load i64, ptr %igp.ptr, align 8
+  call void @hex_group(ptr %0, { ptr, i64 } %loadN, i64 0, i64 %loadN)
  %loadN = load { ptr, i64 }, ptr %allocaN, align 8
-  %loadN = load [4 x i64], ptr %allocaN, align 8
-  store [4 x i64] %loadN, ptr %ig.tmp9, align 8
-  %ig.ptr10 = getelementptr [4 x i64], ptr %ig.tmp9, i64 0, i64 1
-  %ig.val11 = load i64, ptr %ig.ptr10, align 8
-  call void @hex_group(ptr %0, { ptr, i64 } %loadN, i64 4, i64 %ig.val11)
+  %igp.ptr8 = getelementptr i64, ptr %allocaN, i64 1
+  %loadN = load i64, ptr %igp.ptr8, align 8
+  call void @hex_group(ptr %0, { ptr, i64 } %loadN, i64 4, i64 %loadN)
  %loadN = load { ptr, i64 }, ptr %allocaN, align 8
-  %loadN = load [4 x i64], ptr %allocaN, align 8
-  store [4 x i64] %loadN, ptr %ig.tmp14, align 8
-  %ig.ptr15 = getelementptr [4 x i64], ptr %ig.tmp14, i64 0, i64 2
-  %ig.val16 = load i64, ptr %ig.ptr15, align 8
-  call void @hex_group(ptr %0, { ptr, i64 } %loadN, i64 8, i64 %ig.val16)
+  %igp.ptr11 = getelementptr i64, ptr %allocaN, i64 2
+  %loadN = load i64, ptr %igp.ptr11, align 8
+  call void @hex_group(ptr %0, { ptr, i64 } %loadN, i64 8, i64 %loadN)
  %loadN = load { ptr, i64 }, ptr %allocaN, align 8
-  %loadN = load [4 x i64], ptr %allocaN, align 8
-  store [4 x i64] %loadN, ptr %ig.tmp19, align 8
-  %ig.ptr20 = getelementptr [4 x i64], ptr %ig.tmp19, i64 0, i64 3
-  %ig.val21 = load i64, ptr %ig.ptr20, align 8
-  call void @hex_group(ptr %0, { ptr, i64 } %loadN, i64 12, i64 %ig.val21)
+  %igp.ptr14 = getelementptr i64, ptr %allocaN, i64 3
+  %loadN = load i64, ptr %igp.ptr14, align 8
+  call void @hex_group(ptr %0, { ptr, i64 } %loadN, i64 12, i64 %loadN)
  store i64 0, ptr %allocaN, align 8
  br label %while.hdr.407

@@ -1277,9 +1249,9 @@ while.body.408:                                   ; preds = %while.hdr.407
  %loadN = load { ptr, i64 }, ptr %allocaN, align 8
  %loadN = load i64, ptr %allocaN, align 8
  %ig.data = extractvalue { ptr, i64 } %loadN, 0
-  %ig.ptr27 = getelementptr i8, ptr %ig.data, i64 %loadN
-  %ig.val28 = load i8, ptr %ig.ptr27, align 1
-  %cmp.ext = zext i8 %ig.val28 to i64
+  %ig.ptr = getelementptr i8, ptr %ig.data, i64 %loadN
+  %ig.val = load i8, ptr %ig.ptr, align 1
+  %cmp.ext = zext i8 %ig.val to i64
  %icmpN = icmp ne i64 %cmp.ext, 48
  br i1 %icmpN, label %if.then.410, label %if.merge.411