Test Failure: Transforms/LoadStoreVectorizer/X86/vectorize-i8-nested-add.ll

Test source: git

Log:

Source: /bitbucket/nlopes/llvm/llvm/test/Transforms/LoadStoreVectorizer/X86/vectorize-i8-nested-add.ll
-- 1. ModuleToFunctionPassAdaptor
-- 1. PassManager<Function> : Skipping NOP
-- 2. LoadStoreVectorizerPass

----------------------------------------
define void @ld_v4i8_add_nsw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %tmp4 = load i8, ptr %tmp3, align 1
  %tmp5 = add nsw i32 %v1, %v0
  %tmp6 = sext i32 %tmp5 to i64
  %tmp7 = gep inbounds ptr %src, 1 x i64 %tmp6
  %tmp8 = load i8, ptr %tmp7, align 1
  %tmp9 = add nsw i32 %v0, 1
  %tmp10 = add nsw i32 %v1, %tmp9
  %tmp11 = sext i32 %tmp10 to i64
  %tmp12 = gep inbounds ptr %src, 1 x i64 %tmp11
  %tmp13 = load i8, ptr %tmp12, align 1
  %tmp14 = add nsw i32 %v0, 2
  %tmp15 = add nsw i32 %v1, %tmp14
  %tmp16 = sext i32 %tmp15 to i64
  %tmp17 = gep inbounds ptr %src, 1 x i64 %tmp16
  %tmp18 = load i8, ptr %tmp17, align 1
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp4, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp8, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp13, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp18, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation seems to be correct! (syntactically equal)

-- 3. LoadStoreVectorizerPass

----------------------------------------
define void @ld_v4i8_add_nsw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %tmp4 = load i8, ptr %tmp3, align 1
  %tmp5 = add nsw i32 %v1, %v0
  %tmp6 = sext i32 %tmp5 to i64
  %tmp7 = gep inbounds ptr %src, 1 x i64 %tmp6
  %tmp8 = load i8, ptr %tmp7, align 1
  %tmp9 = add nsw i32 %v0, 1
  %tmp10 = add nsw i32 %v1, %tmp9
  %tmp11 = sext i32 %tmp10 to i64
  %tmp12 = gep inbounds ptr %src, 1 x i64 %tmp11
  %tmp13 = load i8, ptr %tmp12, align 1
  %tmp14 = add nsw i32 %v0, 2
  %tmp15 = add nsw i32 %v1, %tmp14
  %tmp16 = sext i32 %tmp15 to i64
  %tmp17 = gep inbounds ptr %src, 1 x i64 %tmp16
  %tmp18 = load i8, ptr %tmp17, align 1
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp4, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp8, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp13, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp18, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
=>
define void @ld_v4i8_add_nsw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp5 = add nsw i32 %v1, %v0
  %tmp9 = add nsw i32 %v0, 1
  %tmp10 = add nsw i32 %v1, %tmp9
  %tmp14 = add nsw i32 %v0, 2
  %tmp15 = add nsw i32 %v1, %tmp14
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation doesn't verify! (not unsound)
ERROR: Timeout
-- 4. DCEPass

----------------------------------------
define void @ld_v4i8_add_nsw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp5 = add nsw i32 %v1, %v0
  %tmp6 = sext i32 %tmp5 to i64
  %tmp9 = add nsw i32 %v0, 1
  %tmp10 = add nsw i32 %v1, %tmp9
  %tmp11 = sext i32 %tmp10 to i64
  %tmp14 = add nsw i32 %v0, 2
  %tmp15 = add nsw i32 %v1, %tmp14
  %tmp16 = sext i32 %tmp15 to i64
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation seems to be correct! (syntactically equal)

-- 5. DCEPass

----------------------------------------
define void @ld_v4i8_add_nsw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp5 = add nsw i32 %v1, %v0
  %tmp9 = add nsw i32 %v0, 1
  %tmp10 = add nsw i32 %v1, %tmp9
  %tmp14 = add nsw i32 %v0, 2
  %tmp15 = add nsw i32 %v1, %tmp14
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
=>
define void @ld_v4i8_add_nsw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation doesn't verify! (not unsound)
ERROR: Timeout
-- 6. PassManager<Function> : Skipping NOP
-- 7. PassManager<Function> : Skipping NOP
-- 8. LoadStoreVectorizerPass

----------------------------------------
define void @ld_v4i8_add_nuw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nuw i32 %v0, 4294967295
  %tmp1 = add nuw i32 %v1, %tmp
  %tmp2 = zext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %tmp4 = load i8, ptr %tmp3, align 1
  %tmp5 = add nuw i32 %v1, %v0
  %tmp6 = zext i32 %tmp5 to i64
  %tmp7 = gep inbounds ptr %src, 1 x i64 %tmp6
  %tmp8 = load i8, ptr %tmp7, align 1
  %tmp9 = add nuw i32 %v0, 1
  %tmp10 = add nuw i32 %v1, %tmp9
  %tmp11 = zext i32 %tmp10 to i64
  %tmp12 = gep inbounds ptr %src, 1 x i64 %tmp11
  %tmp13 = load i8, ptr %tmp12, align 1
  %tmp14 = add nuw i32 %v0, 2
  %tmp15 = add nuw i32 %v1, %tmp14
  %tmp16 = zext i32 %tmp15 to i64
  %tmp17 = gep inbounds ptr %src, 1 x i64 %tmp16
  %tmp18 = load i8, ptr %tmp17, align 1
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp4, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp8, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp13, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp18, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation seems to be correct! (syntactically equal)

-- 9. LoadStoreVectorizerPass

----------------------------------------
define void @ld_v4i8_add_nuw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nuw i32 %v0, 4294967295
  %tmp1 = add nuw i32 %v1, %tmp
  %tmp2 = zext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %tmp4 = load i8, ptr %tmp3, align 1
  %tmp5 = add nuw i32 %v1, %v0
  %tmp6 = zext i32 %tmp5 to i64
  %tmp7 = gep inbounds ptr %src, 1 x i64 %tmp6
  %tmp8 = load i8, ptr %tmp7, align 1
  %tmp9 = add nuw i32 %v0, 1
  %tmp10 = add nuw i32 %v1, %tmp9
  %tmp11 = zext i32 %tmp10 to i64
  %tmp12 = gep inbounds ptr %src, 1 x i64 %tmp11
  %tmp13 = load i8, ptr %tmp12, align 1
  %tmp14 = add nuw i32 %v0, 2
  %tmp15 = add nuw i32 %v1, %tmp14
  %tmp16 = zext i32 %tmp15 to i64
  %tmp17 = gep inbounds ptr %src, 1 x i64 %tmp16
  %tmp18 = load i8, ptr %tmp17, align 1
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp4, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp8, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp13, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp18, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
=>
define void @ld_v4i8_add_nuw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nuw i32 %v0, 4294967295
  %tmp1 = add nuw i32 %v1, %tmp
  %tmp2 = zext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp5 = add nuw i32 %v1, %v0
  %tmp9 = add nuw i32 %v0, 1
  %tmp10 = add nuw i32 %v1, %tmp9
  %tmp14 = add nuw i32 %v0, 2
  %tmp15 = add nuw i32 %v1, %tmp14
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation doesn't verify! (not unsound)
ERROR: Timeout
-- 10. DCEPass

----------------------------------------
define void @ld_v4i8_add_nuw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nuw i32 %v0, 4294967295
  %tmp1 = add nuw i32 %v1, %tmp
  %tmp2 = zext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp5 = add nuw i32 %v1, %v0
  %tmp6 = zext i32 %tmp5 to i64
  %tmp9 = add nuw i32 %v0, 1
  %tmp10 = add nuw i32 %v1, %tmp9
  %tmp11 = zext i32 %tmp10 to i64
  %tmp14 = add nuw i32 %v0, 2
  %tmp15 = add nuw i32 %v1, %tmp14
  %tmp16 = zext i32 %tmp15 to i64
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation seems to be correct! (syntactically equal)

-- 11. DCEPass

----------------------------------------
define void @ld_v4i8_add_nuw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nuw i32 %v0, 4294967295
  %tmp1 = add nuw i32 %v1, %tmp
  %tmp2 = zext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp5 = add nuw i32 %v1, %v0
  %tmp9 = add nuw i32 %v0, 1
  %tmp10 = add nuw i32 %v1, %tmp9
  %tmp14 = add nuw i32 %v0, 2
  %tmp15 = add nuw i32 %v1, %tmp14
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
=>
define void @ld_v4i8_add_nuw(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nuw i32 %v0, 4294967295
  %tmp1 = add nuw i32 %v1, %tmp
  %tmp2 = zext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation doesn't verify! (not unsound)
ERROR: Timeout
-- 12. PassManager<Function> : Skipping NOP
-- 13. PassManager<Function> : Skipping NOP
-- 14. LoadStoreVectorizerPass

----------------------------------------
define void @ld_v4i8_add_nsw_operand_orders(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %tmp4 = load i8, ptr %tmp3, align 1
  %tmp5 = add nsw i32 %v0, %v1
  %tmp6 = sext i32 %tmp5 to i64
  %tmp7 = gep inbounds ptr %src, 1 x i64 %tmp6
  %tmp8 = load i8, ptr %tmp7, align 1
  %tmp9 = add nsw i32 %v0, 1
  %tmp10 = add nsw i32 %tmp9, %v1
  %tmp11 = sext i32 %tmp10 to i64
  %tmp12 = gep inbounds ptr %src, 1 x i64 %tmp11
  %tmp13 = load i8, ptr %tmp12, align 1
  %tmp14 = add nsw i32 %v0, 2
  %tmp15 = add nsw i32 %v1, %tmp14
  %tmp16 = sext i32 %tmp15 to i64
  %tmp17 = gep inbounds ptr %src, 1 x i64 %tmp16
  %tmp18 = load i8, ptr %tmp17, align 1
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp4, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp8, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp13, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp18, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation seems to be correct! (syntactically equal)

-- 15. LoadStoreVectorizerPass

----------------------------------------
define void @ld_v4i8_add_nsw_operand_orders(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %tmp4 = load i8, ptr %tmp3, align 1
  %tmp5 = add nsw i32 %v0, %v1
  %tmp6 = sext i32 %tmp5 to i64
  %tmp7 = gep inbounds ptr %src, 1 x i64 %tmp6
  %tmp8 = load i8, ptr %tmp7, align 1
  %tmp9 = add nsw i32 %v0, 1
  %tmp10 = add nsw i32 %tmp9, %v1
  %tmp11 = sext i32 %tmp10 to i64
  %tmp12 = gep inbounds ptr %src, 1 x i64 %tmp11
  %tmp13 = load i8, ptr %tmp12, align 1
  %tmp14 = add nsw i32 %v0, 2
  %tmp15 = add nsw i32 %v1, %tmp14
  %tmp16 = sext i32 %tmp15 to i64
  %tmp17 = gep inbounds ptr %src, 1 x i64 %tmp16
  %tmp18 = load i8, ptr %tmp17, align 1
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp4, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp8, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp13, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp18, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
=>
define void @ld_v4i8_add_nsw_operand_orders(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp5 = add nsw i32 %v0, %v1
  %tmp9 = add nsw i32 %v0, 1
  %tmp10 = add nsw i32 %tmp9, %v1
  %tmp14 = add nsw i32 %v0, 2
  %tmp15 = add nsw i32 %v1, %tmp14
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation doesn't verify! (not unsound)
ERROR: Timeout
-- 16. DCEPass

----------------------------------------
define void @ld_v4i8_add_nsw_operand_orders(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp5 = add nsw i32 %v0, %v1
  %tmp6 = sext i32 %tmp5 to i64
  %tmp9 = add nsw i32 %v0, 1
  %tmp10 = add nsw i32 %tmp9, %v1
  %tmp11 = sext i32 %tmp10 to i64
  %tmp14 = add nsw i32 %v0, 2
  %tmp15 = add nsw i32 %v1, %tmp14
  %tmp16 = sext i32 %tmp15 to i64
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation seems to be correct! (syntactically equal)

-- 17. DCEPass

----------------------------------------
define void @ld_v4i8_add_nsw_operand_orders(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp5 = add nsw i32 %v0, %v1
  %tmp9 = add nsw i32 %v0, 1
  %tmp10 = add nsw i32 %tmp9, %v1
  %tmp14 = add nsw i32 %v0, 2
  %tmp15 = add nsw i32 %v1, %tmp14
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
=>
define void @ld_v4i8_add_nsw_operand_orders(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nsw i32 %v0, 4294967295
  %tmp1 = add nsw i32 %v1, %tmp
  %tmp2 = sext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation doesn't verify! (not unsound)
ERROR: Timeout
-- 18. PassManager<Function> : Skipping NOP
-- 19. PassManager<Function> : Skipping NOP
-- 20. LoadStoreVectorizerPass

----------------------------------------
define void @ld_v4i8_add_nuw_operand_orders(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nuw i32 %v0, 4294967295
  %tmp1 = add nuw i32 %v1, %tmp
  %tmp2 = zext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %tmp4 = load i8, ptr %tmp3, align 1
  %tmp5 = add nuw i32 %v0, %v1
  %tmp6 = zext i32 %tmp5 to i64
  %tmp7 = gep inbounds ptr %src, 1 x i64 %tmp6
  %tmp8 = load i8, ptr %tmp7, align 1
  %tmp9 = add nuw i32 %v0, 1
  %tmp10 = add nuw i32 %tmp9, %v1
  %tmp11 = zext i32 %tmp10 to i64
  %tmp12 = gep inbounds ptr %src, 1 x i64 %tmp11
  %tmp13 = load i8, ptr %tmp12, align 1
  %tmp14 = add nuw i32 %v0, 2
  %tmp15 = add nuw i32 %v1, %tmp14
  %tmp16 = zext i32 %tmp15 to i64
  %tmp17 = gep inbounds ptr %src, 1 x i64 %tmp16
  %tmp18 = load i8, ptr %tmp17, align 1
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp4, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp8, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp13, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp18, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation seems to be correct! (syntactically equal)

-- 21. LoadStoreVectorizerPass

----------------------------------------
define void @ld_v4i8_add_nuw_operand_orders(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nuw i32 %v0, 4294967295
  %tmp1 = add nuw i32 %v1, %tmp
  %tmp2 = zext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %tmp4 = load i8, ptr %tmp3, align 1
  %tmp5 = add nuw i32 %v0, %v1
  %tmp6 = zext i32 %tmp5 to i64
  %tmp7 = gep inbounds ptr %src, 1 x i64 %tmp6
  %tmp8 = load i8, ptr %tmp7, align 1
  %tmp9 = add nuw i32 %v0, 1
  %tmp10 = add nuw i32 %tmp9, %v1
  %tmp11 = zext i32 %tmp10 to i64
  %tmp12 = gep inbounds ptr %src, 1 x i64 %tmp11
  %tmp13 = load i8, ptr %tmp12, align 1
  %tmp14 = add nuw i32 %v0, 2
  %tmp15 = add nuw i32 %v1, %tmp14
  %tmp16 = zext i32 %tmp15 to i64
  %tmp17 = gep inbounds ptr %src, 1 x i64 %tmp16
  %tmp18 = load i8, ptr %tmp17, align 1
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp4, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp8, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp13, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp18, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
=>
define void @ld_v4i8_add_nuw_operand_orders(i32 %v0, i32 %v1, ptr %src, ptr %dst) {
%bb:
  %tmp = add nuw i32 %v0, 4294967295
  %tmp1 = add nuw i32 %v1, %tmp
  %tmp2 = zext i32 %tmp1 to i64
  %tmp3 = gep inbounds ptr %src, 1 x i64 %tmp2
  %0 = bitcast ptr %tmp3 to ptr
  %1 = load <4 x i8>, ptr %0, align 1
  %tmp41 = extractelement <4 x i8> %1, i32 0
  %tmp82 = extractelement <4 x i8> %1, i32 1
  %tmp133 = extractelement <4 x i8> %1, i32 2
  %tmp184 = extractelement <4 x i8> %1, i32 3
  %tmp5 = add nuw i32 %v0, %v1
  %tmp9 = add nuw i32 %v0, 1
  %tmp10 = add nuw i32 %tmp9, %v1
  %tmp14 = add nuw i32 %v0, 2
  %tmp15 = add nuw i32 %v1, %tmp14
  %tmp19 = insertelement <4 x i8> undef, i8 %tmp41, i32 0
  %tmp20 = insertelement <4 x i8> %tmp19, i8 %tmp82, i32 1
  %tmp21 = insertelement <4 x i8> %tmp20, i8 %tmp133, i32 2
  %tmp22 = insertelement <4 x i8> %tmp21, i8 %tmp184, i32 3
  store <4 x i8> %tmp22, ptr %dst, align 4
  ret void
}
Transformation doesn't verify! (unsound)
ERROR: Source is more defined than target

Example:
i32 %v0 = #x00000000 (0)
i32 %v1 = #x00000000 (0)
ptr %src = pointer(non-local, block_id=1, offset=3458764509525573630)
ptr %dst = pointer(non-local, block_id=2, offset=1552145703384161396)

Source:
i32 %tmp = #xffffffff (4294967295, -1)
i32 %tmp1 = #xffffffff (4294967295, -1)
i64 %tmp2 = #x00000000ffffffff (4294967295)
ptr %tmp3 = pointer(non-local, block_id=1, offset=3458764513820540925)
i8 %tmp4 = poison
i32 %tmp5 = #x00000000 (0)
i64 %tmp6 = #x0000000000000000 (0)
ptr %tmp7 = pointer(non-local, block_id=1, offset=3458764509525573630)
i8 %tmp8 = poison
i32 %tmp9 = #x00000001 (1)
i32 %tmp10 = #x00000001 (1)
i64 %tmp11 = #x0000000000000001 (1)
ptr %tmp12 = pointer(non-local, block_id=1, offset=3458764509525573631)
i8 %tmp13 = poison
i32 %tmp14 = #x00000002 (2)
i32 %tmp15 = #x00000002 (2)
i64 %tmp16 = #x0000000000000002 (2)
ptr %tmp17 = pointer(non-local, block_id=1, offset=3458764509525573632)
i8 %tmp18 = poison
<4 x i8> %tmp19 = < poison, #x00 (0)	[based on undef value], #x00 (0), #x00 (0) >
<4 x i8> %tmp20 = < poison, poison, #x00 (0), #x00 (0) >
<4 x i8> %tmp21 = < poison, poison, poison, #x00 (0) >
<4 x i8> %tmp22 = < poison, poison, poison, poison >

SOURCE MEMORY STATE
===================
NON-LOCAL BLOCKS:
Block 0 >	size: 0	align: 1	alloc type: 0
Block 1 >	size: 3458764513820540928	align: 2	alloc type: 0
Block 2 >	size: 4611686018427387904	align: 65536	alloc type: 0

Target:
i32 %tmp = #xffffffff (4294967295, -1)
i32 %tmp1 = #xffffffff (4294967295, -1)
i64 %tmp2 = #x00000000ffffffff (4294967295)
ptr %tmp3 = pointer(non-local, block_id=1, offset=3458764513820540925)
ptr %0 = pointer(non-local, block_id=1, offset=3458764513820540925)
<4 x i8> %1 = UB triggered!


Pass: LoadStoreVectorizerPass
Command line: '/home/nlopes/llvm/build/bin/opt' '-load=/home/nlopes/alive2/build/tv/tv.so' '-load-pass-plugin=/home/nlopes/alive2/build/tv/tv.so' '-tv-exit-on-error' '-o' '-' '-S' '-passes=load-store-vectorizer,dce' '/bitbucket/nlopes/llvm/llvm/test/Transforms/LoadStoreVectorizer/X86/vectorize-i8-nested-add.ll' '-tv-smt-to=20000' '-tv-report-dir=/home/nlopes/alive2/build/logs' '-tv-smt-stats'


------------------- SMT STATS -------------------
Num queries: 33
Num invalid: 0
Num skips:   0
Num trivial: 30 (47.6%)
Num timeout: 6 (18.2%)
Num errors:  0 (0.0%)
Num SAT:     27 (81.8%)
Num UNSAT:   0 (0.0%)
Alive2: Transform doesn't verify; aborting!

stderr:

+ : 'RUN: at line 2'
+ /home/nlopes/alive2/build/opt-alive.sh -o - -S -passes=load-store-vectorizer,dce /bitbucket/nlopes/llvm/llvm/test/Transforms/LoadStoreVectorizer/X86/vectorize-i8-nested-add.ll
+ /bitbucket/nlopes/llvm/build/bin/FileCheck /bitbucket/nlopes/llvm/llvm/test/Transforms/LoadStoreVectorizer/X86/vectorize-i8-nested-add.ll

FileCheck error: '<stdin>' is empty.
FileCheck command line:  /bitbucket/nlopes/llvm/build/bin/FileCheck /bitbucket/nlopes/llvm/llvm/test/Transforms/LoadStoreVectorizer/X86/vectorize-i8-nested-add.ll

 

<-- Back