ac/nir: remove useless integer cast in adjust_sample_index_using_fmask()
[mesa.git] / src / amd / common / ac_llvm_build.c
index 54e90288bda5d19b515682616df02698ea0a3ae6..19496519165f7ea856b23145375d104fde628d49 100644 (file)
@@ -1862,9 +1862,16 @@ ac_build_ddxy(struct ac_llvm_context *ctx,
              LLVMValueRef val)
 {
        unsigned tl_lanes[4], trbl_lanes[4];
+       char name[32], type[8];
        LLVMValueRef tl, trbl;
+       LLVMTypeRef result_type;
        LLVMValueRef result;
 
+       result_type = ac_to_float_type(ctx, LLVMTypeOf(val));
+
+       if (result_type == ctx->f16)
+               val = LLVMBuildZExt(ctx->builder, val, ctx->i32, "");
+
        for (unsigned i = 0; i < 4; ++i) {
                tl_lanes[i] = i & mask;
                trbl_lanes[i] = (i & mask) + idx;
@@ -1877,14 +1884,19 @@ ac_build_ddxy(struct ac_llvm_context *ctx,
                                     trbl_lanes[0], trbl_lanes[1],
                                     trbl_lanes[2], trbl_lanes[3]);
 
-       tl = LLVMBuildBitCast(ctx->builder, tl, ctx->f32, "");
-       trbl = LLVMBuildBitCast(ctx->builder, trbl, ctx->f32, "");
+       if (result_type == ctx->f16) {
+               tl = LLVMBuildTrunc(ctx->builder, tl, ctx->i16, "");
+               trbl = LLVMBuildTrunc(ctx->builder, trbl, ctx->i16, "");
+       }
+
+       tl = LLVMBuildBitCast(ctx->builder, tl, result_type, "");
+       trbl = LLVMBuildBitCast(ctx->builder, trbl, result_type, "");
        result = LLVMBuildFSub(ctx->builder, trbl, tl, "");
 
-       result = ac_build_intrinsic(ctx, "llvm.amdgcn.wqm.f32", ctx->f32,
-                                   &result, 1, 0);
+       ac_build_type_name_for_intr(result_type, type, sizeof(type));
+       snprintf(name, sizeof(name), "llvm.amdgcn.wqm.%s", type);
 
-       return result;
+       return ac_build_intrinsic(ctx, name, result_type, &result, 1, 0);
 }
 
 void
@@ -2030,6 +2042,13 @@ LLVMValueRef ac_build_umin(struct ac_llvm_context *ctx, LLVMValueRef a,
        return LLVMBuildSelect(ctx->builder, cmp, a, b, "");
 }
 
+LLVMValueRef ac_build_umax(struct ac_llvm_context *ctx, LLVMValueRef a,
+                          LLVMValueRef b)
+{
+       LLVMValueRef cmp = LLVMBuildICmp(ctx->builder, LLVMIntUGE, a, b, "");
+       return LLVMBuildSelect(ctx->builder, cmp, a, b, "");
+}
+
 LLVMValueRef ac_build_clamp(struct ac_llvm_context *ctx, LLVMValueRef value)
 {
        LLVMTypeRef t = LLVMTypeOf(value);
@@ -4018,3 +4037,33 @@ ac_build_frexp_mant(struct ac_llvm_context *ctx, LLVMValueRef src0,
        return ac_build_intrinsic(ctx, intr, type, params, 1,
                                  AC_FUNC_ATTR_READNONE);
 }
+
+/*
+ * this takes an I,J coordinate pair,
+ * and works out the X and Y derivatives.
+ * it returns DDX(I), DDX(J), DDY(I), DDY(J).
+ */
+LLVMValueRef
+ac_build_ddxy_interp(struct ac_llvm_context *ctx, LLVMValueRef interp_ij)
+{
+       LLVMValueRef result[4], a;
+       unsigned i;
+
+       for (i = 0; i < 2; i++) {
+               a = LLVMBuildExtractElement(ctx->builder, interp_ij,
+                                           LLVMConstInt(ctx->i32, i, false), "");
+               result[i] = ac_build_ddxy(ctx, AC_TID_MASK_TOP_LEFT, 1, a);
+               result[2+i] = ac_build_ddxy(ctx, AC_TID_MASK_TOP_LEFT, 2, a);
+       }
+       return ac_build_gather_values(ctx, result, 4);
+}
+
+LLVMValueRef
+ac_build_load_helper_invocation(struct ac_llvm_context *ctx)
+{
+       LLVMValueRef result = ac_build_intrinsic(ctx, "llvm.amdgcn.ps.live",
+                                                ctx->i1, NULL, 0,
+                                                AC_FUNC_ATTR_READNONE);
+       result = LLVMBuildNot(ctx->builder, result, "");
+       return LLVMBuildSExt(ctx->builder, result, ctx->i32, "");
+}