Merge branch 'llvm-cliptest-viewport'
[mesa.git] / src / gallium / drivers / r600 / r600_shader.c
index 141adcc54be0a3f485d334db50715099634aec3f..d1143985eadb9b531062144c4f2c8d32e6310ac7 100644 (file)
@@ -357,6 +357,11 @@ struct r600_shader_ctx {
        u32                                     *literals;
        u32                                     nliterals;
        u32                                     max_driver_temp_used;
+       /* needed for evergreen interpolation */
+       boolean                                 input_centroid;
+       boolean                                 input_linear;
+       boolean                                 input_perspective;
+       int                                     num_interp_gpr;
 };
 
 struct r600_shader_tgsi_instruction {
@@ -389,11 +394,9 @@ static int tgsi_is_supported(struct r600_shader_ctx *ctx)
        }
 #endif
        for (j = 0; j < i->Instruction.NumSrcRegs; j++) {
-               if (i->Src[j].Register.Dimension ||
-                       i->Src[j].Register.Absolute) {
-                       R600_ERR("unsupported src %d (dimension %d|absolute %d)\n", j,
-                                i->Src[j].Register.Dimension,
-                                i->Src[j].Register.Absolute);
+               if (i->Src[j].Register.Dimension) {
+                       R600_ERR("unsupported src %d (dimension %d)\n", j,
+                                i->Src[j].Register.Dimension);
                        return -EINVAL;
                }
        }
@@ -406,10 +409,33 @@ static int tgsi_is_supported(struct r600_shader_ctx *ctx)
        return 0;
 }
 
-static int evergreen_interp_alu(struct r600_shader_ctx *ctx, int gpr)
+static int evergreen_interp_alu(struct r600_shader_ctx *ctx, int input)
 {
        int i, r;
        struct r600_bc_alu alu;
+       int gpr = 0, base_chan = 0;
+       int ij_index = 0;
+
+       if (ctx->shader->input[input].interpolate == TGSI_INTERPOLATE_PERSPECTIVE) {
+               ij_index = 0;
+               if (ctx->shader->input[input].centroid)
+                       ij_index++;
+       } else if (ctx->shader->input[input].interpolate == TGSI_INTERPOLATE_LINEAR) {
+               ij_index = 0;
+               /* if we have perspective add one */
+               if (ctx->input_perspective)  {
+                       ij_index++;
+                       /* if we have perspective centroid */
+                       if (ctx->input_centroid)
+                               ij_index++;
+               }
+               if (ctx->shader->input[input].centroid)
+                       ij_index++;
+       }
+               
+       /* work out gpr and base_chan from index */
+       gpr = ij_index / 2;
+       base_chan = (2 * (ij_index % 2)) + 1;
 
        for (i = 0; i < 8; i++) {
                memset(&alu, 0, sizeof(struct r600_bc_alu));
@@ -420,13 +446,16 @@ static int evergreen_interp_alu(struct r600_shader_ctx *ctx, int gpr)
                        alu.inst = EG_V_SQ_ALU_WORD1_OP2_SQ_OP2_INTERP_XY;
 
                if ((i > 1) && (i < 6)) {
-                       alu.dst.sel = ctx->shader->input[gpr].gpr;
+                       alu.dst.sel = ctx->shader->input[input].gpr;
                        alu.dst.write = 1;
                }
 
                alu.dst.chan = i % 4;
-               alu.src[0].chan = (1 - (i % 2));
-               alu.src[1].sel = V_SQ_ALU_SRC_PARAM_BASE + gpr;
+
+               alu.src[0].sel = gpr;
+               alu.src[0].chan = (base_chan - (i % 2));
+
+               alu.src[1].sel = V_SQ_ALU_SRC_PARAM_BASE + ctx->shader->input[input].lds_pos;
 
                alu.bank_swizzle_force = SQ_ALU_VEC_210;
                if ((i % 4) == 3)
@@ -476,7 +505,12 @@ static int tgsi_declaration(struct r600_shader_ctx *ctx)
                }
                if (ctx->type == TGSI_PROCESSOR_FRAGMENT && ctx->bc->chiprev == 2) {
                        /* turn input into interpolate on EG */
-                       evergreen_interp_alu(ctx, i);
+                       if (ctx->shader->input[i].name != TGSI_SEMANTIC_POSITION) {
+                               if (ctx->shader->input[i].interpolate > 0) {
+                                       ctx->shader->input[i].lds_pos = ctx->shader->nlds++;
+                                       evergreen_interp_alu(ctx, i);
+                               }
+                       }
                }
                break;
        case TGSI_FILE_OUTPUT:
@@ -503,6 +537,53 @@ static int r600_get_temp(struct r600_shader_ctx *ctx)
        return ctx->temp_reg + ctx->max_driver_temp_used++;
 }
 
+/* 
+ * for evergreen we need to scan the shader to find the number of GPRs we need to
+ * reserve for interpolation.
+ *
+ * we need to know if we are going to emit
+ * any centroid inputs
+ * if perspective and linear are required
+*/
+static int evergreen_gpr_count(struct r600_shader_ctx *ctx)
+{
+       int i;
+       int num_baryc;
+
+       ctx->input_linear = FALSE;
+       ctx->input_perspective = FALSE;
+       ctx->input_centroid = FALSE;
+       ctx->num_interp_gpr = 1;
+
+       /* any centroid inputs */
+       for (i = 0; i < ctx->info.num_inputs; i++) {
+               /* skip position/face */
+               if (ctx->info.input_semantic_name[i] == TGSI_SEMANTIC_POSITION ||
+                   ctx->info.input_semantic_name[i] == TGSI_SEMANTIC_FACE)
+                       continue;
+               if (ctx->info.input_interpolate[i] == TGSI_INTERPOLATE_LINEAR)
+                       ctx->input_linear = TRUE;
+               if (ctx->info.input_interpolate[i] == TGSI_INTERPOLATE_PERSPECTIVE)
+                       ctx->input_perspective = TRUE;
+               if (ctx->info.input_centroid[i])
+                       ctx->input_centroid = TRUE;
+       }
+
+       num_baryc = 0;
+       /* ignoring sample for now */
+       if (ctx->input_perspective)
+               num_baryc++;
+       if (ctx->input_linear)
+               num_baryc++;
+       if (ctx->input_centroid)
+               num_baryc *= 2;
+
+       ctx->num_interp_gpr += (num_baryc + 1) >> 1;
+
+       /* TODO PULL MODEL and LINE STIPPLE, FIXED PT POS */
+       return ctx->num_interp_gpr;
+}
+
 int r600_shader_from_tgsi(const struct tgsi_token *tokens, struct r600_shader *shader)
 {
        struct tgsi_full_immediate *immediate;
@@ -549,7 +630,7 @@ int r600_shader_from_tgsi(const struct tgsi_token *tokens, struct r600_shader *s
                ctx.file_offset[TGSI_FILE_INPUT] = 1;
        }
        if (ctx.type == TGSI_PROCESSOR_FRAGMENT && ctx.bc->chiprev == 2) {
-               ctx.file_offset[TGSI_FILE_INPUT] = 1;
+               ctx.file_offset[TGSI_FILE_INPUT] = evergreen_gpr_count(&ctx);
        }
        ctx.file_offset[TGSI_FILE_OUTPUT] = ctx.file_offset[TGSI_FILE_INPUT] +
                                                ctx.info.file_count[TGSI_FILE_INPUT];
@@ -760,6 +841,7 @@ static int tgsi_src(struct r600_shader_ctx *ctx,
        if (tgsi_src->Register.Indirect)
                r600_src->rel = V_SQ_REL_RELATIVE;
        r600_src->neg = tgsi_src->Register.Negate;
+       r600_src->abs = tgsi_src->Register.Absolute;
        r600_src->sel += ctx->file_offset[tgsi_src->Register.File];
        return 0;
 }
@@ -2528,7 +2610,40 @@ static int tgsi_log(struct r600_shader_ctx *ctx)
 }
 
 /* r6/7 only for now */
-static int tgsi_arl(struct r600_shader_ctx *ctx)
+static int tgsi_eg_arl(struct r600_shader_ctx *ctx)
+{
+       struct tgsi_full_instruction *inst = &ctx->parse.FullToken.FullInstruction;
+       struct r600_bc_alu alu;
+       int r;
+       
+       memset(&alu, 0, sizeof(struct r600_bc_alu));
+
+       alu.inst = EG_V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_FLT_TO_INT_FLOOR;
+       r = tgsi_src(ctx, &inst->Src[0], &alu.src[0]);
+       if (r)
+               return r;
+       alu.src[0].chan = tgsi_chan(&inst->Src[0], 0);
+       alu.last = 1;
+       alu.dst.chan = 0;
+       alu.dst.sel = ctx->temp_reg;
+       alu.dst.write = 1;
+       r = r600_bc_add_alu_type(ctx->bc, &alu, CTX_INST(V_SQ_CF_ALU_WORD1_SQ_CF_INST_ALU));
+       if (r)
+               return r;
+       memset(&alu, 0, sizeof(struct r600_bc_alu));
+       alu.inst = EG_V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_MOVA_INT;
+       r = tgsi_src(ctx, &inst->Src[0], &alu.src[0]);
+       if (r)
+               return r;
+       alu.src[0].sel = ctx->temp_reg;
+       alu.src[0].chan = 0;
+       alu.last = 1;
+       r = r600_bc_add_alu_type(ctx->bc, &alu, CTX_INST(V_SQ_CF_ALU_WORD1_SQ_CF_INST_ALU));
+       if (r)
+               return r;
+       return 0;
+}
+static int tgsi_r600_arl(struct r600_shader_ctx *ctx)
 {
        /* TODO from r600c, ar values don't persist between clauses */
        struct tgsi_full_instruction *inst = &ctx->parse.FullToken.FullInstruction;
@@ -2873,7 +2988,7 @@ static int tgsi_loop_brk_cont(struct r600_shader_ctx *ctx)
 }
 
 static struct r600_shader_tgsi_instruction r600_shader_tgsi_instruction[] = {
-       {TGSI_OPCODE_ARL,       0, V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_NOP, tgsi_arl},
+       {TGSI_OPCODE_ARL,       0, V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_NOP, tgsi_r600_arl},
        {TGSI_OPCODE_MOV,       0, V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_MOV, tgsi_op2},
        {TGSI_OPCODE_LIT,       0, V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_NOP, tgsi_lit},
 
@@ -3037,7 +3152,7 @@ static struct r600_shader_tgsi_instruction r600_shader_tgsi_instruction[] = {
 };
 
 static struct r600_shader_tgsi_instruction eg_shader_tgsi_instruction[] = {
-       {TGSI_OPCODE_ARL,       0, EG_V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_NOP, tgsi_unsupported},
+       {TGSI_OPCODE_ARL,       0, EG_V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_NOP, tgsi_eg_arl},
        {TGSI_OPCODE_MOV,       0, EG_V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_MOV, tgsi_op2},
        {TGSI_OPCODE_LIT,       0, EG_V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_NOP, tgsi_lit},
        {TGSI_OPCODE_RCP,       0, EG_V_SQ_ALU_WORD1_OP2_SQ_OP2_INST_RECIP_IEEE, tgsi_trans_srcx_replicate},