freedreno/ir3: add helper to determine point-coord inputs
[mesa.git] / src / freedreno / ir3 / ir3_group.c
index dd12f59b89c0775ad46f9724fcc25e973ad8a1df..61ecd5320b315f3f494fcae501ffd5c575ea1c29 100644 (file)
  * Find/group instruction neighbors:
  */
 
-/* bleh.. we need to do the same group_n() thing for both inputs/outputs
- * (where we have a simple instr[] array), and fanin nodes (where we have
- * an extra indirection via reg->instr).
- */
-struct group_ops {
-       struct ir3_instruction *(*get)(void *arr, int idx);
-       void (*insert_mov)(void *arr, int idx, struct ir3_instruction *instr);
-};
-
-static struct ir3_instruction *instr_get(void *arr, int idx)
-{
-       return ssa(((struct ir3_instruction *)arr)->regs[idx+1]);
-}
 static void
-instr_insert_mov(void *arr, int idx, struct ir3_instruction *instr)
+insert_mov(struct ir3_instruction *collect, int idx)
 {
-       ((struct ir3_instruction *)arr)->regs[idx+1]->instr =
-                       ir3_MOV(instr->block, instr, TYPE_F32);
+       struct ir3_instruction *src = ssa(collect->regs[idx+1]);
+       struct ir3_instruction *mov = ir3_MOV(src->block, src,
+               (collect->regs[idx+1]->flags & IR3_REG_HALF) ? TYPE_U16 : TYPE_U32);
+
+       collect->regs[idx+1]->instr = mov;
+
+       /* if collect and src are in the same block, move the inserted mov
+        * to just before the collect to avoid a use-before-def.  Otherwise
+        * it should be safe to leave at the end of the block it is in:
+        */
+       if (src->block == collect->block) {
+               ir3_instr_move_before(mov, collect);
+       }
 }
-static struct group_ops instr_ops = { instr_get, instr_insert_mov };
 
 /* verify that cur != instr, but cur is also not in instr's neighbor-list: */
 static bool
@@ -71,9 +68,10 @@ in_neighbor_list(struct ir3_instruction *instr, struct ir3_instruction *cur, int
 }
 
 static void
-group_n(struct group_ops *ops, void *arr, unsigned n)
+group_collect(struct ir3_instruction *collect)
 {
-       unsigned i, j;
+       struct ir3_register **regs = &collect->regs[1];
+       unsigned n = collect->regs_count - 1;
 
        /* first pass, figure out what has conflicts and needs a mov
         * inserted.  Do this up front, before starting to setup
@@ -83,11 +81,11 @@ group_n(struct group_ops *ops, void *arr, unsigned n)
         * a mov.
         */
 restart:
-       for (i = 0; i < n; i++) {
-               struct ir3_instruction *instr = ops->get(arr, i);
+       for (unsigned i = 0; i < n; i++) {
+               struct ir3_instruction *instr = ssa(regs[i]);
                if (instr) {
-                       struct ir3_instruction *left = (i > 0) ? ops->get(arr, i - 1) : NULL;
-                       struct ir3_instruction *right = (i < (n-1)) ? ops->get(arr, i + 1) : NULL;
+                       struct ir3_instruction *left = (i > 0) ? ssa(regs[i - 1]) : NULL;
+                       struct ir3_instruction *right = (i < (n-1)) ? ssa(regs[i + 1]) : NULL;
                        bool conflict;
 
                        /* check for left/right neighbor conflicts: */
@@ -103,12 +101,12 @@ restart:
                                conflict = true;
 
                        /* we also can't have an instr twice in the group: */
-                       for (j = i + 1; (j < n) && !conflict; j++)
-                               if (in_neighbor_list(ops->get(arr, j), instr, i))
+                       for (unsigned j = i + 1; (j < n) && !conflict; j++)
+                               if (in_neighbor_list(ssa(regs[j]), instr, i))
                                        conflict = true;
 
                        if (conflict) {
-                               ops->insert_mov(arr, i, instr);
+                               insert_mov(collect, i);
                                /* inserting the mov may have caused a conflict
                                 * against the previous:
                                 */
@@ -121,11 +119,11 @@ restart:
         * neighbors.  This is guaranteed to succeed, since by definition
         * the newly inserted mov's cannot conflict with anything.
         */
-       for (i = 0; i < n; i++) {
-               struct ir3_instruction *instr = ops->get(arr, i);
+       for (unsigned i = 0; i < n; i++) {
+               struct ir3_instruction *instr = ssa(regs[i]);
                if (instr) {
-                       struct ir3_instruction *left = (i > 0) ? ops->get(arr, i - 1) : NULL;
-                       struct ir3_instruction *right = (i < (n-1)) ? ops->get(arr, i + 1) : NULL;
+                       struct ir3_instruction *left = (i > 0) ? ssa(regs[i - 1]) : NULL;
+                       struct ir3_instruction *right = (i < (n-1)) ? ssa(regs[i + 1]) : NULL;
 
                        debug_assert(!conflicts(instr->cp.left, left));
                        if (left) {
@@ -142,45 +140,51 @@ restart:
        }
 }
 
-static void
+static bool
 instr_find_neighbors(struct ir3_instruction *instr)
 {
-       struct ir3_instruction *src;
+       bool progress = false;
 
        if (ir3_instr_check_mark(instr))
-               return;
+               return false;
 
-       if (instr->opc == OPC_META_COLLECT)
-               group_n(&instr_ops, instr, instr->regs_count - 1);
+       if (instr->opc == OPC_META_COLLECT) {
+               group_collect(instr);
+               progress = true;
+       }
 
        foreach_ssa_src (src, instr)
-               instr_find_neighbors(src);
+               progress |= instr_find_neighbors(src);
+
+       return progress;
 }
 
-static void
+static bool
 find_neighbors(struct ir3 *ir)
 {
+       bool progress = false;
        unsigned i;
 
-       struct ir3_instruction *out;
        foreach_output (out, ir)
-               instr_find_neighbors(out);
+               progress |= instr_find_neighbors(out);
 
        foreach_block (block, &ir->block_list) {
                for (i = 0; i < block->keeps_count; i++) {
                        struct ir3_instruction *instr = block->keeps[i];
-                       instr_find_neighbors(instr);
+                       progress |= instr_find_neighbors(instr);
                }
 
                /* We also need to account for if-condition: */
                if (block->condition)
-                       instr_find_neighbors(block->condition);
+                       progress |= instr_find_neighbors(block->condition);
        }
+
+       return progress;
 }
 
-void
+bool
 ir3_group(struct ir3 *ir)
 {
        ir3_clear_mark(ir);
-       find_neighbors(ir);
+       return find_neighbors(ir);
 }