Merge remote-tracking branch 'mesa-public/master' into vulkan

[mesa.git] / src / mesa / drivers / dri / i965 / brw_vec4.cpp
diff --git a/src/mesa/drivers/dri/i965/brw_vec4.cpp b/src/mesa/drivers/dri/i965/brw_vec4.cpp

index 9e702302f4158f7e0c8877249013f38be49c0837..63f75da7e99f7437b498d91d5f4592fcfb010f34 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_vec4.cpp
+++ b/src/mesa/drivers/dri/i965/brw_vec4.cpp
@@ -25,6 +25,8 @@
  #include "brw_fs.h"
  #include "brw_cfg.h"
  #include "brw_vs.h"
+#include "brw_nir.h"
+#include "brw_vec4_live_variables.h"
  #include "brw_dead_control_flow.h"
  
  extern "C" {
@@ -33,6 +35,7 @@ extern "C" {
  #include "program/prog_print.h"
  #include "program/prog_parameter.h"
  }
+#include "main/context.h"
  
  #define MAX_INSTRUCTION (1 << 30)
  
@@ -168,6 +171,17 @@ dst_reg::dst_reg(register_file file, int reg, const glsl_type *type,
     this->writemask = writemask;
  }
  
+dst_reg::dst_reg(register_file file, int reg, brw_reg_type type,
+                 unsigned writemask)
+{
+   init();
+
+   this->file = file;
+   this->reg = reg;
+   this->type = type;
+   this->writemask = writemask;
+}
+
  dst_reg::dst_reg(struct brw_reg reg)
  {
     init();
@@ -212,6 +226,12 @@ vec4_instruction::is_send_from_grf()
     switch (opcode) {
     case SHADER_OPCODE_SHADER_TIME_ADD:
     case VS_OPCODE_PULL_CONSTANT_LOAD_GEN7:
+   case SHADER_OPCODE_UNTYPED_ATOMIC:
+   case SHADER_OPCODE_UNTYPED_SURFACE_READ:
+   case SHADER_OPCODE_UNTYPED_SURFACE_WRITE:
+   case SHADER_OPCODE_TYPED_ATOMIC:
+   case SHADER_OPCODE_TYPED_SURFACE_READ:
+   case SHADER_OPCODE_TYPED_SURFACE_WRITE:
        return true;
     default:
        return false;
@@ -226,6 +246,12 @@ vec4_instruction::regs_read(unsigned arg) const
  
     switch (opcode) {
     case SHADER_OPCODE_SHADER_TIME_ADD:
+   case SHADER_OPCODE_UNTYPED_ATOMIC:
+   case SHADER_OPCODE_UNTYPED_SURFACE_READ:
+   case SHADER_OPCODE_UNTYPED_SURFACE_WRITE:
+   case SHADER_OPCODE_TYPED_ATOMIC:
+   case SHADER_OPCODE_TYPED_SURFACE_READ:
+   case SHADER_OPCODE_TYPED_SURFACE_WRITE:
        return arg == 0 ? mlen : 1;
  
     case VS_OPCODE_PULL_CONSTANT_LOAD_GEN7:
@@ -237,9 +263,9 @@ vec4_instruction::regs_read(unsigned arg) const
  }
  
  bool
-vec4_instruction::can_do_source_mods(struct brw_context *brw)
+vec4_instruction::can_do_source_mods(const struct brw_device_info *devinfo)
  {
-   if (brw->gen == 6 && is_math())
+   if (devinfo->gen == 6 && is_math())
        return false;
  
     if (is_send_from_grf())
@@ -302,10 +328,7 @@ vec4_visitor::implied_mrf_writes(vec4_instruction *inst)
     case SHADER_OPCODE_TXS:
     case SHADER_OPCODE_TG4:
     case SHADER_OPCODE_TG4_OFFSET:
-      return inst->header_present ? 1 : 0;
-   case SHADER_OPCODE_UNTYPED_ATOMIC:
-   case SHADER_OPCODE_UNTYPED_SURFACE_READ:
-      return 0;
+      return inst->header_size;
     default:
        unreachable("not reached");
     }
@@ -671,6 +694,16 @@ vec4_visitor::opt_algebraic()
           }
           break;
        }
+      case SHADER_OPCODE_BROADCAST:
+         if (is_uniform(inst->src[0]) ||
+             inst->src[1].is_zero()) {
+            inst->opcode = BRW_OPCODE_MOV;
+            inst->src[1] = src_reg();
+            inst->force_writemask_all = true;
+            progress = true;
+         }
+         break;
+
        default:
          break;
        }
@@ -781,7 +814,7 @@ vec4_visitor::is_dep_ctrl_unsafe(const vec4_instruction *inst)
      * multiply, DepCtrl must not be used."
      * May apply to future SoCs as well.
      */
-   if (brw->is_cherryview) {
+   if (devinfo->is_cherryview) {
        if (inst->opcode == BRW_OPCODE_MUL &&
           IS_DWORD(inst->src[0]) &&
           IS_DWORD(inst->src[1]))
@@ -789,7 +822,7 @@ vec4_visitor::is_dep_ctrl_unsafe(const vec4_instruction *inst)
     }
  #undef IS_DWORD
  
-   if (brw->gen >= 8) {
+   if (devinfo->gen >= 8) {
        if (inst->opcode == BRW_OPCODE_F32TO16)
           return true;
     }
@@ -981,10 +1014,7 @@ vec4_visitor::opt_register_coalesce()
        /* Can't coalesce this GRF if someone else was going to
         * read it later.
         */
-      if (this->virtual_grf_end[inst->src[0].reg * 4 + 0] > ip ||
-          this->virtual_grf_end[inst->src[0].reg * 4 + 1] > ip ||
-          this->virtual_grf_end[inst->src[0].reg * 4 + 2] > ip ||
-          this->virtual_grf_end[inst->src[0].reg * 4 + 3] > ip)
+      if (var_range_end(var_from_reg(alloc, inst->src[0]), 4) > ip)
          continue;
  
        /* We need to check interference with the final destination between this
@@ -1006,16 +1036,14 @@ vec4_visitor::opt_register_coalesce()
                                                    inst, block) {
           _scan_inst = scan_inst;
  
-        if (scan_inst->dst.file == GRF &&
-            scan_inst->dst.reg == inst->src[0].reg &&
-            scan_inst->dst.reg_offset == inst->src[0].reg_offset) {
+         if (inst->src[0].in_range(scan_inst->dst, scan_inst->regs_written)) {
              /* Found something writing to the reg we want to coalesce away. */
              if (to_mrf) {
                 /* SEND instructions can't have MRF as a destination. */
                 if (scan_inst->mlen)
                    break;
  
-               if (brw->gen == 6) {
+               if (devinfo->gen == 6) {
                    /* gen6 math instructions must have the destination be
                     * GRF, so no compute-to-MRF for them.
                     */
@@ -1032,6 +1060,10 @@ vec4_visitor::opt_register_coalesce()
                 break;
              }
  
+            /* This doesn't handle coalescing of multiple registers. */
+            if (scan_inst->regs_written > 1)
+               break;
+
             /* Mark which channels we found unconditional writes for. */
             if (!scan_inst->predicate)
                 chans_remaining &= ~scan_inst->dst.writemask;
@@ -1047,11 +1079,9 @@ vec4_visitor::opt_register_coalesce()
            */
          bool interfered = false;
          for (int i = 0; i < 3; i++) {
-           if (scan_inst->src[i].file == GRF &&
-               scan_inst->src[i].reg == inst->src[0].reg &&
-               scan_inst->src[i].reg_offset == inst->src[0].reg_offset) {
+            if (inst->src[0].in_range(scan_inst->src[i],
+                                      scan_inst->regs_read(i)))
                interfered = true;
-           }
          }
          if (interfered)
             break;
@@ -1059,10 +1089,8 @@ vec4_visitor::opt_register_coalesce()
           /* If somebody else writes our destination here, we can't coalesce
            * before that.
            */
-         if (scan_inst->dst.file == inst->dst.file &&
-             scan_inst->dst.reg == inst->dst.reg) {
+         if (inst->dst.in_range(scan_inst->dst, scan_inst->regs_written))
             break;
-         }
  
           /* Check for reads of the register we're trying to coalesce into.  We
            * can't go rewriting instructions above that to put some other value
@@ -1075,11 +1103,9 @@ vec4_visitor::opt_register_coalesce()
              }
           } else {
              for (int i = 0; i < 3; i++) {
-               if (scan_inst->src[i].file == inst->dst.file &&
-                   scan_inst->src[i].reg == inst->dst.reg &&
-                   scan_inst->src[i].reg_offset == inst->src[0].reg_offset) {
+               if (inst->dst.in_range(scan_inst->src[i],
+                                      scan_inst->regs_read(i)))
                    interfered = true;
-               }
              }
              if (interfered)
                 break;
@@ -1117,6 +1143,46 @@ vec4_visitor::opt_register_coalesce()
     return progress;
  }
  
+/**
+ * Eliminate FIND_LIVE_CHANNEL instructions occurring outside any control
+ * flow.  We could probably do better here with some form of divergence
+ * analysis.
+ */
+bool
+vec4_visitor::eliminate_find_live_channel()
+{
+   bool progress = false;
+   unsigned depth = 0;
+
+   foreach_block_and_inst_safe(block, vec4_instruction, inst, cfg) {
+      switch (inst->opcode) {
+      case BRW_OPCODE_IF:
+      case BRW_OPCODE_DO:
+         depth++;
+         break;
+
+      case BRW_OPCODE_ENDIF:
+      case BRW_OPCODE_WHILE:
+         depth--;
+         break;
+
+      case SHADER_OPCODE_FIND_LIVE_CHANNEL:
+         if (depth == 0) {
+            inst->opcode = BRW_OPCODE_MOV;
+            inst->src[0] = src_reg(0);
+            inst->force_writemask_all = true;
+            progress = true;
+         }
+         break;
+
+      default:
+         break;
+      }
+   }
+
+   return progress;
+}
+
  /**
   * Splits virtual GRFs requesting more than one contiguous physical register.
   *
@@ -1147,15 +1213,12 @@ vec4_visitor::split_virtual_grfs()
      * to split.
      */
     foreach_block_and_inst(block, vec4_instruction, inst, cfg) {
-      /* If there's a SEND message loading from a GRF on gen7+, it needs to be
-       * contiguous.
-       */
-      if (inst->is_send_from_grf()) {
-         for (int i = 0; i < 3; i++) {
-            if (inst->src[i].file == GRF) {
-               split_grf[inst->src[i].reg] = false;
-            }
-         }
+      if (inst->dst.file == GRF && inst->regs_written > 1)
+         split_grf[inst->dst.reg] = false;
+
+      for (int i = 0; i < 3; i++) {
+         if (inst->src[i].file == GRF && inst->regs_read(i) > 1)
+            split_grf[inst->src[i].reg] = false;
        }
     }
  
@@ -1217,9 +1280,9 @@ vec4_visitor::dump_instruction(backend_instruction *be_inst, FILE *file)
     if (inst->conditional_mod) {
        fprintf(file, "%s", conditional_modifier[inst->conditional_mod]);
        if (!inst->predicate &&
-          (brw->gen < 5 || (inst->opcode != BRW_OPCODE_SEL &&
-                            inst->opcode != BRW_OPCODE_IF &&
-                            inst->opcode != BRW_OPCODE_WHILE))) {
+          (devinfo->gen < 5 || (inst->opcode != BRW_OPCODE_SEL &&
+                                inst->opcode != BRW_OPCODE_IF &&
+                                inst->opcode != BRW_OPCODE_WHILE))) {
           fprintf(file, ".f0.%d", inst->flag_subreg);
        }
     }
@@ -1496,7 +1559,7 @@ vec4_vs_visitor::setup_attributes(int payload_reg)
     unsigned vue_entries =
        MAX2(nr_attributes, prog_data->vue_map.num_slots);
  
-   if (brw->gen == 6)
+   if (devinfo->gen == 6)
        prog_data->urb_entry_size = ALIGN(vue_entries, 8) / 8;
     else
        prog_data->urb_entry_size = ALIGN(vue_entries, 4) / 4;
@@ -1512,7 +1575,7 @@ vec4_visitor::setup_uniforms(int reg)
     /* The pre-gen6 VS requires that some push constants get loaded no
      * matter what, or the GPU would hang.
      */
-   if (brw->gen < 6 && this->uniforms == 0) {
+   if (devinfo->gen < 6 && this->uniforms == 0) {
        assert(this->uniforms < this->uniform_array_size);
        this->uniform_vector_size[this->uniforms] = 1;
  
@@ -1565,7 +1628,7 @@ vec4_visitor::assign_binding_table_offsets()
  src_reg
  vec4_visitor::get_timestamp()
  {
-   assert(brw->gen >= 7);
+   assert(devinfo->gen >= 7);
  
     src_reg ts = src_reg(brw_reg(BRW_ARCHITECTURE_REGISTER_FILE,
                                  BRW_ARF_TIMESTAMP,
@@ -1625,20 +1688,16 @@ vec4_visitor::emit_shader_time_end()
      */
     emit(ADD(diff, src_reg(diff), src_reg(-2u)));
  
-   emit_shader_time_write(st_base, src_reg(diff));
-   emit_shader_time_write(st_written, src_reg(1u));
+   emit_shader_time_write(0, src_reg(diff));
+   emit_shader_time_write(1, src_reg(1u));
     emit(BRW_OPCODE_ELSE);
-   emit_shader_time_write(st_reset, src_reg(1u));
+   emit_shader_time_write(2, src_reg(1u));
     emit(BRW_OPCODE_ENDIF);
  }
  
  void
-vec4_visitor::emit_shader_time_write(enum shader_time_shader_type type,
-                                     src_reg value)
+vec4_visitor::emit_shader_time_write(int shader_time_subindex, src_reg value)
  {
-   int shader_time_index =
-      brw_get_shader_time_index(brw, shader_prog, prog, type);
-
     dst_reg dst =
        dst_reg(this, glsl_type::get_array_instance(glsl_type::vec4_type, 2));
  
@@ -1647,7 +1706,8 @@ vec4_visitor::emit_shader_time_write(enum shader_time_shader_type type,
     time.reg_offset++;
  
     offset.type = BRW_REGISTER_TYPE_UD;
-   emit(MOV(offset, src_reg(shader_time_index * SHADER_TIME_STRIDE)));
+   int index = shader_time_index * 3 + shader_time_subindex;
+   emit(MOV(offset, src_reg(index * SHADER_TIME_STRIDE)));
  
     time.type = BRW_REGISTER_TYPE_UD;
     emit(MOV(time, src_reg(value)));
@@ -1658,21 +1718,29 @@ vec4_visitor::emit_shader_time_write(enum shader_time_shader_type type,
  }
  
  bool
-vec4_visitor::run()
+vec4_visitor::run(gl_clip_plane *clip_planes)
  {
+   bool use_vec4_nir =
+      compiler->glsl_compiler_options[stage].NirOptions != NULL;
+
     sanity_param_count = prog->Parameters->NumParameters;
  
-   if (INTEL_DEBUG & DEBUG_SHADER_TIME)
+   if (shader_time_index >= 0)
        emit_shader_time_begin();
  
     assign_binding_table_offsets();
  
     emit_prolog();
  
-   /* Generate VS IR for main().  (the visitor only descends into
-    * functions called "main").
-    */
-   if (shader) {
+   if (use_vec4_nir) {
+      assert(prog->nir != NULL);
+      emit_nir_code();
+      if (failed)
+         return false;
+   } else if (shader) {
+      /* Generate VS IR for main().  (the visitor only descends into
+       * functions called "main").
+       */
        visit_instructions(shader->base.ir);
     } else {
        emit_program_code();
@@ -1680,7 +1748,7 @@ vec4_visitor::run()
     base_ir = NULL;
  
     if (key->userclip_active && !prog->UsesClipDistanceOut)
-      setup_uniform_clipplane_values();
+      setup_uniform_clipplane_values(clip_planes);
  
     emit_thread_end();
  
@@ -1692,7 +1760,7 @@ vec4_visitor::run()
      * that we have reladdr computations available for CSE, since we'll
      * often do repeated subexpressions for those.
      */
-   if (shader) {
+   if (shader || use_vec4_nir) {
        move_grf_array_access_to_scratch();
        move_uniform_array_access_to_pull_constants();
     } else {
@@ -1708,8 +1776,6 @@ vec4_visitor::run()
     move_push_constants_to_pull_constants();
     split_virtual_grfs();
  
-   const char *stage_name = stage == MESA_SHADER_GEOMETRY ? "gs" : "vs";
-
  #define OPT(pass, args...) ({                                          \
        pass_num++;                                                      \
        bool this_progress = pass(args);                                 \
@@ -1717,9 +1783,9 @@ vec4_visitor::run()
        if (unlikely(INTEL_DEBUG & DEBUG_OPTIMIZER) && this_progress) {  \
           char filename[64];                                            \
           snprintf(filename, 64, "%s-%04d-%02d-%02d-" #pass,            \
-                  stage_name, shader_prog ? shader_prog->Name : 0, iteration, pass_num); \
+                  stage_abbrev, shader_prog ? shader_prog->Name : 0, iteration, pass_num); \
                                                                         \
-         backend_visitor::dump_instructions(filename);                 \
+         backend_shader::dump_instructions(filename);                  \
        }                                                                \
                                                                         \
        progress = progress || this_progress;                            \
@@ -1730,9 +1796,9 @@ vec4_visitor::run()
     if (unlikely(INTEL_DEBUG & DEBUG_OPTIMIZER)) {
        char filename[64];
        snprintf(filename, 64, "%s-%04d-00-start",
-               stage_name, shader_prog ? shader_prog->Name : 0);
+               stage_abbrev, shader_prog ? shader_prog->Name : 0);
  
-      backend_visitor::dump_instructions(filename);
+      backend_shader::dump_instructions(filename);
     }
  
     bool progress;
@@ -1750,6 +1816,7 @@ vec4_visitor::run()
        OPT(opt_cse);
        OPT(opt_algebraic);
        OPT(opt_register_coalesce);
+      OPT(eliminate_find_live_channel);
     } while (progress);
  
     pass_num = 0;
@@ -1779,15 +1846,30 @@ vec4_visitor::run()
        }
     }
  
-   while (!reg_allocate()) {
-      if (failed)
-         return false;
+   bool allocated_without_spills = reg_allocate();
+
+   if (!allocated_without_spills) {
+      compiler->shader_perf_log(log_data,
+                                "%s shader triggered register spilling.  "
+                                "Try reducing the number of live vec4 values "
+                                "to improve performance.\n",
+                                stage_name);
+
+      while (!reg_allocate()) {
+         if (failed)
+            return false;
+      }
     }
  
     opt_schedule_instructions();
  
     opt_set_dependency_control();
  
+   if (last_scratch > 0) {
+      prog_data->base.total_scratch =
+         brw_get_scratch_size(last_scratch * REG_SIZE);
+   }
+
     /* If any state parameters were appended, then ParameterValues could have
      * been realloced, in which case the driver uniform storage set up by
      * _mesa_associate_uniform_storage() would point to freed memory.  Make
@@ -1809,10 +1891,11 @@ extern "C" {
   */
  const unsigned *
  brw_vs_emit(struct brw_context *brw,
-            struct gl_shader_program *prog,
-            struct brw_vs_compile *c,
-            struct brw_vs_prog_data *prog_data,
              void *mem_ctx,
+            const struct brw_vs_prog_key *key,
+            struct brw_vs_prog_data *prog_data,
+            struct gl_vertex_program *vp,
+            struct gl_shader_program *prog,
              unsigned *final_assembly_size)
  {
     bool start_busy = false;
@@ -1829,12 +1912,35 @@ brw_vs_emit(struct brw_context *brw,
     if (prog)
        shader = (brw_shader *) prog->_LinkedShaders[MESA_SHADER_VERTEX];
  
-   if (unlikely(INTEL_DEBUG & DEBUG_VS))
-      brw_dump_ir("vertex", prog, &shader->base, &c->vp->program.Base);
+   int st_index = -1;
+   if (INTEL_DEBUG & DEBUG_SHADER_TIME)
+      st_index = brw_get_shader_time_index(brw, prog, &vp->Base, ST_VS);
+
+   if (unlikely(INTEL_DEBUG & DEBUG_VS) && shader->base.ir)
+      brw_dump_ir("vertex", prog, &shader->base, &vp->Base);
+
+   if (!vp->Base.nir &&
+       (brw->intelScreen->compiler->scalar_vs ||
+        brw->intelScreen->compiler->glsl_compiler_options[MESA_SHADER_VERTEX].NirOptions != NULL)) {
+      /* Normally we generate NIR in LinkShader() or
+       * ProgramStringNotify(), but Mesa's fixed-function vertex program
+       * handling doesn't notify the driver at all.  Just do it here, at
+       * the last minute, even though it's lame.
+       */
+      assert(vp->Base.Id == 0 && prog == NULL);
+      vp->Base.nir =
+         brw_create_nir(brw, NULL, &vp->Base, MESA_SHADER_VERTEX,
+                        brw->intelScreen->compiler->scalar_vs);
+   }
+
+   if (brw->intelScreen->compiler->scalar_vs) {
+      prog_data->base.dispatch_mode = DISPATCH_MODE_SIMD8;
  
-   if (prog && brw->gen >= 8 && brw->scalar_vs) {
-      fs_visitor v(brw, mem_ctx, &c->key, prog_data, prog, &c->vp->program, 8);
-      if (!v.run_vs()) {
+      fs_visitor v(brw->intelScreen->compiler, brw,
+                   mem_ctx, MESA_SHADER_VERTEX, key,
+                   &prog_data->base.base, prog, &vp->Base,
+                   8, st_index);
+      if (!v.run_vs(brw_select_clip_planes(&brw->ctx))) {
           if (prog) {
              prog->LinkStatus = false;
              ralloc_strcat(&prog->InfoLog, v.fail_msg);
@@ -1846,26 +1952,33 @@ brw_vs_emit(struct brw_context *brw,
           return NULL;
        }
  
-      fs_generator g(brw, mem_ctx, (void *) &c->key, &prog_data->base.base,
-                     &c->vp->program.Base, v.promoted_constants,
+      fs_generator g(brw->intelScreen->compiler, brw,
+                     mem_ctx, (void *) key, &prog_data->base.base,
+                     &vp->Base, v.promoted_constants,
                       v.runtime_check_aads_emit, "VS");
        if (INTEL_DEBUG & DEBUG_VS) {
-         char *name = ralloc_asprintf(mem_ctx, "%s vertex shader %d",
-                                      prog->Label ? prog->Label : "unnamed",
-                                      prog->Name);
+         char *name;
+         if (prog) {
+            name = ralloc_asprintf(mem_ctx, "%s vertex shader %d",
+                                   prog->Label ? prog->Label : "unnamed",
+                                   prog->Name);
+         } else {
+            name = ralloc_asprintf(mem_ctx, "vertex program %d",
+                                   vp->Base.Id);
+         }
           g.enable_debug(name);
        }
        g.generate_code(v.cfg, 8);
        assembly = g.get_assembly(final_assembly_size);
-
-      if (assembly)
-         prog_data->base.simd8 = true;
-      c->base.last_scratch = v.last_scratch;
     }
  
     if (!assembly) {
-      vec4_vs_visitor v(brw, c, prog_data, prog, mem_ctx);
-      if (!v.run()) {
+      prog_data->base.dispatch_mode = DISPATCH_MODE_4X2_DUAL_OBJECT;
+
+      vec4_vs_visitor v(brw->intelScreen->compiler, brw, key, prog_data,
+                        vp, prog, mem_ctx, st_index,
+                        !_mesa_is_gles3(&brw->ctx));
+      if (!v.run(brw_select_clip_planes(&brw->ctx))) {
           if (prog) {
              prog->LinkStatus = false;
              ralloc_strcat(&prog->InfoLog, v.fail_msg);
@@ -1877,14 +1990,15 @@ brw_vs_emit(struct brw_context *brw,
           return NULL;
        }
  
-      vec4_generator g(brw, prog, &c->vp->program.Base, &prog_data->base,
+      vec4_generator g(brw->intelScreen->compiler, brw,
+                       prog, &vp->Base, &prog_data->base,
                         mem_ctx, INTEL_DEBUG & DEBUG_VS, "vertex", "VS");
        assembly = g.generate_assembly(v.cfg, final_assembly_size);
     }
  
     if (unlikely(brw->perf_debug) && shader) {
        if (shader->compiled_once) {
-         brw_vs_debug_recompile(brw, prog, &c->key);
+         brw_vs_debug_recompile(brw, prog, key);
        }
        if (start_busy && !drm_intel_bo_busy(brw->batch.last_bo)) {
           perf_debug("VS compile took %.03f ms and stalled the GPU\n",
@@ -1905,18 +2019,7 @@ brw_vue_setup_prog_key_for_precompile(struct gl_context *ctx,
     struct brw_context *brw = brw_context(ctx);
     key->program_string_id = id;
  
-   const bool has_shader_channel_select = brw->is_haswell || brw->gen >= 8;
-   unsigned sampler_count = _mesa_fls(prog->SamplersUsed);
-   for (unsigned i = 0; i < sampler_count; i++) {
-      if (!has_shader_channel_select && (prog->ShadowSamplers & (1 << i))) {
-         /* Assume DEPTH_TEXTURE_MODE is the default: X, X, X, 1 */
-         key->tex.swizzles[i] =
-            MAKE_SWIZZLE4(SWIZZLE_X, SWIZZLE_X, SWIZZLE_X, SWIZZLE_ONE);
-      } else {
-         /* Color sampler: assume no swizzling. */
-         key->tex.swizzles[i] = SWIZZLE_XYZW;
-      }
-   }
+   brw_setup_tex_for_precompile(brw, &key->tex, prog);
  }
  
  } /* extern "C" */