compiler: Move double_inputs to gl_program::DualSlotInputs

author Jason Ekstrand <jason.ekstrand@intel.com>

Thu, 30 Aug 2018 20:02:25 +0000 (15:02 -0500)

committer Jason Ekstrand <jason.ekstrand@intel.com>

Thu, 6 Sep 2018 21:07:50 +0000 (16:07 -0500)
author Jason Ekstrand <jason.ekstrand@intel.com>
Thu, 30 Aug 2018 20:02:25 +0000 (15:02 -0500)
committer Jason Ekstrand <jason.ekstrand@intel.com>
Thu, 6 Sep 2018 21:07:50 +0000 (16:07 -0500)
diff --git a/src/compiler/glsl/glsl_to_nir.cpp b/src/compiler/glsl/glsl_to_nir.cpp

index f38d280d406e24b1b3f515c86afbe4f97576c512..d22f4a58dd420ab5a312e5f71893f7a08992f320 100644 (file)
--- a/src/compiler/glsl/glsl_to_nir.cpp
+++ b/src/compiler/glsl/glsl_to_nir.cpp
@@ -149,8 +149,11 @@ glsl_to_nir(const struct gl_shader_program *shader_prog,
      * two locations. For instance, if we have in the IR code a dvec3 attr0 in
      * location 0 and vec4 attr1 in location 1, in NIR attr0 will use
      * locations/slots 0 and 1, and attr1 will use location/slot 2 */
-   if (shader->info.stage == MESA_SHADER_VERTEX)
-      nir_remap_attributes(shader, options);
+   if (shader->info.stage == MESA_SHADER_VERTEX) {
+      sh->Program->DualSlotInputs = nir_get_dual_slot_attributes(shader);
+      if (options->vs_inputs_dual_locations)
+         nir_remap_dual_slot_attributes(shader, sh->Program->DualSlotInputs);
+   }
  
     shader->info.name = ralloc_asprintf(shader, "GLSL%d", shader_prog->Name);
     if (shader_prog->Label)
@@ -344,15 +347,6 @@ nir_visitor::visit(ir_variable *ir)
              var->data.compact = ir->type->without_array()->is_scalar();
           }
        }
-
-      /* Mark all the locations that require two slots */
-      if (shader->info.stage == MESA_SHADER_VERTEX &&
-          glsl_type_is_dual_slot(glsl_without_array(var->type))) {
-         for (unsigned i = 0; i < glsl_count_attribute_slots(var->type, true); i++) {
-            uint64_t bitfield = BITFIELD64_BIT(var->data.location + i);
-            shader->info.vs.double_inputs |= bitfield;
-         }
-      }
        break;
  
     case ir_var_shader_out:
diff --git a/src/compiler/glsl/ir_set_program_inouts.cpp b/src/compiler/glsl/ir_set_program_inouts.cpp

index ba1e44167c3df1ab00494a50e729e4b6190e72b9..a3cb19479b8a2c7985f261c11eabda1ec59bc1a7 100644 (file)
--- a/src/compiler/glsl/ir_set_program_inouts.cpp
+++ b/src/compiler/glsl/ir_set_program_inouts.cpp
@@ -118,7 +118,7 @@ mark(struct gl_program *prog, ir_variable *var, int offset, int len,
           /* double inputs read is only for vertex inputs */
           if (stage == MESA_SHADER_VERTEX &&
               var->type->without_array()->is_dual_slot())
-            prog->info.vs.double_inputs_read |= bitfield;
+            prog->DualSlotInputs |= bitfield;
  
           if (stage == MESA_SHADER_FRAGMENT) {
              prog->info.fs.uses_sample_qualifier |= var->data.sample;
diff --git a/src/compiler/glsl/serialize.cpp b/src/compiler/glsl/serialize.cpp

index 889038fb5e2a9419fff6eb9ddacb8971da3c9c1d..267700e7e7885cb0544a28c2a483c175b7fb2f04 100644 (file)
--- a/src/compiler/glsl/serialize.cpp
+++ b/src/compiler/glsl/serialize.cpp
@@ -1035,6 +1035,7 @@ write_shader_metadata(struct blob *metadata, gl_linked_shader *shader)
     struct gl_program *glprog = shader->Program;
     unsigned i;
  
+   blob_write_uint64(metadata, glprog->DualSlotInputs);
     blob_write_bytes(metadata, glprog->TexturesUsed,
                      sizeof(glprog->TexturesUsed));
     blob_write_uint64(metadata, glprog->SamplersUsed);
@@ -1088,6 +1089,7 @@ read_shader_metadata(struct blob_reader *metadata,
  {
     unsigned i;
  
+   glprog->DualSlotInputs = blob_read_uint64(metadata);
     blob_copy_bytes(metadata, (uint8_t *) glprog->TexturesUsed,
                     sizeof(glprog->TexturesUsed));
     glprog->SamplersUsed = blob_read_uint64(metadata);
diff --git a/src/compiler/nir/nir.c b/src/compiler/nir/nir.c

index 7ae468451914ae96fb9625208382e925b466502a..0d8a554bd20106df60df70ad8a4e4929cfeaef7f 100644 (file)
--- a/src/compiler/nir/nir.c
+++ b/src/compiler/nir/nir.c
@@ -1854,23 +1854,48 @@ nir_system_value_from_intrinsic(nir_intrinsic_op intrin)
     }
  }
  
+uint64_t
+nir_get_dual_slot_attributes(nir_shader *shader)
+{
+   assert(shader->info.stage == MESA_SHADER_VERTEX);
+
+   uint64_t dual_slot = 0;
+   nir_foreach_variable(var, &shader->inputs) {
+      if (glsl_type_is_dual_slot(glsl_without_array(var->type))) {
+         unsigned slots = glsl_count_attribute_slots(var->type, true);
+         dual_slot |= BITFIELD64_MASK(slots) << var->data.location;
+      }
+   }
+
+   return dual_slot;
+}
+
  /* OpenGL utility method that remaps the location attributes if they are
   * doubles. Not needed for vulkan due the differences on the input location
   * count for doubles on vulkan vs OpenGL
   */
  void
-nir_remap_attributes(nir_shader *shader,
-                     const nir_shader_compiler_options *options)
-{
-   if (options->vs_inputs_dual_locations) {
-      nir_foreach_variable(var, &shader->inputs) {
-         var->data.location +=
-            _mesa_bitcount_64(shader->info.vs.double_inputs &
-                              BITFIELD64_MASK(var->data.location));
-      }
+nir_remap_dual_slot_attributes(nir_shader *shader, uint64_t dual_slot)
+{
+   assert(shader->info.stage == MESA_SHADER_VERTEX);
+
+   nir_foreach_variable(var, &shader->inputs) {
+      var->data.location +=
+         _mesa_bitcount_64(dual_slot & BITFIELD64_MASK(var->data.location));
     }
+}
  
-   /* Once the remap is done, reset double_inputs_read, so later it will have
-    * which location/slots are doubles */
-   shader->info.vs.double_inputs = 0;
+/* Returns an attribute mask that has been re-compacted using the given
+ * dual_slot mask.
+ */
+uint64_t
+nir_get_single_slot_attribs_mask(uint64_t attribs, uint64_t dual_slot)
+{
+   while (dual_slot) {
+      unsigned loc = u_bit_scan64(&dual_slot);
+      /* mask of all bits up to and including loc */
+      uint64_t mask = BITFIELD64_MASK(loc + 1);
+      attribs = (attribs & mask) | ((attribs & ~mask) >> 1);
+   }
+   return attribs;
  }
diff --git a/src/compiler/nir/nir.h b/src/compiler/nir/nir.h

index 169fa1fa20d8a5217aebc0396e4435142e0878ca..b93937020973d4dc6fbbf95ed2d177383e706def 100644 (file)
--- a/src/compiler/nir/nir.h
+++ b/src/compiler/nir/nir.h
@@ -3039,8 +3039,10 @@ bool nir_opt_conditional_discard(nir_shader *shader);
  
  void nir_sweep(nir_shader *shader);
  
-void nir_remap_attributes(nir_shader *shader,
-                          const nir_shader_compiler_options *options);
+uint64_t nir_get_dual_slot_attributes(nir_shader *shader);
+void nir_remap_dual_slot_attributes(nir_shader *shader,
+                                    uint64_t dual_slot);
+uint64_t nir_get_single_slot_attribs_mask(uint64_t attribs, uint64_t dual_slot);
  
  nir_intrinsic_op nir_intrinsic_from_system_value(gl_system_value val);
  gl_system_value nir_system_value_from_intrinsic(nir_intrinsic_op intrin);
diff --git a/src/compiler/nir/nir_gather_info.c b/src/compiler/nir/nir_gather_info.c

index 4a030cb6256c169db3d319be7a858f0dd4202e8b..de18c9bd78ee874493ffa58b68d300463ed6ca62 100644 (file)
--- a/src/compiler/nir/nir_gather_info.c
+++ b/src/compiler/nir/nir_gather_info.c
@@ -54,11 +54,6 @@ set_io_mask(nir_shader *shader, nir_variable *var, int offset, int len,
           else
              shader->info.inputs_read |= bitfield;
  
-         /* double inputs read is only for vertex inputs */
-         if (shader->info.stage == MESA_SHADER_VERTEX &&
-             glsl_type_is_dual_slot(glsl_without_array(var->type)))
-            shader->info.vs.double_inputs_read |= bitfield;
-
           if (shader->info.stage == MESA_SHADER_FRAGMENT) {
              shader->info.fs.uses_sample_qualifier |= var->data.sample;
           }
@@ -417,7 +412,6 @@ nir_shader_gather_info(nir_shader *shader, nir_function_impl *entrypoint)
     shader->info.system_values_read = 0;
     if (shader->info.stage == MESA_SHADER_VERTEX) {
        shader->info.vs.double_inputs = 0;
-      shader->info.vs.double_inputs_read = 0;
     }
     if (shader->info.stage == MESA_SHADER_FRAGMENT) {
        shader->info.fs.uses_sample_qualifier = false;
diff --git a/src/compiler/shader_info.h b/src/compiler/shader_info.h

index dab15b58894f6e796183c5d22cf77e66ca07934b..65bc0588d67b4a797ae7e6925b919f18ee15bbea 100644 (file)
--- a/src/compiler/shader_info.h
+++ b/src/compiler/shader_info.h
@@ -134,9 +134,6 @@ typedef struct shader_info {
        struct {
           /* Which inputs are doubles */
           uint64_t double_inputs;
-
-         /* Which inputs are actually read and are double */
-         uint64_t double_inputs_read;
        } vs;
  
        struct {
diff --git a/src/mesa/drivers/dri/i965/brw_draw_upload.c b/src/mesa/drivers/dri/i965/brw_draw_upload.c

index bc9b2566deb9331f4aa4a4302aa903c7aaf6e53f..dc3022bc417f2b4f318010baa8a35968774c83cd 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_draw_upload.c
+++ b/src/mesa/drivers/dri/i965/brw_draw_upload.c
@@ -29,6 +29,7 @@
  #include "main/enums.h"
  #include "main/macros.h"
  #include "main/glformats.h"
+#include "nir.h"
  
  #include "brw_draw.h"
  #include "brw_defines.h"
@@ -454,10 +455,14 @@ brw_prepare_vertices(struct brw_context *brw)
  {
     const struct gen_device_info *devinfo = &brw->screen->devinfo;
     struct gl_context *ctx = &brw->ctx;
+   /* BRW_NEW_VERTEX_PROGRAM */
+   const struct gl_program *vp = brw->programs[MESA_SHADER_VERTEX];
     /* BRW_NEW_VS_PROG_DATA */
     const struct brw_vs_prog_data *vs_prog_data =
        brw_vs_prog_data(brw->vs.base.prog_data);
-   GLbitfield64 vs_inputs = vs_prog_data->inputs_read;
+   GLbitfield64 vs_inputs =
+      nir_get_single_slot_attribs_mask(vs_prog_data->inputs_read,
+                                       vp->DualSlotInputs);
     const unsigned char *ptr = NULL;
     GLuint interleaved = 0;
     unsigned int min_index = brw->vb.min_index + brw->basevertex;
@@ -486,16 +491,12 @@ brw_prepare_vertices(struct brw_context *brw)
     /* Accumulate the list of enabled arrays. */
     brw->vb.nr_enabled = 0;
     while (vs_inputs) {
-      GLuint first = ffsll(vs_inputs) - 1;
-      assert (first < 64);
-      GLuint index =
-         first - DIV_ROUND_UP(_mesa_bitcount_64(vs_prog_data->double_inputs_read &
-                                                BITFIELD64_MASK(first)), 2);
+      const unsigned index = ffsll(vs_inputs) - 1;
+      assert(index < 64);
+
        struct brw_vertex_element *input = &brw->vb.inputs[index];
-      input->is_dual_slot = (vs_prog_data->double_inputs_read & BITFIELD64_BIT(first)) != 0;
-      vs_inputs &= ~BITFIELD64_BIT(first);
-      if (input->is_dual_slot)
-         vs_inputs &= ~BITFIELD64_BIT(first + 1);
+      input->is_dual_slot = (vp->DualSlotInputs & BITFIELD64_BIT(index)) != 0;
+      vs_inputs &= ~BITFIELD64_BIT(index);
        brw->vb.enabled[brw->vb.nr_enabled++] = input;
     }
  
diff --git a/src/mesa/drivers/dri/i965/genX_state_upload.c b/src/mesa/drivers/dri/i965/genX_state_upload.c

index 09a42e44b08964a30da503f827f175ef1fa0e409..740cb0c4d2edc41842aa37866795ff7f78ddab7c 100644 (file)
--- a/src/mesa/drivers/dri/i965/genX_state_upload.c
+++ b/src/mesa/drivers/dri/i965/genX_state_upload.c
@@ -933,6 +933,7 @@ static const struct brw_tracked_state genX(vertices) = {
        .mesa = _NEW_POLYGON,
        .brw = BRW_NEW_BATCH |
               BRW_NEW_BLORP |
+             BRW_NEW_VERTEX_PROGRAM |
               BRW_NEW_VERTICES |
               BRW_NEW_VS_PROG_DATA,
     },
diff --git a/src/mesa/main/glspirv.c b/src/mesa/main/glspirv.c

index 1c5b7dd17f3df1f6b9ed47475ee6fdea987d6372..c53fe0bd07c8d9b6ec83113408cb6792a2794fe2 100644 (file)
--- a/src/mesa/main/glspirv.c
+++ b/src/mesa/main/glspirv.c
@@ -182,20 +182,6 @@ _mesa_spirv_link_shaders(struct gl_context *ctx, struct gl_shader_program *prog)
        prog->last_vert_prog = prog->_LinkedShaders[last_vert_stage - 1]->Program;
  }
  
-static void
-nir_compute_double_inputs(nir_shader *shader,
-                          const nir_shader_compiler_options *options)
-{
-   nir_foreach_variable(var, &shader->inputs) {
-      if (glsl_type_is_dual_slot(glsl_without_array(var->type))) {
-         for (unsigned i = 0; i < glsl_count_attribute_slots(var->type, true); i++) {
-            uint64_t bitfield = BITFIELD64_BIT(var->data.location + i);
-            shader->info.vs.double_inputs |= bitfield;
-         }
-      }
-   }
-}
-
  nir_shader *
  _mesa_spirv_to_nir(struct gl_context *ctx,
                     const struct gl_shader_program *prog,
@@ -278,8 +264,10 @@ _mesa_spirv_to_nir(struct gl_context *ctx,
     NIR_PASS_V(nir, nir_split_per_member_structs);
  
     if (nir->info.stage == MESA_SHADER_VERTEX) {
-      nir_compute_double_inputs(nir, options);
-      nir_remap_attributes(nir, options);
+      uint64_t dual_slot_inputs = nir_get_dual_slot_attributes(nir);
+      if (options->vs_inputs_dual_locations)
+         nir_remap_dual_slot_attributes(nir, dual_slot_inputs);
+      linked_shader->Program->DualSlotInputs = dual_slot_inputs;
     }
  
     return nir;
diff --git a/src/mesa/main/mtypes.h b/src/mesa/main/mtypes.h

index 5ff0d3227a85738b6c1ffe6dd345afb50f64a73e..9ed49b7ff24c1a873ea631ad1eee731035e85d2e 100644 (file)
--- a/src/mesa/main/mtypes.h
+++ b/src/mesa/main/mtypes.h
@@ -2066,6 +2066,21 @@ struct gl_program
     /** Is this program written to on disk shader cache */
     bool program_written_to_cache;
  
+   /** A bitfield indicating which vertex shader inputs consume two slots
+    *
+    * This is used for mapping from single-slot input locations in the GL API
+    * to dual-slot double input locations in the shader.  This field is set
+    * once as part of linking and never updated again to ensure the mapping
+    * remains consistent.
+    *
+    * Note: There may be dual-slot variables in the original shader source
+    * which do not appear in this bitfield due to having been eliminated by
+    * the compiler prior to DualSlotInputs being calculated.  There may also
+    * be bits set in this bitfield which are set but which the shader never
+    * reads due to compiler optimizations eliminating such variables after
+    * DualSlotInputs is calculated.
+    */
+   GLbitfield64 DualSlotInputs;
     /** Subset of OutputsWritten outputs written with non-zero index. */
     GLbitfield64 SecondaryOutputsWritten;
     /** TEXTURE_x_BIT bitmask */
diff --git a/src/mesa/state_tracker/st_glsl_to_nir.cpp b/src/mesa/state_tracker/st_glsl_to_nir.cpp

index ae2c49960c9b39c8b2172872b228b51ccef5d150..0ee9bd9fef1f6e906c23056bb7d05efa1e864372 100644 (file)
--- a/src/mesa/state_tracker/st_glsl_to_nir.cpp
+++ b/src/mesa/state_tracker/st_glsl_to_nir.cpp
@@ -91,7 +91,7 @@ st_nir_assign_vs_in_locations(struct gl_program *prog, nir_shader *nir)
        if ((prog->info.inputs_read & BITFIELD64_BIT(attr)) != 0) {
           input_to_index[attr] = num_inputs;
           num_inputs++;
-         if ((prog->info.vs.double_inputs_read & BITFIELD64_BIT(attr)) != 0) {
+         if ((prog->DualSlotInputs & BITFIELD64_BIT(attr)) != 0) {
              /* add placeholder for second part of a double attribute */
              num_inputs++;
           }
diff --git a/src/mesa/state_tracker/st_glsl_to_tgsi.cpp b/src/mesa/state_tracker/st_glsl_to_tgsi.cpp

index 68573f628db84f7a119af3a40705095d17368c73..ffaaeff77a5c2c4c7480828148c28f7bec33babd 100644 (file)
--- a/src/mesa/state_tracker/st_glsl_to_tgsi.cpp
+++ b/src/mesa/state_tracker/st_glsl_to_tgsi.cpp
@@ -7129,7 +7129,7 @@ get_mesa_program_tgsi(struct gl_context *ctx,
     _mesa_copy_linked_program_data(shader_program, shader);
     shrink_array_declarations(v->inputs, v->num_inputs,
                               &prog->info.inputs_read,
-                             prog->info.vs.double_inputs_read,
+                             prog->DualSlotInputs,
                               &prog->info.patch_inputs_read);
     shrink_array_declarations(v->outputs, v->num_outputs,
                               &prog->info.outputs_written, 0ULL,
diff --git a/src/mesa/state_tracker/st_program.c b/src/mesa/state_tracker/st_program.c

index 8117f4ff8dbb24280066300390dcbeedc7ceba15..af86c47b9459b3ae01bf12bceb33c48b6cd84b71 100644 (file)
--- a/src/mesa/state_tracker/st_program.c
+++ b/src/mesa/state_tracker/st_program.c
@@ -406,8 +406,7 @@ st_translate_vertex_program(struct st_context *st,
           stvp->input_to_index[attr] = stvp->num_inputs;
           stvp->index_to_input[stvp->num_inputs] = attr;
           stvp->num_inputs++;
-         if ((stvp->Base.info.vs.double_inputs_read &
-              BITFIELD64_BIT(attr)) != 0) {
+         if ((stvp->Base.DualSlotInputs & BITFIELD64_BIT(attr)) != 0) {
              /* add placeholder for second part of a double attribute */
              stvp->index_to_input[stvp->num_inputs] = ST_DOUBLE_ATTRIB_PLACEHOLDER;
              stvp->num_inputs++;
author	Jason Ekstrand <jason.ekstrand@intel.com>
	Thu, 30 Aug 2018 20:02:25 +0000 (15:02 -0500)
committer	Jason Ekstrand <jason.ekstrand@intel.com>
	Thu, 6 Sep 2018 21:07:50 +0000 (16:07 -0500)
src/compiler/glsl/glsl_to_nir.cpp		patch \| blob \| history
src/compiler/glsl/ir_set_program_inouts.cpp		patch \| blob \| history
src/compiler/glsl/serialize.cpp		patch \| blob \| history
src/compiler/nir/nir.c		patch \| blob \| history
src/compiler/nir/nir.h		patch \| blob \| history
src/compiler/nir/nir_gather_info.c		patch \| blob \| history
src/compiler/shader_info.h		patch \| blob \| history
src/mesa/drivers/dri/i965/brw_draw_upload.c		patch \| blob \| history
src/mesa/drivers/dri/i965/genX_state_upload.c		patch \| blob \| history
src/mesa/main/glspirv.c		patch \| blob \| history
src/mesa/main/mtypes.h		patch \| blob \| history
src/mesa/state_tracker/st_glsl_to_nir.cpp		patch \| blob \| history
src/mesa/state_tracker/st_glsl_to_tgsi.cpp		patch \| blob \| history
src/mesa/state_tracker/st_program.c		patch \| blob \| history