mesa: Rename MESA_shader_framebuffer_fetch gl_extensions bits to EXT.

[mesa.git] / src / mesa / drivers / dri / i965 / brw_program.c
diff --git a/src/mesa/drivers/dri/i965/brw_program.c b/src/mesa/drivers/dri/i965/brw_program.c

index be839ab38a272f75a426160768c087195e96359e..527f003977b0590e1963e900239bc23e7c00bf7a 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_program.c
+++ b/src/mesa/drivers/dri/i965/brw_program.c
@@ -88,8 +88,34 @@ brw_create_nir(struct brw_context *brw,
     }
     nir_validate_shader(nir);
  
+   /* Lower PatchVerticesIn from system value to uniform. This needs to
+    * happen before brw_preprocess_nir, since that will lower system values
+    * to intrinsics.
+    *
+    * We only do this for TES if no TCS is present, since otherwise we know
+    * the number of vertices in the patch at link time and we can lower it
+    * directly to a constant. We do this in nir_lower_patch_vertices, which
+    * needs to run after brw_nir_preprocess has turned the system values
+    * into intrinsics.
+    */
+   const bool lower_patch_vertices_in_to_uniform =
+      (stage == MESA_SHADER_TESS_CTRL && brw->screen->devinfo.gen >= 8) ||
+      (stage == MESA_SHADER_TESS_EVAL &&
+       !shader_prog->_LinkedShaders[MESA_SHADER_TESS_CTRL]);
+
+   if (lower_patch_vertices_in_to_uniform)
+      brw_nir_lower_patch_vertices_in_to_uniform(nir);
+
     nir = brw_preprocess_nir(brw->screen->compiler, nir);
  
+   if (stage == MESA_SHADER_TESS_EVAL && !lower_patch_vertices_in_to_uniform) {
+      assert(shader_prog->_LinkedShaders[MESA_SHADER_TESS_CTRL]);
+      struct gl_linked_shader *linked_tcs =
+         shader_prog->_LinkedShaders[MESA_SHADER_TESS_CTRL];
+      uint32_t patch_vertices = linked_tcs->Program->info.tess.tcs_vertices_out;
+      nir_lower_tes_patch_vertices(nir, patch_vertices);
+   }
+
     if (stage == MESA_SHADER_FRAGMENT) {
        static const struct nir_lower_wpos_ytransform_options wpos_options = {
           .state_tokens = {STATE_INTERNAL, STATE_FB_WPOS_Y_TRANSFORM, 0, 0, 0},
@@ -101,7 +127,7 @@ brw_create_nir(struct brw_context *brw,
        NIR_PASS(progress, nir, nir_lower_wpos_ytransform, &wpos_options);
        if (progress) {
           _mesa_add_state_reference(prog->Parameters,
-                                   (gl_state_index *) wpos_options.state_tokens);
+                                   wpos_options.state_tokens);
        }
     }
  
@@ -254,7 +280,7 @@ brw_memory_barrier(struct gl_context *ctx, GLbitfield barriers)
     unsigned bits = (PIPE_CONTROL_DATA_CACHE_FLUSH |
                      PIPE_CONTROL_NO_WRITE |
                      PIPE_CONTROL_CS_STALL);
-   assert(devinfo->gen >= 7 && devinfo->gen <= 10);
+   assert(devinfo->gen >= 7 && devinfo->gen <= 11);
  
     if (barriers & (GL_VERTEX_ATTRIB_ARRAY_BARRIER_BIT |
                     GL_ELEMENT_ARRAY_BARRIER_BIT |
@@ -287,12 +313,12 @@ brw_memory_barrier(struct gl_context *ctx, GLbitfield barriers)
  }
  
  static void
-brw_blend_barrier(struct gl_context *ctx)
+brw_framebuffer_fetch_barrier(struct gl_context *ctx)
  {
     struct brw_context *brw = brw_context(ctx);
     const struct gen_device_info *devinfo = &brw->screen->devinfo;
  
-   if (!ctx->Extensions.MESA_shader_framebuffer_fetch) {
+   if (!ctx->Extensions.EXT_shader_framebuffer_fetch) {
        if (devinfo->gen >= 6) {
           brw_emit_pipe_control_flush(brw,
                                       PIPE_CONTROL_RENDER_TARGET_FLUSH |
@@ -368,9 +394,13 @@ brw_alloc_stage_scratch(struct brw_context *brw,
         *
         * According to the other driver team, this applies to compute shaders
         * as well.  This is not currently documented at all.
+       *
+       * brw->screen->subslice_total is the TOTAL number of subslices
+       * and we wish to view that there are 4 subslices per slice
+       * instead of the actual number of subslices per slice.
         */
        if (devinfo->gen >= 9)
-         subslices = 4;
+         subslices = 4 * brw->screen->devinfo.num_slices;
  
        /* WaCSScratchSize:hsw
         *
@@ -413,7 +443,7 @@ void brwInitFragProgFuncs( struct dd_function_table *functions )
     functions->LinkShader = brw_link_shader;
  
     functions->MemoryBarrier = brw_memory_barrier;
-   functions->BlendBarrier = brw_blend_barrier;
+   functions->FramebufferFetchBarrier = brw_framebuffer_fetch_barrier;
  }
  
  struct shader_times {
@@ -796,6 +826,7 @@ brw_program_serialize_nir(struct gl_context *ctx, struct gl_program *prog)
     prog->driver_cache_blob = ralloc_size(NULL, writer.size);
     memcpy(prog->driver_cache_blob, writer.data, writer.size);
     prog->driver_cache_blob_size = writer.size;
+   blob_finish(&writer);
  }
  
  void