i965: Explicitely handle swizzles for MESA_FORMAT_R_SRGB8

[mesa.git] / src / mesa / drivers / dri / i965 / brw_wm_surface_state.c
diff --git a/src/mesa/drivers/dri/i965/brw_wm_surface_state.c b/src/mesa/drivers/dri/i965/brw_wm_surface_state.c

index b62d1e22a129e6f0eba0723b42cc43ec9b664e76..4daa0e2add1380cae252098d67c8d262af7bbbbd 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_wm_surface_state.c
+++ b/src/mesa/drivers/dri/i965/brw_wm_surface_state.c
@@ -55,20 +55,28 @@
  #include "brw_defines.h"
  #include "brw_wm.h"
  
-uint32_t tex_mocs[] = {
+uint32_t wb_mocs[] = {
     [7] = GEN7_MOCS_L3,
     [8] = BDW_MOCS_WB,
     [9] = SKL_MOCS_WB,
     [10] = CNL_MOCS_WB,
+   [11] = ICL_MOCS_WB,
  };
  
-uint32_t rb_mocs[] = {
+uint32_t pte_mocs[] = {
     [7] = GEN7_MOCS_L3,
     [8] = BDW_MOCS_PTE,
     [9] = SKL_MOCS_PTE,
     [10] = CNL_MOCS_PTE,
+   [11] = ICL_MOCS_PTE,
  };
  
+uint32_t
+brw_get_bo_mocs(const struct gen_device_info *devinfo, struct brw_bo *bo)
+{
+   return (bo && bo->external ? pte_mocs : wb_mocs)[devinfo->gen];
+}
+
  static void
  get_isl_surf(struct brw_context *brw, struct intel_mipmap_tree *mt,
               GLenum target, struct isl_view *view,
@@ -81,6 +89,8 @@ get_isl_surf(struct brw_context *brw, struct intel_mipmap_tree *mt,
     const enum isl_dim_layout dim_layout =
        get_isl_dim_layout(devinfo, mt->surf.tiling, target);
  
+   surf->dim = get_isl_surf_dim(target);
+
     if (surf->dim_layout == dim_layout)
        return;
  
@@ -128,9 +138,10 @@ brw_emit_surface_state(struct brw_context *brw,
                         struct intel_mipmap_tree *mt,
                         GLenum target, struct isl_view view,
                         enum isl_aux_usage aux_usage,
-                       uint32_t mocs, uint32_t *surf_offset, int surf_index,
+                       uint32_t *surf_offset, int surf_index,
                         unsigned reloc_flags)
  {
+   const struct gen_device_info *devinfo = &brw->screen->devinfo;
     uint32_t tile_x = mt->level[0].level_x;
     uint32_t tile_y = mt->level[0].level_y;
     uint32_t offset = mt->offset;
@@ -141,33 +152,24 @@ brw_emit_surface_state(struct brw_context *brw,
  
     union isl_color_value clear_color = { .u32 = { 0, 0, 0, 0 } };
  
-   struct brw_bo *aux_bo;
+   struct brw_bo *aux_bo = NULL;
     struct isl_surf *aux_surf = NULL;
     uint64_t aux_offset = 0;
-   switch (aux_usage) {
-   case ISL_AUX_USAGE_MCS:
-   case ISL_AUX_USAGE_CCS_D:
-   case ISL_AUX_USAGE_CCS_E:
-      aux_surf = &mt->mcs_buf->surf;
-      aux_bo = mt->mcs_buf->bo;
-      aux_offset = mt->mcs_buf->offset;
-      break;
-
-   case ISL_AUX_USAGE_HIZ:
-      aux_surf = &mt->hiz_buf->surf;
-      aux_bo = mt->hiz_buf->bo;
-      aux_offset = 0;
-      break;
-
-   case ISL_AUX_USAGE_NONE:
-      break;
-   }
+   struct brw_bo *clear_bo = NULL;
+   uint32_t clear_offset = 0;
  
     if (aux_usage != ISL_AUX_USAGE_NONE) {
+      aux_surf = &mt->aux_buf->surf;
+      aux_bo = mt->aux_buf->bo;
+      aux_offset = mt->aux_buf->offset;
+
        /* We only really need a clear color if we also have an auxiliary
         * surface.  Without one, it does nothing.
         */
-      clear_color = mt->fast_clear_color;
+      clear_color =
+         intel_miptree_get_clear_color(devinfo, mt, view.format,
+                                       view.usage & ISL_SURF_USAGE_TEXTURE_BIT,
+                                       &clear_bo, &clear_offset);
     }
  
     void *state = brw_state_batch(brw,
@@ -175,13 +177,16 @@ brw_emit_surface_state(struct brw_context *brw,
                                   brw->isl_dev.ss.align,
                                   surf_offset);
  
-   isl_surf_fill_state(&brw->isl_dev, state, .surf = &mt->surf, .view = &view,
+   isl_surf_fill_state(&brw->isl_dev, state, .surf = &surf, .view = &view,
                         .address = brw_state_reloc(&brw->batch,
                                                    *surf_offset + brw->isl_dev.ss.addr_offset,
                                                    mt->bo, offset, reloc_flags),
                         .aux_surf = aux_surf, .aux_usage = aux_usage,
                         .aux_address = aux_offset,
-                       .mocs = mocs, .clear_color = clear_color,
+                       .mocs = brw_get_bo_mocs(devinfo, mt->bo),
+                       .clear_color = clear_color,
+                       .use_clear_address = clear_bo != NULL,
+                       .clear_address = clear_offset,
                         .x_offset_sa = tile_x, .y_offset_sa = tile_y);
     if (aux_surf) {
        /* On gen7 and prior, the upper 20 bits of surface state DWORD 6 are the
@@ -193,12 +198,34 @@ brw_emit_surface_state(struct brw_context *brw,
         * FIXME: move to the point of assignment.
         */
        assert((aux_offset & 0xfff) == 0);
-      uint32_t *aux_addr = state + brw->isl_dev.ss.aux_addr_offset;
-      *aux_addr = brw_state_reloc(&brw->batch,
-                                  *surf_offset +
-                                  brw->isl_dev.ss.aux_addr_offset,
-                                  aux_bo, *aux_addr,
-                                  reloc_flags);
+
+      if (devinfo->gen >= 8) {
+         uint64_t *aux_addr = state + brw->isl_dev.ss.aux_addr_offset;
+         *aux_addr = brw_state_reloc(&brw->batch,
+                                     *surf_offset +
+                                     brw->isl_dev.ss.aux_addr_offset,
+                                     aux_bo, *aux_addr,
+                                     reloc_flags);
+      } else {
+         uint32_t *aux_addr = state + brw->isl_dev.ss.aux_addr_offset;
+         *aux_addr = brw_state_reloc(&brw->batch,
+                                     *surf_offset +
+                                     brw->isl_dev.ss.aux_addr_offset,
+                                     aux_bo, *aux_addr,
+                                     reloc_flags);
+
+      }
+   }
+
+   if (clear_bo != NULL) {
+      /* Make sure the offset is aligned with a cacheline. */
+      assert((clear_offset & 0x3f) == 0);
+      uint64_t *clear_address =
+            state + brw->isl_dev.ss.clear_color_state_offset;
+      *clear_address = brw_state_reloc(&brw->batch,
+                                       *surf_offset +
+                                       brw->isl_dev.ss.clear_color_state_offset,
+                                       clear_bo, *clear_address, reloc_flags);
     }
  }
  
@@ -208,16 +235,10 @@ gen6_update_renderbuffer_surface(struct brw_context *brw,
                                   unsigned unit,
                                   uint32_t surf_index)
  {
-   const struct gen_device_info *devinfo = &brw->screen->devinfo;
     struct gl_context *ctx = &brw->ctx;
     struct intel_renderbuffer *irb = intel_renderbuffer(rb);
     struct intel_mipmap_tree *mt = irb->mt;
  
-   enum isl_aux_usage aux_usage =
-      brw->draw_aux_buffer_disabled[unit] ? ISL_AUX_USAGE_NONE :
-      intel_miptree_render_aux_usage(brw, mt, ctx->Color.sRGBEnabled,
-                                     ctx->Color.BlendEnabled & (1 << unit));
-
     assert(brw_render_target_supported(brw, rb));
  
     mesa_format rb_format = _mesa_get_render_format(ctx, intel_rb_format(irb));
@@ -225,9 +246,10 @@ gen6_update_renderbuffer_surface(struct brw_context *brw,
        _mesa_problem(ctx, "%s: renderbuffer format %s unsupported\n",
                      __func__, _mesa_get_format_name(rb_format));
     }
+   enum isl_format isl_format = brw->mesa_to_isl_render_format[rb_format];
  
     struct isl_view view = {
-      .format = brw->mesa_to_isl_render_format[rb_format],
+      .format = isl_format,
        .base_level = irb->mt_level - irb->mt->first_level,
        .levels = 1,
        .base_array_layer = irb->mt_layer,
@@ -237,8 +259,8 @@ gen6_update_renderbuffer_surface(struct brw_context *brw,
     };
  
     uint32_t offset;
-   brw_emit_surface_state(brw, mt, mt->target, view, aux_usage,
-                          rb_mocs[devinfo->gen],
+   brw_emit_surface_state(brw, mt, mt->target, view,
+                          brw->draw_aux_usage[unit],
                            &offset, surf_index,
                            RELOC_WRITE);
     return offset;
@@ -398,6 +420,14 @@ brw_get_texture_swizzle(const struct gl_context *ctx,
        }
        break;
     case GL_RED:
+      if (img->TexFormat == MESA_FORMAT_R_SRGB8) {
+         swizzles[0] = SWIZZLE_X;
+         swizzles[1] = SWIZZLE_ZERO;
+         swizzles[2] = SWIZZLE_ZERO;
+         swizzles[3] = SWIZZLE_ONE;
+         break;
+      }
+      /* fallthrough */
     case GL_RG:
     case GL_RGB:
        if (_mesa_get_format_bits(img->TexFormat, GL_ALPHA_BITS) > 0 ||
@@ -434,25 +464,7 @@ swizzle_to_scs(GLenum swizzle, bool need_green_to_blue)
     return (need_green_to_blue && scs == HSW_SCS_GREEN) ? HSW_SCS_BLUE : scs;
  }
  
-static bool
-brw_aux_surface_disabled(const struct brw_context *brw,
-                         const struct intel_mipmap_tree *mt)
-{
-   const struct gl_framebuffer *fb = brw->ctx.DrawBuffer;
-
-   for (unsigned i = 0; i < fb->_NumColorDrawBuffers; i++) {
-      const struct intel_renderbuffer *irb =
-         intel_renderbuffer(fb->_ColorDrawBuffers[i]);
-
-      if (irb && irb->mt == mt)
-         return brw->draw_aux_buffer_disabled[i];
-   }
-
-   return false;
-}
-
-static void
-brw_update_texture_surface(struct gl_context *ctx,
+static void brw_update_texture_surface(struct gl_context *ctx,
                             unsigned unit,
                             uint32_t *surf_offset,
                             bool for_gather,
@@ -500,7 +512,21 @@ brw_update_texture_surface(struct gl_context *ctx,
        const unsigned swizzle = (unlikely(alpha_depth) ? SWIZZLE_XYZW :
                                  brw_get_texture_swizzle(&brw->ctx, obj));
  
-      mesa_format mesa_fmt = plane == 0 ? intel_obj->_Format : mt->format;
+      mesa_format mesa_fmt;
+      if (firstImage->_BaseFormat == GL_DEPTH_STENCIL ||
+          firstImage->_BaseFormat == GL_DEPTH_COMPONENT) {
+         /* The format from intel_obj may be a combined depth stencil format
+          * when we just want depth.  Pull it from the miptree instead.  This
+          * is safe because texture views aren't allowed on depth/stencil.
+          */
+         mesa_fmt = mt->format;
+      } else if (mt->etc_format != MESA_FORMAT_NONE) {
+         mesa_fmt = mt->format;
+      } else if (plane > 0) {
+         mesa_fmt = mt->format;
+      } else {
+         mesa_fmt = intel_obj->_Format;
+      }
        enum isl_format format = translate_tex_format(brw, mesa_fmt,
                                                      for_txf ? GL_DECODE_EXT :
                                                      sampler->sRGBDecode);
@@ -574,18 +600,21 @@ brw_update_texture_surface(struct gl_context *ctx,
           .usage = ISL_SURF_USAGE_TEXTURE_BIT,
        };
  
+      /* On Ivy Bridge and earlier, we handle texture swizzle with shader
+       * code.  The actual surface swizzle should be identity.
+       */
+      if (devinfo->gen <= 7 && !devinfo->is_haswell)
+         view.swizzle = ISL_SWIZZLE_IDENTITY;
+
        if (obj->Target == GL_TEXTURE_CUBE_MAP ||
            obj->Target == GL_TEXTURE_CUBE_MAP_ARRAY)
           view.usage |= ISL_SURF_USAGE_CUBE_BIT;
  
        enum isl_aux_usage aux_usage =
-         intel_miptree_texture_aux_usage(brw, mt, format);
-
-      if (brw_aux_surface_disabled(brw, mt))
-         aux_usage = ISL_AUX_USAGE_NONE;
+         intel_miptree_texture_aux_usage(brw, mt, format,
+                                         brw->gen9_astc5x5_wa_tex_mask);
  
        brw_emit_surface_state(brw, mt, mt->target, view, aux_usage,
-                             tex_mocs[devinfo->gen],
                               surf_offset, surf_index,
                               0);
     }
@@ -613,32 +642,21 @@ brw_emit_buffer_surface_state(struct brw_context *brw,
                                                      *out_offset + brw->isl_dev.ss.addr_offset,
                                                      bo, buffer_offset,
                                                      reloc_flags),
-                         .size = buffer_size,
+                         .size_B = buffer_size,
                           .format = surface_format,
-                         .stride = pitch,
-                         .mocs = tex_mocs[devinfo->gen]);
+                         .stride_B = pitch,
+                         .mocs = brw_get_bo_mocs(devinfo, bo));
  }
  
-void
-brw_update_buffer_texture_surface(struct gl_context *ctx,
-                                  unsigned unit,
-                                  uint32_t *surf_offset)
+static unsigned
+buffer_texture_range_size(struct brw_context *brw,
+                          struct gl_texture_object *obj)
  {
-   struct brw_context *brw = brw_context(ctx);
-   struct gl_texture_object *tObj = ctx->Texture.Unit[unit]._Current;
-   struct intel_buffer_object *intel_obj =
-      intel_buffer_object(tObj->BufferObject);
-   uint32_t size = tObj->BufferSize;
-   struct brw_bo *bo = NULL;
-   mesa_format format = tObj->_BufferObjectFormat;
-   const enum isl_format isl_format = brw_isl_format_for_mesa_format(format);
-   int texel_size = _mesa_get_format_bytes(format);
-
-   if (intel_obj) {
-      size = MIN2(size, intel_obj->Base.Size);
-      bo = intel_bufferobj_buffer(brw, intel_obj, tObj->BufferOffset, size,
-                                  false);
-   }
+   assert(obj->Target == GL_TEXTURE_BUFFER);
+   const unsigned texel_size = _mesa_get_format_bytes(obj->_BufferObjectFormat);
+   const unsigned buffer_size = (!obj->BufferObject ? 0 :
+                                 obj->BufferObject->Size);
+   const unsigned buffer_offset = MIN2(buffer_size, obj->BufferOffset);
  
     /* The ARB_texture_buffer_specification says:
      *
@@ -656,7 +674,29 @@ brw_update_buffer_texture_surface(struct gl_context *ctx,
      * so that when ISL divides by stride to obtain the number of texels, that
      * texel count is clamped to MAX_TEXTURE_BUFFER_SIZE.
      */
-   size = MIN2(size, ctx->Const.MaxTextureBufferSize * (unsigned) texel_size);
+   return MIN3((unsigned)obj->BufferSize,
+               buffer_size - buffer_offset,
+               brw->ctx.Const.MaxTextureBufferSize * texel_size);
+}
+
+void
+brw_update_buffer_texture_surface(struct gl_context *ctx,
+                                  unsigned unit,
+                                  uint32_t *surf_offset)
+{
+   struct brw_context *brw = brw_context(ctx);
+   struct gl_texture_object *tObj = ctx->Texture.Unit[unit]._Current;
+   struct intel_buffer_object *intel_obj =
+      intel_buffer_object(tObj->BufferObject);
+   const unsigned size = buffer_texture_range_size(brw, tObj);
+   struct brw_bo *bo = NULL;
+   mesa_format format = tObj->_BufferObjectFormat;
+   const enum isl_format isl_format = brw_isl_format_for_mesa_format(format);
+   int texel_size = _mesa_get_format_bytes(format);
+
+   if (intel_obj)
+      bo = intel_bufferobj_buffer(brw, intel_obj, tObj->BufferOffset, size,
+                                  false);
  
     if (isl_format == ISL_FORMAT_UNSUPPORTED) {
        _mesa_problem(NULL, "bad format %s for texture buffer\n",
@@ -671,44 +711,6 @@ brw_update_buffer_texture_surface(struct gl_context *ctx,
                                   0);
  }
  
-/**
- * Create the constant buffer surface.  Vertex/fragment shader constants will be
- * read from this buffer with Data Port Read instructions/messages.
- */
-void
-brw_create_constant_surface(struct brw_context *brw,
-                           struct brw_bo *bo,
-                           uint32_t offset,
-                           uint32_t size,
-                           uint32_t *out_offset)
-{
-   brw_emit_buffer_surface_state(brw, out_offset, bo, offset,
-                                 ISL_FORMAT_R32G32B32A32_FLOAT,
-                                 size, 1, 0);
-}
-
-/**
- * Create the buffer surface. Shader buffer variables will be
- * read from / write to this buffer with Data Port Read/Write
- * instructions/messages.
- */
-void
-brw_create_buffer_surface(struct brw_context *brw,
-                          struct brw_bo *bo,
-                          uint32_t offset,
-                          uint32_t size,
-                          uint32_t *out_offset)
-{
-   /* Use a raw surface so we can reuse existing untyped read/write/atomic
-    * messages. We need these specifically for the fragment shader since they
-    * include a pixel mask header that we need to ensure correct behavior
-    * with helper invocations, which cannot write to the buffer.
-    */
-   brw_emit_buffer_surface_state(brw, out_offset, bo, offset,
-                                 ISL_FORMAT_RAW,
-                                 size, 1, RELOC_WRITE);
-}
-
  /**
   * Set up a binding table entry for use by stream output logic (transform
   * feedback).
@@ -955,7 +957,7 @@ gen4_update_renderbuffer_surface(struct brw_context *brw,
               (rb->Height - 1) << BRW_SURFACE_HEIGHT_SHIFT);
  
     surf[3] = (brw_get_surface_tiling_bits(mt->surf.tiling) |
-             (mt->surf.row_pitch - 1) << BRW_SURFACE_PITCH_SHIFT);
+             (mt->surf.row_pitch_B - 1) << BRW_SURFACE_PITCH_SHIFT);
  
     surf[4] = brw_get_surface_num_multisamples(mt->surf.samples);
  
@@ -976,18 +978,18 @@ gen4_update_renderbuffer_surface(struct brw_context *brw,
            (ctx->Color.BlendEnabled & (1 << unit)))
          surf[0] |= BRW_SURFACE_BLEND_ENABLED;
  
-      if (!ctx->Color.ColorMask[unit][0])
+      if (!GET_COLORMASK_BIT(ctx->Color.ColorMask, unit, 0))
          surf[0] |= 1 << BRW_SURFACE_WRITEDISABLE_R_SHIFT;
-      if (!ctx->Color.ColorMask[unit][1])
+      if (!GET_COLORMASK_BIT(ctx->Color.ColorMask, unit, 1))
          surf[0] |= 1 << BRW_SURFACE_WRITEDISABLE_G_SHIFT;
-      if (!ctx->Color.ColorMask[unit][2])
+      if (!GET_COLORMASK_BIT(ctx->Color.ColorMask, unit, 2))
          surf[0] |= 1 << BRW_SURFACE_WRITEDISABLE_B_SHIFT;
  
        /* As mentioned above, disable writes to the alpha component when the
         * renderbuffer is XRGB.
         */
        if (ctx->DrawBuffer->Visual.alphaBits == 0 ||
-         !ctx->Color.ColorMask[unit][3]) {
+         !GET_COLORMASK_BIT(ctx->Color.ColorMask, unit, 3)) {
          surf[0] |= 1 << BRW_SURFACE_WRITEDISABLE_A_SHIFT;
        }
     }
@@ -1026,6 +1028,20 @@ update_renderbuffer_surfaces(struct brw_context *brw)
        emit_null_surface_state(brw, fb, &surf_offsets[rt_start]);
     }
  
+   /* The PIPE_CONTROL command description says:
+    *
+    * "Whenever a Binding Table Index (BTI) used by a Render Taget Message
+    *  points to a different RENDER_SURFACE_STATE, SW must issue a Render
+    *  Target Cache Flush by enabling this bit. When render target flush
+    *  is set due to new association of BTI, PS Scoreboard Stall bit must
+    *  be set in this packet."
+   */
+   if (devinfo->gen >= 11) {
+      brw_emit_pipe_control_flush(brw,
+                                  PIPE_CONTROL_RENDER_TARGET_FLUSH |
+                                  PIPE_CONTROL_STALL_AT_SCOREBOARD);
+   }
+
     brw->ctx.NewDriverState |= BRW_NEW_SURFACES;
  }
  
@@ -1050,7 +1066,6 @@ const struct brw_tracked_state gen6_renderbuffer_surfaces = {
  static void
  update_renderbuffer_read_surfaces(struct brw_context *brw)
  {
-   const struct gen_device_info *devinfo = &brw->screen->devinfo;
     const struct gl_context *ctx = &brw->ctx;
  
     /* BRW_NEW_FS_PROG_DATA */
@@ -1058,7 +1073,7 @@ update_renderbuffer_read_surfaces(struct brw_context *brw)
        brw_wm_prog_data(brw->wm.base.prog_data);
  
     if (wm_prog_data->has_render_target_reads &&
-       !ctx->Extensions.MESA_shader_framebuffer_fetch) {
+       !ctx->Extensions.EXT_shader_framebuffer_fetch) {
        /* _NEW_BUFFERS */
        const struct gl_framebuffer *fb = ctx->DrawBuffer;
  
@@ -1101,12 +1116,12 @@ update_renderbuffer_read_surfaces(struct brw_context *brw)
              };
  
              enum isl_aux_usage aux_usage =
-               intel_miptree_texture_aux_usage(brw, irb->mt, format);
-            if (brw->draw_aux_buffer_disabled[i])
+               intel_miptree_texture_aux_usage(brw, irb->mt, format,
+                                               brw->gen9_astc5x5_wa_tex_mask);
+            if (brw->draw_aux_usage[i] == ISL_AUX_USAGE_NONE)
                 aux_usage = ISL_AUX_USAGE_NONE;
  
              brw_emit_surface_state(brw, irb->mt, target, view, aux_usage,
-                                   tex_mocs[devinfo->gen],
                                     surf_offset, surf_index,
                                     0);
  
@@ -1129,6 +1144,14 @@ const struct brw_tracked_state brw_renderbuffer_read_surfaces = {
     .emit = update_renderbuffer_read_surfaces,
  };
  
+static bool
+is_depth_texture(struct intel_texture_object *iobj)
+{
+   GLenum base_format = _mesa_get_format_base_format(iobj->_Format);
+   return base_format == GL_DEPTH_COMPONENT ||
+          (base_format == GL_DEPTH_STENCIL && !iobj->base.StencilSampling);
+}
+
  static void
  update_stage_texture_surfaces(struct brw_context *brw,
                                const struct gl_program *prog,
@@ -1155,9 +1178,32 @@ update_stage_texture_surfaces(struct brw_context *brw,
        if (prog->SamplersUsed & (1 << s)) {
           const unsigned unit = prog->SamplerUnits[s];
           const bool used_by_txf = prog->info.textures_used_by_txf & (1 << s);
+         struct gl_texture_object *obj = ctx->Texture.Unit[unit]._Current;
+         struct intel_texture_object *iobj = intel_texture_object(obj);
  
           /* _NEW_TEXTURE */
-         if (ctx->Texture.Unit[unit]._Current) {
+         if (!obj)
+            continue;
+
+         if ((prog->ShadowSamplers & (1 << s)) && !is_depth_texture(iobj)) {
+            /* A programming note for the sample_c message says:
+             *
+             *    "The Surface Format of the associated surface must be
+             *     indicated as supporting shadow mapping as indicated in the
+             *     surface format table."
+             *
+             * Accessing non-depth textures via a sampler*Shadow type is
+             * undefined.  GLSL 4.50 page 162 says:
+             *
+             *    "If a shadow texture call is made to a sampler that does not
+             *     represent a depth texture, then results are undefined."
+             *
+             * We give them a null surface (zeros) for undefined.  We've seen
+             * GPU hangs with color buffers and sample_c, so we try and avoid
+             * those with this hack.
+             */
+            emit_null_surface_state(brw, NULL, surf_offset + s);
+         } else {
              brw_update_texture_surface(ctx, unit, surf_offset + s, for_gather,
                                         used_by_txf, plane);
           }
@@ -1198,15 +1244,15 @@ brw_update_texture_surfaces(struct brw_context *brw)
      * allows the surface format to be overriden for only the
      * gather4 messages. */
     if (devinfo->gen < 8) {
-      if (vs && vs->nir->info.uses_texture_gather)
+      if (vs && vs->info.uses_texture_gather)
           update_stage_texture_surfaces(brw, vs, &brw->vs.base, true, 0);
-      if (tcs && tcs->nir->info.uses_texture_gather)
+      if (tcs && tcs->info.uses_texture_gather)
           update_stage_texture_surfaces(brw, tcs, &brw->tcs.base, true, 0);
-      if (tes && tes->nir->info.uses_texture_gather)
+      if (tes && tes->info.uses_texture_gather)
           update_stage_texture_surfaces(brw, tes, &brw->tes.base, true, 0);
-      if (gs && gs->nir->info.uses_texture_gather)
+      if (gs && gs->info.uses_texture_gather)
           update_stage_texture_surfaces(brw, gs, &brw->gs.base, true, 0);
-      if (fs && fs->nir->info.uses_texture_gather)
+      if (fs && fs->info.uses_texture_gather)
           update_stage_texture_surfaces(brw, fs, &brw->wm.base, true, 0);
     }
  
@@ -1253,7 +1299,7 @@ brw_update_cs_texture_surfaces(struct brw_context *brw)
      * gather4 messages.
      */
     if (devinfo->gen < 8) {
-      if (cs && cs->nir->info.uses_texture_gather)
+      if (cs && cs->info.uses_texture_gather)
           update_stage_texture_surfaces(brw, cs, &brw->cs.base, true, 0);
     }
  
@@ -1270,6 +1316,37 @@ const struct brw_tracked_state brw_cs_texture_surfaces = {
     .emit = brw_update_cs_texture_surfaces,
  };
  
+static void
+upload_buffer_surface(struct brw_context *brw,
+                      struct gl_buffer_binding *binding,
+                      uint32_t *out_offset,
+                      enum isl_format format,
+                      unsigned reloc_flags)
+{
+   struct gl_context *ctx = &brw->ctx;
+
+   if (binding->BufferObject == ctx->Shared->NullBufferObj) {
+      emit_null_surface_state(brw, NULL, out_offset);
+   } else {
+      ptrdiff_t size = binding->BufferObject->Size - binding->Offset;
+      if (!binding->AutomaticSize)
+         size = MIN2(size, binding->Size);
+
+      if (size == 0) {
+         emit_null_surface_state(brw, NULL, out_offset);
+         return;
+      }
+
+      struct intel_buffer_object *iobj =
+         intel_buffer_object(binding->BufferObject);
+      struct brw_bo *bo =
+         intel_bufferobj_buffer(brw, iobj, binding->Offset, size,
+                                (reloc_flags & RELOC_WRITE) != 0);
+
+      brw_emit_buffer_surface_state(brw, out_offset, bo, binding->Offset,
+                                    format, size, 1, reloc_flags);
+   }
+}
  
  void
  brw_upload_ubo_surfaces(struct brw_context *brw, struct gl_program *prog,
@@ -1278,7 +1355,9 @@ brw_upload_ubo_surfaces(struct brw_context *brw, struct gl_program *prog,
  {
     struct gl_context *ctx = &brw->ctx;
  
-   if (!prog)
+   if (!prog || (prog->info.num_ubos == 0 &&
+                 prog->info.num_ssbos == 0 &&
+                 prog->info.num_abos == 0))
        return;
  
     uint32_t *ubo_surf_offsets =
@@ -1287,54 +1366,31 @@ brw_upload_ubo_surfaces(struct brw_context *brw, struct gl_program *prog,
     for (int i = 0; i < prog->info.num_ubos; i++) {
        struct gl_buffer_binding *binding =
           &ctx->UniformBufferBindings[prog->sh.UniformBlocks[i]->Binding];
-
-      if (binding->BufferObject == ctx->Shared->NullBufferObj) {
-         emit_null_surface_state(brw, NULL, &ubo_surf_offsets[i]);
-      } else {
-         struct intel_buffer_object *intel_bo =
-            intel_buffer_object(binding->BufferObject);
-         GLsizeiptr size = binding->BufferObject->Size - binding->Offset;
-         if (!binding->AutomaticSize)
-            size = MIN2(size, binding->Size);
-         struct brw_bo *bo =
-            intel_bufferobj_buffer(brw, intel_bo,
-                                   binding->Offset,
-                                   size, false);
-         brw_create_constant_surface(brw, bo, binding->Offset,
-                                     size,
-                                     &ubo_surf_offsets[i]);
-      }
+      upload_buffer_surface(brw, binding, &ubo_surf_offsets[i],
+                            ISL_FORMAT_R32G32B32A32_FLOAT, 0);
     }
  
-   uint32_t *ssbo_surf_offsets =
+   uint32_t *abo_surf_offsets =
        &stage_state->surf_offset[prog_data->binding_table.ssbo_start];
+   uint32_t *ssbo_surf_offsets = abo_surf_offsets + prog->info.num_abos;
+
+   for (int i = 0; i < prog->info.num_abos; i++) {
+      struct gl_buffer_binding *binding =
+         &ctx->AtomicBufferBindings[prog->sh.AtomicBuffers[i]->Binding];
+      upload_buffer_surface(brw, binding, &abo_surf_offsets[i],
+                            ISL_FORMAT_RAW, RELOC_WRITE);
+   }
  
     for (int i = 0; i < prog->info.num_ssbos; i++) {
        struct gl_buffer_binding *binding =
           &ctx->ShaderStorageBufferBindings[prog->sh.ShaderStorageBlocks[i]->Binding];
  
-      if (binding->BufferObject == ctx->Shared->NullBufferObj) {
-         emit_null_surface_state(brw, NULL, &ssbo_surf_offsets[i]);
-      } else {
-         struct intel_buffer_object *intel_bo =
-            intel_buffer_object(binding->BufferObject);
-         GLsizeiptr size = binding->BufferObject->Size - binding->Offset;
-         if (!binding->AutomaticSize)
-            size = MIN2(size, binding->Size);
-         struct brw_bo *bo =
-            intel_bufferobj_buffer(brw, intel_bo,
-                                   binding->Offset,
-                                   size, true);
-         brw_create_buffer_surface(brw, bo, binding->Offset,
-                                   size,
-                                   &ssbo_surf_offsets[i]);
-      }
+      upload_buffer_surface(brw, binding, &ssbo_surf_offsets[i],
+                            ISL_FORMAT_RAW, RELOC_WRITE);
     }
  
     stage_state->push_constants_dirty = true;
-
-   if (prog->info.num_ubos || prog->info.num_ssbos)
-      brw->ctx.NewDriverState |= BRW_NEW_SURFACES;
+   brw->ctx.NewDriverState |= BRW_NEW_SURFACES;
  }
  
  static void
@@ -1380,81 +1436,6 @@ const struct brw_tracked_state brw_cs_ubo_surfaces = {
     .emit = brw_upload_cs_ubo_surfaces,
  };
  
-void
-brw_upload_abo_surfaces(struct brw_context *brw,
-                        const struct gl_program *prog,
-                        struct brw_stage_state *stage_state,
-                        struct brw_stage_prog_data *prog_data)
-{
-   struct gl_context *ctx = &brw->ctx;
-   uint32_t *surf_offsets =
-      &stage_state->surf_offset[prog_data->binding_table.abo_start];
-
-   if (prog->info.num_abos) {
-      for (unsigned i = 0; i < prog->info.num_abos; i++) {
-         struct gl_buffer_binding *binding =
-            &ctx->AtomicBufferBindings[prog->sh.AtomicBuffers[i]->Binding];
-         struct intel_buffer_object *intel_bo =
-            intel_buffer_object(binding->BufferObject);
-         struct brw_bo *bo =
-            intel_bufferobj_buffer(brw, intel_bo, binding->Offset,
-                                   intel_bo->Base.Size - binding->Offset,
-                                   true);
-
-         brw_emit_buffer_surface_state(brw, &surf_offsets[i], bo,
-                                       binding->Offset, ISL_FORMAT_RAW,
-                                       bo->size - binding->Offset, 1,
-                                       RELOC_WRITE);
-      }
-
-      brw->ctx.NewDriverState |= BRW_NEW_SURFACES;
-   }
-}
-
-static void
-brw_upload_wm_abo_surfaces(struct brw_context *brw)
-{
-   /* _NEW_PROGRAM */
-   const struct gl_program *wm = brw->programs[MESA_SHADER_FRAGMENT];
-
-   if (wm) {
-      /* BRW_NEW_FS_PROG_DATA */
-      brw_upload_abo_surfaces(brw, wm, &brw->wm.base, brw->wm.base.prog_data);
-   }
-}
-
-const struct brw_tracked_state brw_wm_abo_surfaces = {
-   .dirty = {
-      .mesa = _NEW_PROGRAM,
-      .brw = BRW_NEW_ATOMIC_BUFFER |
-             BRW_NEW_BATCH |
-             BRW_NEW_FS_PROG_DATA,
-   },
-   .emit = brw_upload_wm_abo_surfaces,
-};
-
-static void
-brw_upload_cs_abo_surfaces(struct brw_context *brw)
-{
-   /* _NEW_PROGRAM */
-   const struct gl_program *cp = brw->programs[MESA_SHADER_COMPUTE];
-
-   if (cp) {
-      /* BRW_NEW_CS_PROG_DATA */
-      brw_upload_abo_surfaces(brw, cp, &brw->cs.base, brw->cs.base.prog_data);
-   }
-}
-
-const struct brw_tracked_state brw_cs_abo_surfaces = {
-   .dirty = {
-      .mesa = _NEW_PROGRAM,
-      .brw = BRW_NEW_ATOMIC_BUFFER |
-             BRW_NEW_BATCH |
-             BRW_NEW_CS_PROG_DATA,
-   },
-   .emit = brw_upload_cs_abo_surfaces,
-};
-
  static void
  brw_upload_cs_image_surfaces(struct brw_context *brw)
  {
@@ -1484,7 +1465,7 @@ get_image_format(struct brw_context *brw, mesa_format format, GLenum access)
  {
     const struct gen_device_info *devinfo = &brw->screen->devinfo;
     enum isl_format hw_format = brw_isl_format_for_mesa_format(format);
-   if (access == GL_WRITE_ONLY) {
+   if (access == GL_WRITE_ONLY || access == GL_NONE) {
        return hw_format;
     } else if (isl_has_matching_typed_storage_image_format(devinfo, hw_format)) {
        /* Typed surface reads support a very limited subset of the shader
@@ -1503,11 +1484,9 @@ get_image_format(struct brw_context *brw, mesa_format format, GLenum access)
  static void
  update_default_image_param(struct brw_context *brw,
                             struct gl_image_unit *u,
-                           unsigned surface_idx,
                             struct brw_image_param *param)
  {
     memset(param, 0, sizeof(*param));
-   param->surface_idx = surface_idx;
     /* Set the swizzling shifts to all-ones to effectively disable swizzling --
      * See emit_address_calculation() in brw_fs_surface_builder.cpp for a more
      * detailed explanation of these parameters.
@@ -1519,67 +1498,68 @@ update_default_image_param(struct brw_context *brw,
  static void
  update_buffer_image_param(struct brw_context *brw,
                            struct gl_image_unit *u,
-                          unsigned surface_idx,
                            struct brw_image_param *param)
  {
-   struct gl_buffer_object *obj = u->TexObj->BufferObject;
-   const uint32_t size = MIN2((uint32_t)u->TexObj->BufferSize, obj->Size);
-   update_default_image_param(brw, u, surface_idx, param);
+   const unsigned size = buffer_texture_range_size(brw, u->TexObj);
+   update_default_image_param(brw, u, param);
  
     param->size[0] = size / _mesa_get_format_bytes(u->_ActualFormat);
     param->stride[0] = _mesa_get_format_bytes(u->_ActualFormat);
  }
  
-static unsigned
-get_image_num_layers(const struct intel_mipmap_tree *mt, GLenum target,
-                     unsigned level)
-{
-   if (target == GL_TEXTURE_CUBE_MAP)
-      return 6;
-
-   return target == GL_TEXTURE_3D ?
-      minify(mt->surf.logical_level0_px.depth, level) :
-      mt->surf.logical_level0_px.array_len;
-}
-
  static void
  update_image_surface(struct brw_context *brw,
                       struct gl_image_unit *u,
                       GLenum access,
-                     unsigned surface_idx,
                       uint32_t *surf_offset,
                       struct brw_image_param *param)
  {
-   const struct gen_device_info *devinfo = &brw->screen->devinfo;
-
     if (_mesa_is_image_unit_valid(&brw->ctx, u)) {
        struct gl_texture_object *obj = u->TexObj;
        const unsigned format = get_image_format(brw, u->_ActualFormat, access);
+      const bool written = (access != GL_READ_ONLY && access != GL_NONE);
  
        if (obj->Target == GL_TEXTURE_BUFFER) {
-         struct intel_buffer_object *intel_obj =
-            intel_buffer_object(obj->BufferObject);
           const unsigned texel_size = (format == ISL_FORMAT_RAW ? 1 :
                                        _mesa_get_format_bytes(u->_ActualFormat));
+         const unsigned buffer_size = buffer_texture_range_size(brw, obj);
+         struct brw_bo *const bo = !obj->BufferObject ? NULL :
+            intel_bufferobj_buffer(brw, intel_buffer_object(obj->BufferObject),
+                                   obj->BufferOffset, buffer_size, written);
  
           brw_emit_buffer_surface_state(
-            brw, surf_offset, intel_obj->buffer, obj->BufferOffset,
-            format, intel_obj->Base.Size, texel_size,
-            access != GL_READ_ONLY ? RELOC_WRITE : 0);
+            brw, surf_offset, bo, obj->BufferOffset,
+            format, buffer_size, texel_size,
+            written ? RELOC_WRITE : 0);
  
-         update_buffer_image_param(brw, u, surface_idx, param);
+         update_buffer_image_param(brw, u, param);
  
        } else {
           struct intel_texture_object *intel_obj = intel_texture_object(obj);
           struct intel_mipmap_tree *mt = intel_obj->mt;
-         const unsigned num_layers = u->Layered ?
-            get_image_num_layers(mt, obj->Target, u->Level) : 1;
+
+         unsigned base_layer, num_layers;
+         if (u->Layered) {
+            if (obj->Target == GL_TEXTURE_3D) {
+               base_layer = 0;
+               num_layers = minify(mt->surf.logical_level0_px.depth, u->Level);
+            } else {
+               assert(obj->Immutable || obj->MinLayer == 0);
+               base_layer = obj->MinLayer;
+               num_layers = obj->Immutable ?
+                                obj->NumLayers :
+                                mt->surf.logical_level0_px.array_len;
+            }
+         } else {
+            base_layer = obj->MinLayer + u->_Layer;
+            num_layers = 1;
+         }
  
           struct isl_view view = {
              .format = format,
              .base_level = obj->MinLevel + u->Level,
              .levels = 1,
-            .base_array_layer = obj->MinLayer + u->_Layer,
+            .base_array_layer = base_layer,
              .array_len = num_layers,
              .swizzle = ISL_SWIZZLE_IDENTITY,
              .usage = ISL_SURF_USAGE_STORAGE_BIT,
@@ -1589,7 +1569,7 @@ update_image_surface(struct brw_context *brw,
              brw_emit_buffer_surface_state(
                 brw, surf_offset, mt->bo, mt->offset,
                 format, mt->bo->size - mt->offset, 1 /* pitch */,
-               access != GL_READ_ONLY ? RELOC_WRITE : 0);
+               written ? RELOC_WRITE : 0);
  
           } else {
              const int surf_index = surf_offset - &brw->wm.base.surf_offset[0];
@@ -1598,18 +1578,17 @@ update_image_surface(struct brw_context *brw,
                                                         view.base_array_layer,
                                                         view.array_len));
              brw_emit_surface_state(brw, mt, mt->target, view,
-                                   ISL_AUX_USAGE_NONE, tex_mocs[devinfo->gen],
+                                   ISL_AUX_USAGE_NONE,
                                     surf_offset, surf_index,
-                                   access == GL_READ_ONLY ? 0 : RELOC_WRITE);
+                                   written ? RELOC_WRITE : 0);
           }
  
           isl_surf_fill_image_param(&brw->isl_dev, param, &mt->surf, &view);
-         param->surface_idx = surface_idx;
        }
  
     } else {
        emit_null_surface_state(brw, NULL, surf_offset);
-      update_default_image_param(brw, u, surface_idx, param);
+      update_default_image_param(brw, u, param);
     }
  }
  
@@ -1628,9 +1607,8 @@ brw_upload_image_surfaces(struct brw_context *brw,
           const unsigned surf_idx = prog_data->binding_table.image_start + i;
  
           update_image_surface(brw, u, prog->sh.ImageAccess[i],
-                              surf_idx,
                                &stage_state->surf_offset[surf_idx],
-                              &prog_data->image_param[i]);
+                              &stage_state->image_param[i]);
        }
  
        brw->ctx.NewDriverState |= BRW_NEW_SURFACES;
@@ -1687,12 +1665,12 @@ brw_upload_cs_work_groups_surface(struct brw_context *brw)
  
        if (brw->compute.num_work_groups_bo == NULL) {
           bo = NULL;
-         intel_upload_data(brw,
-                           (void *)brw->compute.num_work_groups,
-                           3 * sizeof(GLuint),
-                           sizeof(GLuint),
-                           &bo,
-                           &bo_offset);
+         brw_upload_data(&brw->upload,
+                         (void *)brw->compute.num_work_groups,
+                         3 * sizeof(GLuint),
+                         sizeof(GLuint),
+                         &bo,
+                         &bo_offset);
        } else {
           bo = brw->compute.num_work_groups_bo;
           bo_offset = brw->compute.num_work_groups_offset;