i965/fs: Use a stride of 1 and byte offsets for UBOs

author Jason Ekstrand <jason.ekstrand@intel.com>

Sat, 31 Oct 2015 23:52:29 +0000 (16:52 -0700)

committer Jason Ekstrand <jason.ekstrand@intel.com>

Tue, 8 Dec 2015 05:51:23 +0000 (21:51 -0800)
author Jason Ekstrand <jason.ekstrand@intel.com>
Sat, 31 Oct 2015 23:52:29 +0000 (16:52 -0700)
committer Jason Ekstrand <jason.ekstrand@intel.com>
Tue, 8 Dec 2015 05:51:23 +0000 (21:51 -0800)
diff --git a/src/mesa/drivers/dri/i965/brw_fs.cpp b/src/mesa/drivers/dri/i965/brw_fs.cpp

index d2881b2d7a251bcab6716bb2a252435bd3c5536f..de5c17a78ede445c93e26200da8d6cf4a0cb9959 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_fs.cpp
+++ b/src/mesa/drivers/dri/i965/brw_fs.cpp
@@ -175,7 +175,7 @@ fs_visitor::VARYING_PULL_CONSTANT_LOAD(const fs_builder &bld,
      * the redundant ones.
      */
     fs_reg vec4_offset = vgrf(glsl_type::int_type);
-   bld.ADD(vec4_offset, varying_offset, brw_imm_ud(const_offset & ~3));
+   bld.ADD(vec4_offset, varying_offset, brw_imm_ud(const_offset & ~0xf));
  
     int scale = 1;
     if (devinfo->gen == 4 && bld.dispatch_width() == 8) {
@@ -207,7 +207,7 @@ fs_visitor::VARYING_PULL_CONSTANT_LOAD(const fs_builder &bld,
           inst->mlen = 1 + bld.dispatch_width() / 8;
     }
  
-   bld.MOV(dst, offset(vec4_result, bld, (const_offset & 3) * scale));
+   bld.MOV(dst, offset(vec4_result, bld, ((const_offset & 0xf) / 4) * scale));
  }
  
  /**
@@ -2052,10 +2052,12 @@ fs_visitor::demote_pull_constants()
  
           /* Generate a pull load into dst. */
           if (inst->src[i].reladdr) {
+            fs_reg indirect = ibld.vgrf(BRW_REGISTER_TYPE_D);
+            ibld.MUL(indirect, *inst->src[i].reladdr, brw_imm_d(4));
              VARYING_PULL_CONSTANT_LOAD(ibld, dst,
                                         brw_imm_ud(index),
-                                       *inst->src[i].reladdr,
-                                       pull_index);
+                                       indirect,
+                                       pull_index * 4);
              inst->src[i].reladdr = NULL;
              inst->src[i].stride = 1;
           } else {
@@ -3092,13 +3094,11 @@ fs_visitor::lower_uniform_pull_constant_loads()
           continue;
  
        if (devinfo->gen >= 7) {
-         /* The offset arg before was a vec4-aligned byte offset.  We need to
-          * turn it into a dword offset.
-          */
+         /* The offset arg is a vec4-aligned immediate byte offset. */
           fs_reg const_offset_reg = inst->src[1];
           assert(const_offset_reg.file == IMM &&
                  const_offset_reg.type == BRW_REGISTER_TYPE_UD);
-         const_offset_reg.ud /= 4;
+         assert(const_offset_reg.ud % 16 == 0);
  
           fs_reg payload, offset;
           if (devinfo->gen >= 9) {
diff --git a/src/mesa/drivers/dri/i965/brw_fs_nir.cpp b/src/mesa/drivers/dri/i965/brw_fs_nir.cpp

index 9b50e4ebf504858c696012833a2af5f7f4d897d8..39bbef4b01baee3f1514b7ba028d110420fb6388 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_fs_nir.cpp
+++ b/src/mesa/drivers/dri/i965/brw_fs_nir.cpp
@@ -2363,16 +2363,13 @@ fs_visitor::nir_emit_intrinsic(const fs_builder &bld, nir_intrinsic_instr *instr
        }
  
        if (has_indirect) {
-         /* Turn the byte offset into a dword offset. */
-         fs_reg base_offset = vgrf(glsl_type::int_type);
-         bld.SHR(base_offset, retype(get_nir_src(instr->src[1]),
-                                     BRW_REGISTER_TYPE_D),
-                 brw_imm_d(2));
+         fs_reg base_offset = retype(get_nir_src(instr->src[1]),
+                                     BRW_REGISTER_TYPE_D);
  
-         unsigned vec4_offset = instr->const_index[0] / 4;
+         unsigned vec4_offset = instr->const_index[0];
           for (int i = 0; i < instr->num_components; i++)
              VARYING_PULL_CONSTANT_LOAD(bld, offset(dest, bld, i), surf_index,
-                                       base_offset, vec4_offset + i);
+                                       base_offset, vec4_offset + i * 4);
        } else {
           fs_reg packed_consts = vgrf(glsl_type::float_type);
           packed_consts.type = dest.type;
diff --git a/src/mesa/drivers/dri/i965/brw_wm_surface_state.c b/src/mesa/drivers/dri/i965/brw_wm_surface_state.c

index 2c56995834948c5f0a3b5e57273f6c820d3de403..52bddaec872dcf28ecbe72fd1ed5024b6546b4f0 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_wm_surface_state.c
+++ b/src/mesa/drivers/dri/i965/brw_wm_surface_state.c
@@ -404,7 +404,7 @@ brw_create_constant_surface(struct brw_context *brw,
                             uint32_t *out_offset,
                              bool dword_pitch)
  {
-   uint32_t stride = dword_pitch ? 4 : 16;
+   uint32_t stride = dword_pitch ? 1 : 16;
     uint32_t elements = ALIGN(size, stride) / stride;
  
     brw->vtbl.emit_buffer_surface_state(brw, out_offset, bo, offset,
author	Jason Ekstrand <jason.ekstrand@intel.com>
	Sat, 31 Oct 2015 23:52:29 +0000 (16:52 -0700)
committer	Jason Ekstrand <jason.ekstrand@intel.com>
	Tue, 8 Dec 2015 05:51:23 +0000 (21:51 -0800)
src/mesa/drivers/dri/i965/brw_fs.cpp		patch \| blob \| history
src/mesa/drivers/dri/i965/brw_fs_nir.cpp		patch \| blob \| history
src/mesa/drivers/dri/i965/brw_wm_surface_state.c		patch \| blob \| history