i965/fs: Don't attempt to copy the useless half of oMask for SIMD8 FB writes.

author Francisco Jerez <currojerez@riseup.net>

Wed, 15 Jul 2015 14:31:04 +0000 (17:31 +0300)

committer Francisco Jerez <currojerez@riseup.net>

Wed, 29 Jul 2015 11:12:47 +0000 (14:12 +0300)
author Francisco Jerez <currojerez@riseup.net>
Wed, 15 Jul 2015 14:31:04 +0000 (17:31 +0300)
committer Francisco Jerez <currojerez@riseup.net>
Wed, 29 Jul 2015 11:12:47 +0000 (14:12 +0300)
diff --git a/src/mesa/drivers/dri/i965/brw_fs_visitor.cpp b/src/mesa/drivers/dri/i965/brw_fs_visitor.cpp

index 564d69404ba897481b017e6f01199b1f33a62d27..a0dcca0c2b379be0196ee888011976c6450e0195 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_fs_visitor.cpp
+++ b/src/mesa/drivers/dri/i965/brw_fs_visitor.cpp
@@ -1499,6 +1499,7 @@ fs_visitor::emit_single_fb_write(const fs_builder &bld,
     assert(stage == MESA_SHADER_FRAGMENT);
     brw_wm_prog_data *prog_data = (brw_wm_prog_data*) this->prog_data;
     brw_wm_prog_key *key = (brw_wm_prog_key*) this->key;
+   const fs_builder ubld = bld.group(exec_size, use_2nd_half);
     int header_size = 2, payload_header_size;
  
     /* We can potentially have a message length of up to 15, so we have to set
@@ -1536,14 +1537,24 @@ fs_visitor::emit_single_fb_write(const fs_builder &bld,
     }
  
     if (prog_data->uses_omask) {
-      assert(this->sample_mask.file != BAD_FILE);
-      /* Hand over gl_SampleMask. Only lower 16 bits are relevant.  Since
-       * it's unsinged single words, one vgrf is always 16-wide.
-       */
        sources[length] = fs_reg(GRF, alloc.allocate(1),
-                               BRW_REGISTER_TYPE_UW);
-      bld.exec_all().annotate("FB write oMask")
-         .emit(FS_OPCODE_SET_OMASK, sources[length], this->sample_mask);
+                               BRW_REGISTER_TYPE_UD);
+
+      /* Hand over gl_SampleMask.  Only the lower 16 bits of each channel are
+       * relevant.  Since it's unsigned single words one vgrf is always
+       * 16-wide, but only the lower or higher 8 channels will be used by the
+       * hardware when doing a SIMD8 write depending on whether we have
+       * selected the subspans for the first or second half respectively.
+       */
+      fs_reg sample_mask = this->sample_mask;
+      assert(sample_mask.file != BAD_FILE && type_sz(sample_mask.type) == 4);
+      sample_mask.type = BRW_REGISTER_TYPE_UW;
+      sample_mask.stride *= 2;
+
+      ubld.annotate("FB write oMask")
+          .MOV(half(retype(sources[length], BRW_REGISTER_TYPE_UW),
+                    use_2nd_half),
+               half(sample_mask, use_2nd_half));
        length++;
     }
  
@@ -1590,7 +1601,6 @@ fs_visitor::emit_single_fb_write(const fs_builder &bld,
     if (payload.dest_depth_reg)
        sources[length++] = fs_reg(brw_vec8_grf(payload.dest_depth_reg, 0));
  
-   const fs_builder ubld = bld.group(exec_size, use_2nd_half);
     fs_inst *load;
     fs_inst *write;
     if (devinfo->gen >= 7) {
author	Francisco Jerez <currojerez@riseup.net>
	Wed, 15 Jul 2015 14:31:04 +0000 (17:31 +0300)
committer	Francisco Jerez <currojerez@riseup.net>
	Wed, 29 Jul 2015 11:12:47 +0000 (14:12 +0300)