i965/fs: Allow spilling for SIMD16 compute shaders

author Jordan Justen <jordan.l.justen@intel.com>

Mon, 22 Feb 2016 04:55:09 +0000 (20:55 -0800)

committer Jordan Justen <jordan.l.justen@intel.com>

Tue, 8 Mar 2016 22:27:18 +0000 (14:27 -0800)
author Jordan Justen <jordan.l.justen@intel.com>
Mon, 22 Feb 2016 04:55:09 +0000 (20:55 -0800)
committer Jordan Justen <jordan.l.justen@intel.com>
Tue, 8 Mar 2016 22:27:18 +0000 (14:27 -0800)
diff --git a/src/mesa/drivers/dri/i965/brw_fs.cpp b/src/mesa/drivers/dri/i965/brw_fs.cpp

index 261dff68c9f014258abebaf0df36ebd21327fe91..27f2123b7a0fa74595c4c83a79e9a731bdd1a359 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_fs.cpp
+++ b/src/mesa/drivers/dri/i965/brw_fs.cpp
@@ -5228,7 +5228,7 @@ fs_visitor::allocate_registers()
         * SIMD8.  There's probably actually some intermediate point where
         * SIMD16 with a couple of spills is still better.
         */
-      if (dispatch_width == 16) {
+      if (dispatch_width == 16 && min_dispatch_width <= 8) {
           fail("Failure to register allocate.  Reduce number of "
                "live scalar values to avoid this.");
        } else {
diff --git a/src/mesa/drivers/dri/i965/brw_fs.h b/src/mesa/drivers/dri/i965/brw_fs.h

index 21c7813509ba043c14c24c0f1566ccfdd5146668..d4acc8798be3e754eae75cdadc6c7b7b7422be92 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_fs.h
+++ b/src/mesa/drivers/dri/i965/brw_fs.h
@@ -409,6 +409,7 @@ public:
     bool spilled_any_registers;
  
     const unsigned dispatch_width; /**< 8 or 16 */
+   unsigned min_dispatch_width;
  
     int shader_time_index;
  
diff --git a/src/mesa/drivers/dri/i965/brw_fs_visitor.cpp b/src/mesa/drivers/dri/i965/brw_fs_visitor.cpp

index 88b189609491844e2a00f4b1363b85245e201c58..dc61d096efc21981a865a994c10eedf71b5978a2 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_fs_visitor.cpp
+++ b/src/mesa/drivers/dri/i965/brw_fs_visitor.cpp
@@ -1021,6 +1021,18 @@ fs_visitor::init()
        unreachable("unhandled shader stage");
     }
  
+   if (stage == MESA_SHADER_COMPUTE) {
+      const brw_cs_prog_data *cs_prog_data =
+         (const brw_cs_prog_data *) prog_data;
+      unsigned size = cs_prog_data->local_size[0] *
+                      cs_prog_data->local_size[1] *
+                      cs_prog_data->local_size[2];
+      size = DIV_ROUND_UP(size, devinfo->max_cs_threads);
+      min_dispatch_width = size > 16 ? 32 : (size > 8 ? 16 : 8);
+   } else {
+      min_dispatch_width = 8;
+   }
+
     this->prog_data = this->stage_prog_data;
  
     this->failed = false;
author	Jordan Justen <jordan.l.justen@intel.com>
	Mon, 22 Feb 2016 04:55:09 +0000 (20:55 -0800)
committer	Jordan Justen <jordan.l.justen@intel.com>
	Tue, 8 Mar 2016 22:27:18 +0000 (14:27 -0800)
src/mesa/drivers/dri/i965/brw_fs.cpp		patch \| blob \| history
src/mesa/drivers/dri/i965/brw_fs.h		patch \| blob \| history
src/mesa/drivers/dri/i965/brw_fs_visitor.cpp		patch \| blob \| history