st/nir: Re-vectorize shader IO

author Kenneth Graunke <kenneth@whitecape.org>

Thu, 11 Apr 2019 19:28:48 +0000 (12:28 -0700)

committer Kenneth Graunke <kenneth@whitecape.org>

Tue, 28 May 2019 08:06:48 +0000 (01:06 -0700)
author Kenneth Graunke <kenneth@whitecape.org>
Thu, 11 Apr 2019 19:28:48 +0000 (12:28 -0700)
committer Kenneth Graunke <kenneth@whitecape.org>
Tue, 28 May 2019 08:06:48 +0000 (01:06 -0700)
diff --git a/src/compiler/nir/nir.h b/src/compiler/nir/nir.h

index 15323f9a0c7a29230988bace99ecb96ac749a51a..d55b3569d1148dfe723d37b195d8cae1650df333 100644 (file)
--- a/src/compiler/nir/nir.h
+++ b/src/compiler/nir/nir.h
@@ -2349,6 +2349,12 @@ typedef struct nir_shader_compiler_options {
     bool lower_hadd;
     bool lower_add_sat;
  
+   /**
+    * Should IO be re-vectorized?  Some scalar ISAs still operate on vec4's
+    * for IO purposes and would prefer loads/stores be vectorized.
+    */
+   bool vectorize_io;
+
     /**
      * Should nir_lower_io() create load_interpolated_input intrinsics?
      *
diff --git a/src/mesa/state_tracker/st_glsl_to_nir.cpp b/src/mesa/state_tracker/st_glsl_to_nir.cpp

index a87284ef2a7e899b61714b8e0e778e5e7f07b793..11fc03baf86ff6b601944012c6bc659b449f389f 100644 (file)
--- a/src/mesa/state_tracker/st_glsl_to_nir.cpp
+++ b/src/mesa/state_tracker/st_glsl_to_nir.cpp
@@ -654,6 +654,28 @@ st_nir_get_mesa_program(struct gl_context *ctx,
     prog->nir = nir;
  }
  
+static void
+st_nir_vectorize_io(nir_shader *producer, nir_shader *consumer)
+{
+   NIR_PASS_V(producer, nir_lower_io_to_vector, nir_var_shader_out);
+   NIR_PASS_V(producer, nir_opt_combine_stores, nir_var_shader_out);
+   NIR_PASS_V(consumer, nir_lower_io_to_vector, nir_var_shader_in);
+
+   if ((producer)->info.stage != MESA_SHADER_TESS_CTRL) {
+      /* Calling lower_io_to_vector creates output variable writes with
+       * write-masks.  We only support these for TCS outputs, so for other
+       * stages, we need to call nir_lower_io_to_temporaries to get rid of
+       * them.  This, in turn, creates temporary variables and extra
+       * copy_deref intrinsics that we need to clean up.
+       */
+      NIR_PASS_V(producer, nir_lower_io_to_temporaries,
+                 nir_shader_get_entrypoint(producer), true, false);
+      NIR_PASS_V(producer, nir_lower_global_vars_to_local);
+      NIR_PASS_V(producer, nir_split_var_copies);
+      NIR_PASS_V(producer, nir_lower_var_copies);
+   }
+}
+
  static void
  st_nir_link_shaders(nir_shader **producer, nir_shader **consumer, bool scalar)
  {
@@ -844,6 +866,9 @@ st_link_nir(struct gl_context *ctx,
                 prev_shader->sh.LinkedTransformFeedback->NumVarying > 0))
              nir_compact_varyings(shader_program->_LinkedShaders[prev]->Program->nir,
                                nir, ctx->API != API_OPENGL_COMPAT);
+
+         if (ctx->Const.ShaderCompilerOptions[i].NirOptions->vectorize_io)
+            st_nir_vectorize_io(prev_shader->nir, nir);
        }
        prev = i;
     }
author	Kenneth Graunke <kenneth@whitecape.org>
	Thu, 11 Apr 2019 19:28:48 +0000 (12:28 -0700)
committer	Kenneth Graunke <kenneth@whitecape.org>
	Tue, 28 May 2019 08:06:48 +0000 (01:06 -0700)
src/compiler/nir/nir.h		patch \| blob \| history
src/mesa/state_tracker/st_glsl_to_nir.cpp		patch \| blob \| history