i965/nir/vec4: Prepare source and destination registers for ALU operations

[mesa.git] / src / mesa / drivers / dri / i965 / brw_shader.cpp
diff --git a/src/mesa/drivers/dri/i965/brw_shader.cpp b/src/mesa/drivers/dri/i965/brw_shader.cpp

index 9e3a9740d74e923d94f10d6dc4567dec4702fdc1..7c5095ddce35bf05d8f497539ce693aed4b83d9c 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_shader.cpp
+++ b/src/mesa/drivers/dri/i965/brw_shader.cpp
@@ -122,12 +122,14 @@ brw_compiler_create(void *mem_ctx, const struct brw_device_info *devinfo)
     compiler->glsl_compiler_options[MESA_SHADER_VERTEX].OptimizeForAOS = true;
     compiler->glsl_compiler_options[MESA_SHADER_GEOMETRY].OptimizeForAOS = true;
  
-   if (compiler->scalar_vs) {
-      /* If we're using the scalar backend for vertex shaders, we need to
-       * configure these accordingly.
-       */
-      compiler->glsl_compiler_options[MESA_SHADER_VERTEX].EmitNoIndirectOutput = true;
-      compiler->glsl_compiler_options[MESA_SHADER_VERTEX].EmitNoIndirectTemp = true;
+   if (compiler->scalar_vs || brw_env_var_as_boolean("INTEL_USE_NIR", false)) {
+      if (compiler->scalar_vs) {
+         /* If we're using the scalar backend for vertex shaders, we need to
+          * configure these accordingly.
+          */
+         compiler->glsl_compiler_options[MESA_SHADER_VERTEX].EmitNoIndirectOutput = true;
+         compiler->glsl_compiler_options[MESA_SHADER_VERTEX].EmitNoIndirectTemp = true;
+      }
        compiler->glsl_compiler_options[MESA_SHADER_VERTEX].OptimizeForAOS = false;
  
        compiler->glsl_compiler_options[MESA_SHADER_VERTEX].NirOptions = nir_options;
@@ -396,8 +398,10 @@ brw_link_shader(struct gl_context *ctx, struct gl_shader_program *shProg)
  
        brw_add_texrect_params(prog);
  
-      if (options->NirOptions)
-         prog->nir = brw_create_nir(brw, shProg, prog, (gl_shader_stage) stage);
+      if (options->NirOptions) {
+         prog->nir = brw_create_nir(brw, shProg, prog, (gl_shader_stage) stage,
+                                    is_scalar_shader_stage(brw, stage));
+      }
  
        _mesa_reference_program(ctx, &prog, NULL);
     }
@@ -619,16 +623,28 @@ brw_instruction_name(enum opcode op)
  
     case SHADER_OPCODE_UNTYPED_ATOMIC:
        return "untyped_atomic";
+   case SHADER_OPCODE_UNTYPED_ATOMIC_LOGICAL:
+      return "untyped_atomic_logical";
     case SHADER_OPCODE_UNTYPED_SURFACE_READ:
        return "untyped_surface_read";
+   case SHADER_OPCODE_UNTYPED_SURFACE_READ_LOGICAL:
+      return "untyped_surface_read_logical";
     case SHADER_OPCODE_UNTYPED_SURFACE_WRITE:
        return "untyped_surface_write";
+   case SHADER_OPCODE_UNTYPED_SURFACE_WRITE_LOGICAL:
+      return "untyped_surface_write_logical";
     case SHADER_OPCODE_TYPED_ATOMIC:
        return "typed_atomic";
+   case SHADER_OPCODE_TYPED_ATOMIC_LOGICAL:
+      return "typed_atomic_logical";
     case SHADER_OPCODE_TYPED_SURFACE_READ:
        return "typed_surface_read";
+   case SHADER_OPCODE_TYPED_SURFACE_READ_LOGICAL:
+      return "typed_surface_read_logical";
     case SHADER_OPCODE_TYPED_SURFACE_WRITE:
        return "typed_surface_write";
+   case SHADER_OPCODE_TYPED_SURFACE_WRITE_LOGICAL:
+      return "typed_surface_write_logical";
     case SHADER_OPCODE_MEMORY_FENCE:
        return "memory_fence";
  
@@ -1181,10 +1197,14 @@ backend_instruction::has_side_effects() const
  {
     switch (opcode) {
     case SHADER_OPCODE_UNTYPED_ATOMIC:
+   case SHADER_OPCODE_UNTYPED_ATOMIC_LOGICAL:
     case SHADER_OPCODE_GEN4_SCRATCH_WRITE:
     case SHADER_OPCODE_UNTYPED_SURFACE_WRITE:
+   case SHADER_OPCODE_UNTYPED_SURFACE_WRITE_LOGICAL:
     case SHADER_OPCODE_TYPED_ATOMIC:
+   case SHADER_OPCODE_TYPED_ATOMIC_LOGICAL:
     case SHADER_OPCODE_TYPED_SURFACE_WRITE:
+   case SHADER_OPCODE_TYPED_SURFACE_WRITE_LOGICAL:
     case SHADER_OPCODE_MEMORY_FENCE:
     case SHADER_OPCODE_URB_WRITE_SIMD8:
     case FS_OPCODE_FB_WRITE: