Merge remote-tracking branch 'mesa-public/master' into vulkan

[mesa.git] / src / mesa / drivers / dri / i965 / brw_shader.cpp
diff --git a/src/mesa/drivers/dri/i965/brw_shader.cpp b/src/mesa/drivers/dri/i965/brw_shader.cpp

index 9ad7f3c3e9ad4dd17cfc3c23509dd14b6e5b407c..d051e124584f9b166e1e728c82a61756a3b935c1 100644 (file)
--- a/src/mesa/drivers/dri/i965/brw_shader.cpp
+++ b/src/mesa/drivers/dri/i965/brw_shader.cpp
@@ -21,16 +21,14 @@
   * IN THE SOFTWARE.
   */
  
-#include "main/macros.h"
  #include "brw_context.h"
-#include "brw_vs.h"
-#include "brw_gs.h"
-#include "brw_fs.h"
  #include "brw_cfg.h"
+#include "brw_eu.h"
  #include "brw_nir.h"
-#include "glsl/ir_optimization.h"
  #include "glsl/glsl_parser_extras.h"
-#include "main/shaderapi.h"
+#include "main/shaderobj.h"
+#include "main/uniforms.h"
+#include "util/debug.h"
  
  static void
  shader_debug_log_mesa(void *data, const char *fmt, ...)
@@ -72,20 +70,6 @@ shader_perf_log_mesa(void *data, const char *fmt, ...)
     va_end(args);
  }
  
-bool
-is_scalar_shader_stage(const struct brw_compiler *compiler, int stage)
-{
-   switch (stage) {
-   case MESA_SHADER_FRAGMENT:
-   case MESA_SHADER_COMPUTE:
-      return true;
-   case MESA_SHADER_VERTEX:
-      return compiler->scalar_vs;
-   default:
-      return false;
-   }
-}
-
  struct brw_compiler *
  brw_compiler_create(void *mem_ctx, const struct brw_device_info *devinfo)
  {
@@ -98,8 +82,12 @@ brw_compiler_create(void *mem_ctx, const struct brw_device_info *devinfo)
     brw_fs_alloc_reg_sets(compiler);
     brw_vec4_alloc_reg_set(compiler);
  
-   if (devinfo->gen >= 8 && !(INTEL_DEBUG & DEBUG_VEC4VS))
-      compiler->scalar_vs = true;
+   compiler->scalar_stage[MESA_SHADER_VERTEX] =
+      devinfo->gen >= 8 && !(INTEL_DEBUG & DEBUG_VEC4VS);
+   compiler->scalar_stage[MESA_SHADER_GEOMETRY] =
+      devinfo->gen >= 8 && env_var_as_boolean("INTEL_SCALAR_GS", false);
+   compiler->scalar_stage[MESA_SHADER_FRAGMENT] = true;
+   compiler->scalar_stage[MESA_SHADER_COMPUTE] = true;
  
     nir_shader_compiler_options *nir_options =
        rzalloc(compiler, nir_shader_compiler_options);
@@ -110,6 +98,8 @@ brw_compiler_create(void *mem_ctx, const struct brw_device_info *devinfo)
      */
     nir_options->lower_ffma = true;
     nir_options->lower_sub = true;
+   nir_options->lower_fdiv = true;
+
     /* In the vec4 backend, our dpN instruction replicates its result to all
      * the components of a vec4.  We would like NIR to give us replicated fdot
      * instructions because it can optimize better for us.
@@ -132,7 +122,7 @@ brw_compiler_create(void *mem_ctx, const struct brw_device_info *devinfo)
        compiler->glsl_compiler_options[i].EmitNoIndirectUniform = false;
        compiler->glsl_compiler_options[i].LowerClipDistance = true;
  
-      bool is_scalar = is_scalar_shader_stage(compiler, i);
+      bool is_scalar = compiler->scalar_stage[i];
  
        compiler->glsl_compiler_options[i].EmitNoIndirectOutput = is_scalar;
        compiler->glsl_compiler_options[i].EmitNoIndirectTemp = is_scalar;
@@ -143,12 +133,20 @@ brw_compiler_create(void *mem_ctx, const struct brw_device_info *devinfo)
           compiler->glsl_compiler_options[i].EmitNoIndirectSampler = true;
  
        compiler->glsl_compiler_options[i].NirOptions = nir_options;
+
+      compiler->glsl_compiler_options[i].LowerBufferInterfaceBlocks = true;
     }
  
+   if (compiler->scalar_stage[MESA_SHADER_GEOMETRY])
+      compiler->glsl_compiler_options[MESA_SHADER_GEOMETRY].EmitNoIndirectInput = false;
+
+   compiler->glsl_compiler_options[MESA_SHADER_COMPUTE]
+      .LowerShaderSharedVariables = true;
+
     return compiler;
  }
  
-struct gl_shader *
+extern "C" struct gl_shader *
  brw_new_shader(struct gl_context *ctx, GLuint name, GLuint type)
  {
     struct brw_shader *shader;
@@ -164,6 +162,16 @@ brw_new_shader(struct gl_context *ctx, GLuint name, GLuint type)
     return &shader->base;
  }
  
+extern "C" void
+brw_mark_surface_used(struct brw_stage_prog_data *prog_data,
+                      unsigned surf_index)
+{
+   assert(surf_index < BRW_MAX_SURFACES);
+
+   prog_data->binding_table.size_bytes =
+      MAX2(prog_data->binding_table.size_bytes, (surf_index + 1) * 4);
+}
+
  enum brw_reg_type
  brw_type_for_base_type(const struct glsl_type *type)
  {
@@ -192,6 +200,7 @@ brw_type_for_base_type(const struct glsl_type *type)
     case GLSL_TYPE_ERROR:
     case GLSL_TYPE_INTERFACE:
     case GLSL_TYPE_DOUBLE:
+   case GLSL_TYPE_FUNCTION:
        unreachable("not reached");
     }
  
@@ -273,13 +282,15 @@ const char *
  brw_instruction_name(enum opcode op)
  {
     switch (op) {
-   case BRW_OPCODE_MOV ... BRW_OPCODE_NOP:
+   case BRW_OPCODE_ILLEGAL ... BRW_OPCODE_NOP:
        assert(opcode_descs[op].name);
        return opcode_descs[op].name;
     case FS_OPCODE_FB_WRITE:
        return "fb_write";
     case FS_OPCODE_FB_WRITE_LOGICAL:
        return "fb_write_logical";
+   case FS_OPCODE_PACK_STENCIL_REF:
+      return "pack_stencil_ref";
     case FS_OPCODE_BLORP_FB_WRITE:
        return "blorp_fb_write";
     case FS_OPCODE_REP_FB_WRITE:
@@ -334,6 +345,10 @@ brw_instruction_name(enum opcode op)
        return "txf_cms";
     case SHADER_OPCODE_TXF_CMS_LOGICAL:
        return "txf_cms_logical";
+   case SHADER_OPCODE_TXF_CMS_W:
+      return "txf_cms_w";
+   case SHADER_OPCODE_TXF_CMS_W_LOGICAL:
+      return "txf_cms_w_logical";
     case SHADER_OPCODE_TXF_UMS:
        return "txf_ums";
     case SHADER_OPCODE_TXF_UMS_LOGICAL:
@@ -398,6 +413,16 @@ brw_instruction_name(enum opcode op)
        return "gen7_scratch_read";
     case SHADER_OPCODE_URB_WRITE_SIMD8:
        return "gen8_urb_write_simd8";
+   case SHADER_OPCODE_URB_WRITE_SIMD8_PER_SLOT:
+      return "gen8_urb_write_simd8_per_slot";
+   case SHADER_OPCODE_URB_WRITE_SIMD8_MASKED:
+      return "gen8_urb_write_simd8_masked";
+   case SHADER_OPCODE_URB_WRITE_SIMD8_MASKED_PER_SLOT:
+      return "gen8_urb_write_simd8_masked_per_slot";
+   case SHADER_OPCODE_URB_READ_SIMD8:
+      return "urb_read_simd8";
+   case SHADER_OPCODE_URB_READ_SIMD8_PER_SLOT:
+      return "urb_read_simd8_per_slot";
  
     case SHADER_OPCODE_FIND_LIVE_CHANNEL:
        return "find_live_channel";
@@ -521,6 +546,8 @@ brw_instruction_name(enum opcode op)
        return "barrier";
     case SHADER_OPCODE_MULH:
        return "mulh";
+   case SHADER_OPCODE_MOV_INDIRECT:
+      return "mov_indirect";
     }
  
     unreachable("not reached");
@@ -533,21 +560,17 @@ brw_saturate_immediate(enum brw_reg_type type, struct brw_reg *reg)
        unsigned ud;
        int d;
        float f;
-   } imm = { reg->dw1.ud }, sat_imm = { 0 };
+   } imm = { reg->ud }, sat_imm = { 0 };
  
     switch (type) {
     case BRW_REGISTER_TYPE_UD:
     case BRW_REGISTER_TYPE_D:
+   case BRW_REGISTER_TYPE_UW:
+   case BRW_REGISTER_TYPE_W:
     case BRW_REGISTER_TYPE_UQ:
     case BRW_REGISTER_TYPE_Q:
        /* Nothing to do. */
        return false;
-   case BRW_REGISTER_TYPE_UW:
-      sat_imm.ud = CLAMP(imm.ud, 0, USHRT_MAX);
-      break;
-   case BRW_REGISTER_TYPE_W:
-      sat_imm.d = CLAMP(imm.d, SHRT_MIN, SHRT_MAX);
-      break;
     case BRW_REGISTER_TYPE_F:
        sat_imm.f = CLAMP(imm.f, 0.0f, 1.0f);
        break;
@@ -564,7 +587,7 @@ brw_saturate_immediate(enum brw_reg_type type, struct brw_reg *reg)
     }
  
     if (imm.ud != sat_imm.ud) {
-      reg->dw1.ud = sat_imm.ud;
+      reg->ud = sat_imm.ud;
        return true;
     }
     return false;
@@ -576,17 +599,17 @@ brw_negate_immediate(enum brw_reg_type type, struct brw_reg *reg)
     switch (type) {
     case BRW_REGISTER_TYPE_D:
     case BRW_REGISTER_TYPE_UD:
-      reg->dw1.d = -reg->dw1.d;
+      reg->d = -reg->d;
        return true;
     case BRW_REGISTER_TYPE_W:
     case BRW_REGISTER_TYPE_UW:
-      reg->dw1.d = -(int16_t)reg->dw1.ud;
+      reg->d = -(int16_t)reg->ud;
        return true;
     case BRW_REGISTER_TYPE_F:
-      reg->dw1.f = -reg->dw1.f;
+      reg->f = -reg->f;
        return true;
     case BRW_REGISTER_TYPE_VF:
-      reg->dw1.ud ^= 0x80808080;
+      reg->ud ^= 0x80808080;
        return true;
     case BRW_REGISTER_TYPE_UB:
     case BRW_REGISTER_TYPE_B:
@@ -610,16 +633,16 @@ brw_abs_immediate(enum brw_reg_type type, struct brw_reg *reg)
  {
     switch (type) {
     case BRW_REGISTER_TYPE_D:
-      reg->dw1.d = abs(reg->dw1.d);
+      reg->d = abs(reg->d);
        return true;
     case BRW_REGISTER_TYPE_W:
-      reg->dw1.d = abs((int16_t)reg->dw1.ud);
+      reg->d = abs((int16_t)reg->ud);
        return true;
     case BRW_REGISTER_TYPE_F:
-      reg->dw1.f = fabsf(reg->dw1.f);
+      reg->f = fabsf(reg->f);
        return true;
     case BRW_REGISTER_TYPE_VF:
-      reg->dw1.ud &= ~0x80808080;
+      reg->ud &= ~0x80808080;
        return true;
     case BRW_REGISTER_TYPE_UB:
     case BRW_REGISTER_TYPE_B:
@@ -647,7 +670,7 @@ brw_abs_immediate(enum brw_reg_type type, struct brw_reg *reg)
  backend_shader::backend_shader(const struct brw_compiler *compiler,
                                 void *log_data,
                                 void *mem_ctx,
-                               nir_shader *shader,
+                               const nir_shader *shader,
                                 struct brw_stage_prog_data *stage_prog_data)
     : compiler(compiler),
       log_data(log_data),
@@ -663,13 +686,20 @@ backend_shader::backend_shader(const struct brw_compiler *compiler,
     stage_abbrev = _mesa_shader_stage_to_abbrev(stage);
  }
  
+bool
+backend_reg::equals(const backend_reg &r) const
+{
+   return memcmp((brw_reg *)this, (brw_reg *)&r, sizeof(brw_reg)) == 0 &&
+          reg_offset == r.reg_offset;
+}
+
  bool
  backend_reg::is_zero() const
  {
     if (file != IMM)
        return false;
  
-   return fixed_hw_reg.dw1.d == 0;
+   return d == 0;
  }
  
  bool
@@ -679,8 +709,8 @@ backend_reg::is_one() const
        return false;
  
     return type == BRW_REGISTER_TYPE_F
-          ? fixed_hw_reg.dw1.f == 1.0
-          : fixed_hw_reg.dw1.d == 1;
+          ? f == 1.0
+          : d == 1;
  }
  
  bool
@@ -691,9 +721,9 @@ backend_reg::is_negative_one() const
  
     switch (type) {
     case BRW_REGISTER_TYPE_F:
-      return fixed_hw_reg.dw1.f == -1.0;
+      return f == -1.0;
     case BRW_REGISTER_TYPE_D:
-      return fixed_hw_reg.dw1.d == -1;
+      return d == -1;
     default:
        return false;
     }
@@ -702,25 +732,21 @@ backend_reg::is_negative_one() const
  bool
  backend_reg::is_null() const
  {
-   return file == HW_REG &&
-          fixed_hw_reg.file == BRW_ARCHITECTURE_REGISTER_FILE &&
-          fixed_hw_reg.nr == BRW_ARF_NULL;
+   return file == ARF && nr == BRW_ARF_NULL;
  }
  
  
  bool
  backend_reg::is_accumulator() const
  {
-   return file == HW_REG &&
-          fixed_hw_reg.file == BRW_ARCHITECTURE_REGISTER_FILE &&
-          fixed_hw_reg.nr == BRW_ARF_ACCUMULATOR;
+   return file == ARF && nr == BRW_ARF_ACCUMULATOR;
  }
  
  bool
  backend_reg::in_range(const backend_reg &r, unsigned n) const
  {
     return (file == r.file &&
-           reg == r.reg &&
+           nr == r.nr &&
             reg_offset >= r.reg_offset &&
             reg_offset < r.reg_offset + n);
  }
@@ -751,7 +777,7 @@ backend_instruction::is_commutative() const
  bool
  backend_instruction::is_3src() const
  {
-   return opcode < ARRAY_SIZE(opcode_descs) && opcode_descs[opcode].nsrc == 3;
+   return ::is_3src(opcode);
  }
  
  bool
@@ -762,6 +788,7 @@ backend_instruction::is_tex() const
             opcode == SHADER_OPCODE_TXD ||
             opcode == SHADER_OPCODE_TXF ||
             opcode == SHADER_OPCODE_TXF_CMS ||
+           opcode == SHADER_OPCODE_TXF_CMS_W ||
             opcode == SHADER_OPCODE_TXF_UMS ||
             opcode == SHADER_OPCODE_TXF_MCS ||
             opcode == SHADER_OPCODE_TXL ||
@@ -951,6 +978,9 @@ backend_instruction::has_side_effects() const
     case SHADER_OPCODE_TYPED_SURFACE_WRITE_LOGICAL:
     case SHADER_OPCODE_MEMORY_FENCE:
     case SHADER_OPCODE_URB_WRITE_SIMD8:
+   case SHADER_OPCODE_URB_WRITE_SIMD8_PER_SLOT:
+   case SHADER_OPCODE_URB_WRITE_SIMD8_MASKED:
+   case SHADER_OPCODE_URB_WRITE_SIMD8_MASKED_PER_SLOT:
     case FS_OPCODE_FB_WRITE:
     case SHADER_OPCODE_BARRIER:
        return true;
@@ -959,6 +989,20 @@ backend_instruction::has_side_effects() const
     }
  }
  
+bool
+backend_instruction::is_volatile() const
+{
+   switch (opcode) {
+   case SHADER_OPCODE_UNTYPED_SURFACE_READ:
+   case SHADER_OPCODE_UNTYPED_SURFACE_READ_LOGICAL:
+   case SHADER_OPCODE_TYPED_SURFACE_READ:
+   case SHADER_OPCODE_TYPED_SURFACE_READ_LOGICAL:
+      return true;
+   default:
+      return false;
+   }
+}
+
  #ifndef NDEBUG
  static bool
  inst_is_in_block(const bblock_t *block, const backend_instruction *inst)
@@ -1118,11 +1162,16 @@ brw_assign_common_binding_table_offsets(gl_shader_stage stage,
     next_binding_table_offset += num_textures;
  
     if (shader) {
-      assert(shader->NumUniformBlocks <= BRW_MAX_COMBINED_UBO_SSBO);
+      assert(shader->NumUniformBlocks <= BRW_MAX_UBO);
        stage_prog_data->binding_table.ubo_start = next_binding_table_offset;
        next_binding_table_offset += shader->NumUniformBlocks;
+
+      assert(shader->NumShaderStorageBlocks <= BRW_MAX_SSBO);
+      stage_prog_data->binding_table.ssbo_start = next_binding_table_offset;
+      next_binding_table_offset += shader->NumShaderStorageBlocks;
     } else {
        stage_prog_data->binding_table.ubo_start = 0xd0d0d0d0;
+      stage_prog_data->binding_table.ssbo_start = 0xd0d0d0d0;
     }
  
     if (INTEL_DEBUG & DEBUG_SHADER_TIME) {
@@ -1144,9 +1193,9 @@ brw_assign_common_binding_table_offsets(gl_shader_stage stage,
        stage_prog_data->binding_table.gather_texture_start = 0xd0d0d0d0;
     }
  
-   if (shader_prog && shader_prog->NumAtomicBuffers) {
+   if (shader && shader->NumAtomicBuffers) {
        stage_prog_data->binding_table.abo_start = next_binding_table_offset;
-      next_binding_table_offset += shader_prog->NumAtomicBuffers;
+      next_binding_table_offset += shader->NumAtomicBuffers;
     } else {
        stage_prog_data->binding_table.abo_start = 0xd0d0d0d0;
     }
@@ -1217,3 +1266,29 @@ brw_setup_image_uniform_values(gl_shader_stage stage,
           stage_prog_data->binding_table.image_start + image_idx);
     }
  }
+
+/**
+ * Decide which set of clip planes should be used when clipping via
+ * gl_Position or gl_ClipVertex.
+ */
+gl_clip_plane *brw_select_clip_planes(struct gl_context *ctx)
+{
+   if (ctx->_Shader->CurrentProgram[MESA_SHADER_VERTEX]) {
+      /* There is currently a GLSL vertex shader, so clip according to GLSL
+       * rules, which means compare gl_ClipVertex (or gl_Position, if
+       * gl_ClipVertex wasn't assigned) against the eye-coordinate clip planes
+       * that were stored in EyeUserPlane at the time the clip planes were
+       * specified.
+       */
+      return ctx->Transform.EyeUserPlane;
+   } else {
+      /* Either we are using fixed function or an ARB vertex program.  In
+       * either case the clip planes are going to be compared against
+       * gl_Position (which is in clip coordinates) so we have to clip using
+       * _ClipUserPlane, which was transformed into clip coordinates by Mesa
+       * core.
+       */
+      return ctx->Transform._ClipUserPlane;
+   }
+}
+