radeonsi: inline util_blitter_copy_texture

[mesa.git] / src / gallium / drivers / radeonsi / si_shader.c
diff --git a/src/gallium/drivers/radeonsi/si_shader.c b/src/gallium/drivers/radeonsi/si_shader.c

index 2f9993c4c8ef52793ccc866fd8f98b87af2ea376..77768214f5aac42f94eeb352d2b4373b2bce41c0 100644 (file)
--- a/src/gallium/drivers/radeonsi/si_shader.c
+++ b/src/gallium/drivers/radeonsi/si_shader.c
@@ -319,7 +319,8 @@ static LLVMValueRef fetch_input_gs(
                                       4);
  
         /* Load the ESGS ring resource descriptor */
-       t_list_ptr = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn, SI_PARAM_CONST);
+       t_list_ptr = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn,
+                                 SI_PARAM_RW_BUFFERS);
         t_list = build_indexed_load(si_shader_ctx, t_list_ptr,
                                     lp_build_const_int32(gallivm, SI_RING_ESGS));
  
@@ -842,6 +843,9 @@ static void build_tbuffer_store(struct si_shader_context *shader,
                 LLVMConstInt(i32, tfe, 0)
         };
  
+       /* The instruction offset field has 12 bits */
+       assert(offen || inst_offset < (1 << 12));
+
         /* The intrinsic is overloaded, we need to add a type suffix for overloading to work. */
         unsigned func = CLAMP(num_channels, 1, 3) - 1;
         const char *types[] = {"i32", "v2i32", "v4i32"};
@@ -1179,6 +1183,8 @@ static void si_llvm_emit_es_epilogue(struct lp_build_tgsi_context * bld_base)
         struct si_shader *gs = si_shader_ctx->gs_for_vs;
         struct tgsi_parse_context *parse = &si_shader_ctx->parse;
         LLVMTypeRef i32 = LLVMInt32TypeInContext(gallivm->context);
+       LLVMValueRef soffset = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn,
+                                           SI_PARAM_ES2GS_OFFSET);
         LLVMValueRef t_list_ptr;
         LLVMValueRef t_list;
         unsigned chan;
@@ -1197,7 +1203,8 @@ static void si_llvm_emit_es_epilogue(struct lp_build_tgsi_context * bld_base)
         }
  
         /* Load the ESGS ring resource descriptor */
-       t_list_ptr = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn, SI_PARAM_CONST);
+       t_list_ptr = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn,
+                                 SI_PARAM_RW_BUFFERS);
         t_list = build_indexed_load(si_shader_ctx, t_list_ptr,
                                     lp_build_const_int32(gallivm, SI_RING_ESGS));
  
@@ -1216,20 +1223,14 @@ static void si_llvm_emit_es_epilogue(struct lp_build_tgsi_context * bld_base)
  
                 for (chan = 0; chan < 4; chan++) {
                         LLVMValueRef out_val = LLVMBuildLoad(gallivm->builder, out_ptr[chan], "");
-                       LLVMValueRef voffset =
-                               lp_build_const_int32(gallivm,
-                                                    (4 * gs->input[j].param_offset + chan) * 4);
-                       LLVMValueRef soffset =
-                               LLVMGetParam(si_shader_ctx->radeon_bld.main_fn,
-                                            SI_PARAM_ES2GS_OFFSET);
-
                         out_val = LLVMBuildBitCast(gallivm->builder, out_val, i32, "");
  
                         build_tbuffer_store(si_shader_ctx, t_list, out_val, 1,
-                                           voffset, soffset, 0,
+                                           LLVMGetUndef(i32), soffset,
+                                           (4 * gs->input[j].param_offset + chan) * 4,
                                             V_008F0C_BUF_DATA_FORMAT_32,
                                             V_008F0C_BUF_NUM_FORMAT_UINT,
-                                           1, 0, 1, 1, 0);
+                                           0, 0, 1, 1, 0);
                 }
         }
  }
@@ -1901,6 +1902,8 @@ static void si_llvm_emit_vertex(
         struct si_shader *shader = &si_shader_ctx->shader->shader;
         struct gallivm_state *gallivm = bld_base->base.gallivm;
         LLVMTypeRef i32 = LLVMInt32TypeInContext(gallivm->context);
+       LLVMValueRef soffset = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn,
+                                           SI_PARAM_GS2VS_OFFSET);
         LLVMValueRef gs_next_vertex;
         LLVMValueRef t_list_ptr;
         LLVMValueRef t_list;
@@ -1909,7 +1912,8 @@ static void si_llvm_emit_vertex(
         int i;
  
         /* Load the GSVS ring resource descriptor */
-       t_list_ptr = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn, SI_PARAM_CONST);
+       t_list_ptr = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn,
+                                 SI_PARAM_RW_BUFFERS);
         t_list = build_indexed_load(si_shader_ctx, t_list_ptr,
                                     lp_build_const_int32(gallivm, SI_RING_GSVS));
  
@@ -1936,9 +1940,6 @@ static void si_llvm_emit_vertex(
  
                 for (chan = 0; chan < 4; chan++) {
                         LLVMValueRef out_val = LLVMBuildLoad(gallivm->builder, out_ptr[chan], "");
-                       LLVMValueRef soffset =
-                               LLVMGetParam(si_shader_ctx->radeon_bld.main_fn,
-                                            SI_PARAM_GS2VS_OFFSET);
                         LLVMValueRef voffset =
                                 lp_build_const_int32(gallivm, (i * 4 + chan) *
                                                      shader->gs_max_out_vertices);
@@ -2040,7 +2041,7 @@ static void create_function(struct si_shader_context *si_shader_ctx)
         struct lp_build_tgsi_context *bld_base = &si_shader_ctx->radeon_bld.soa.bld_base;
         struct gallivm_state *gallivm = bld_base->base.gallivm;
         struct si_pipe_shader *shader = si_shader_ctx->shader;
-       LLVMTypeRef params[21], f32, i8, i32, v2i32, v3i32;
+       LLVMTypeRef params[SI_NUM_PARAMS], f32, i8, i32, v2i32, v3i32;
         unsigned i, last_sgpr, num_params;
  
         i8 = LLVMInt8TypeInContext(gallivm->context);
@@ -2051,6 +2052,8 @@ static void create_function(struct si_shader_context *si_shader_ctx)
  
         params[SI_PARAM_CONST] = LLVMPointerType(
                 LLVMArrayType(LLVMVectorType(i8, 16), NUM_CONST_BUFFERS), CONST_ADDR_SPACE);
+       params[SI_PARAM_RW_BUFFERS] = params[SI_PARAM_CONST];
+
         /* We assume at most 16 textures per program at the moment.
          * This need probably need to be changed to support bindless textures */
         params[SI_PARAM_SAMPLER] = LLVMPointerType(
@@ -2061,7 +2064,6 @@ static void create_function(struct si_shader_context *si_shader_ctx)
         switch (si_shader_ctx->type) {
         case TGSI_PROCESSOR_VERTEX:
                 params[SI_PARAM_VERTEX_BUFFER] = params[SI_PARAM_CONST];
-               params[SI_PARAM_SO_BUFFER] = params[SI_PARAM_CONST];
                 params[SI_PARAM_START_INSTANCE] = i32;
                 num_params = SI_PARAM_START_INSTANCE+1;
                 if (shader->key.vs.as_es) {
@@ -2259,12 +2261,13 @@ static void preload_streamout_buffers(struct si_shader_context *si_shader_ctx)
                 return;
  
         LLVMValueRef buf_ptr = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn,
-                                           SI_PARAM_SO_BUFFER);
+                                           SI_PARAM_RW_BUFFERS);
  
         /* Load the resources, we rely on the code sinking to do the rest */
         for (i = 0; i < 4; ++i) {
                 if (si_shader_ctx->shader->selector->so.stride[i]) {
-                       LLVMValueRef offset = lp_build_const_int32(gallivm, i);
+                       LLVMValueRef offset = lp_build_const_int32(gallivm,
+                                                                  SI_RW_SO + i);
  
                         si_shader_ctx->so_buffers[i] = build_indexed_load(si_shader_ctx, buf_ptr, offset);
                 }
@@ -2330,9 +2333,9 @@ int si_compile_llvm(struct si_context *sctx, struct si_pipe_shader *shader,
         }
  
         ptr = (uint32_t*)sctx->b.ws->buffer_map(shader->bo->cs_buf, sctx->b.rings.gfx.cs, PIPE_TRANSFER_WRITE);
-       if (0 /*SI_BIG_ENDIAN*/) {
+       if (SI_BIG_ENDIAN) {
                 for (i = 0; i < binary.code_size / 4; ++i) {
-                       ptr[i] = util_bswap32(*(uint32_t*)(binary.code + i*4));
+                       ptr[i] = util_cpu_to_le32((*(uint32_t*)(binary.code + i*4)));
                 }
         } else {
                 memcpy(ptr, binary.code, binary.code_size);
@@ -2373,7 +2376,8 @@ static int si_generate_gs_copy_shader(struct si_context *sctx,
         preload_streamout_buffers(si_shader_ctx);
  
         /* Load the GSVS ring resource descriptor */
-       t_list_ptr = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn, SI_PARAM_CONST);
+       t_list_ptr = LLVMGetParam(si_shader_ctx->radeon_bld.main_fn,
+                                 SI_PARAM_RW_BUFFERS);
         t_list = build_indexed_load(si_shader_ctx, t_list_ptr,
                                     lp_build_const_int32(gallivm, SI_RING_GSVS));