radeonsi: turn SDMA IBs into de-facto preambles of GFX IBs
authorMarek Olšák <marek.olsak@amd.com>
Tue, 27 Dec 2016 18:53:59 +0000 (19:53 +0100)
committerMarek Olšák <marek.olsak@amd.com>
Thu, 5 Jan 2017 17:43:24 +0000 (18:43 +0100)
Draw calls no longer flush SDMA IBs. r600_need_dma_space is
responsible for synchronizing execution between both IBs.

Initial buffer clears and fast clears will stay unflushed in the SDMA IB
(up to 64 MB) as long as the GFX IB isn't flushed either.

Reviewed-by: Nicolai Hähnle <nicolai.haehnle@amd.com>
src/gallium/drivers/radeon/r600_pipe_common.c
src/gallium/drivers/radeonsi/si_hw_context.c

index 35d3e7b16bd85bc896f981a354d87615f74575cc..f6e49f2e663700564b547aae825819fed223adc9 100644 (file)
@@ -355,9 +355,9 @@ static void r600_flush_from_st(struct pipe_context *ctx,
        if (flags & PIPE_FLUSH_DEFERRED)
                rflags |= RADEON_FLUSH_ASYNC;
 
-       if (rctx->dma.cs) {
+       /* DMA IBs are preambles to gfx IBs, therefore must be flushed first. */
+       if (rctx->dma.cs)
                rctx->dma.flush(rctx, rflags, fence ? &sdma_fence : NULL);
-       }
 
        if (!radeon_emitted(rctx->gfx.cs, rctx->initial_gfx_cs_size)) {
                if (fence)
index 87ba31659b0f0b707bd02fa5b5fadd603d2ac40d..57eaac9dadc6f1b9f07bcabc0f9f68505f30a3a6 100644 (file)
@@ -62,11 +62,13 @@ void si_need_cs_space(struct si_context *ctx)
 {
        struct radeon_winsys_cs *cs = ctx->b.gfx.cs;
        struct radeon_winsys_cs *ce_ib = ctx->ce_ib;
-       struct radeon_winsys_cs *dma = ctx->b.dma.cs;
 
-       /* Flush the DMA IB if it's not empty. */
-       if (radeon_emitted(dma, 0))
-               ctx->b.dma.flush(ctx, RADEON_FLUSH_ASYNC, NULL);
+       /* There is no need to flush the DMA IB here, because
+        * r600_need_dma_space always flushes the GFX IB if there is
+        * a conflict, which means any unflushed DMA commands automatically
+        * precede the GFX IB (= they had no dependency on the GFX IB when
+        * they were submitted).
+        */
 
        /* There are two memory usage counters in the winsys for all buffers
         * that have been added (cs_add_buffer) and two counters in the pipe
@@ -106,6 +108,16 @@ void si_context_gfx_flush(void *context, unsigned flags,
        if (r600_check_device_reset(&ctx->b))
                return;
 
+       /* If the state tracker is flushing the GFX IB, r600_flush_from_st is
+        * responsible for flushing the DMA IB and merging the fences from both.
+        * This code is only needed when the driver flushes the GFX IB
+        * internally, and it never asks for a fence handle.
+        */
+       if (radeon_emitted(ctx->b.dma.cs, 0)) {
+               assert(fence == NULL); /* internal flushes only */
+               ctx->b.dma.flush(ctx, flags, NULL);
+       }
+
        ctx->gfx_flush_in_progress = true;
 
        r600_preflush_suspend_features(&ctx->b);