nvc0: track texture dirty state individually
authorChristoph Bumiller <e0425955@student.tuwien.ac.at>
Thu, 8 Mar 2012 14:56:11 +0000 (15:56 +0100)
committerChristoph Bumiller <e0425955@student.tuwien.ac.at>
Sat, 14 Apr 2012 04:14:21 +0000 (06:14 +0200)
src/gallium/drivers/nvc0/nvc0_context.h
src/gallium/drivers/nvc0/nvc0_state.c
src/gallium/drivers/nvc0/nvc0_state_validate.c
src/gallium/drivers/nvc0/nvc0_surface.c
src/gallium/drivers/nvc0/nvc0_tex.c

index f6a505587acddd6eade6d3e0814fe1b7012e34a1..fdb58898ebdfdc1a5dbeddce6cf8891778255f6f 100644 (file)
 #define NVC0_NEW_TFB_TARGETS  (1 << 21)
 #define NVC0_NEW_IDXBUF       (1 << 22)
 
-#define NVC0_BIND_FB          0
-#define NVC0_BIND_VTX         1
-#define NVC0_BIND_VTX_TMP     2
-#define NVC0_BIND_IDX         3
-#define NVC0_BIND_TEX         4
-#define NVC0_BIND_CB(s, i)   (5 + 16 * (s) + (i))
-#define NVC0_BIND_TFB         85
-#define NVC0_BIND_SCREEN      86
-#define NVC0_BIND_TLS         87
-#define NVC0_BIND_COUNT       88
-#define NVC0_BIND_2D          0
-#define NVC0_BIND_M2MF        0
-#define NVC0_BIND_FENCE       1
+#define NVC0_BIND_FB            0
+#define NVC0_BIND_VTX           1
+#define NVC0_BIND_VTX_TMP       2
+#define NVC0_BIND_IDX           3
+#define NVC0_BIND_TEX(s, i)  (  4 + 32 * (s) + (i))
+#define NVC0_BIND_CB(s, i)   (164 + 16 * (s) + (i))
+#define NVC0_BIND_TFB         244
+#define NVC0_BIND_SCREEN      245
+#define NVC0_BIND_TLS         246
+#define NVC0_BIND_COUNT       247
+
+#define NVC0_BIND_2D            0
+#define NVC0_BIND_M2MF          0
+#define NVC0_BIND_FENCE         1
 
 struct nvc0_context {
    struct nouveau_context base;
@@ -121,8 +122,10 @@ struct nvc0_context {
 
    struct pipe_sampler_view *textures[5][PIPE_MAX_SAMPLERS];
    unsigned num_textures[5];
+   uint32_t textures_dirty[5];
    struct nv50_tsc_entry *samplers[5][PIPE_MAX_SAMPLERS];
    unsigned num_samplers[5];
+   uint16_t samplers_dirty[5];
 
    struct pipe_framebuffer_state framebuffer;
    struct pipe_blend_color blend_colour;
index b2cd54af129440a948af136fabc571a68a323ca2..d493f6e7fa0ce10d869aa31bf1d0878802c49123 100644 (file)
@@ -420,13 +420,20 @@ nvc0_stage_sampler_states_bind(struct nvc0_context *nvc0, int s,
    for (i = 0; i < nr; ++i) {
       struct nv50_tsc_entry *old = nvc0->samplers[s][i];
 
+      if (hwcso[i] == old)
+         continue;
+      nvc0->samplers_dirty[s] |= 1 << i;
+
       nvc0->samplers[s][i] = nv50_tsc_entry(hwcso[i]);
       if (old)
          nvc0_screen_tsc_unlock(nvc0->screen, old);
    }
-   for (; i < nvc0->num_samplers[s]; ++i)
-      if (nvc0->samplers[s][i])
+   for (; i < nvc0->num_samplers[s]; ++i) {
+      if (nvc0->samplers[s][i]) {
          nvc0_screen_tsc_unlock(nvc0->screen, nvc0->samplers[s][i]);
+         nvc0->samplers[s][i] = NULL;
+      }
+   }
 
    nvc0->num_samplers[s] = nr;
 
@@ -472,25 +479,30 @@ nvc0_stage_set_sampler_views(struct nvc0_context *nvc0, int s,
 
    for (i = 0; i < nr; ++i) {
       struct nv50_tic_entry *old = nv50_tic_entry(nvc0->textures[s][i]);
-      if (old)
+
+      if (views[i] == nvc0->textures[s][i])
+         continue;
+      nvc0->textures_dirty[s] |= 1 << i;
+
+      if (old) {
+         nouveau_bufctx_reset(nvc0->bufctx_3d, NVC0_BIND_TEX(s, i));
          nvc0_screen_tic_unlock(nvc0->screen, old);
+      }
 
       pipe_sampler_view_reference(&nvc0->textures[s][i], views[i]);
    }
 
    for (i = nr; i < nvc0->num_textures[s]; ++i) {
       struct nv50_tic_entry *old = nv50_tic_entry(nvc0->textures[s][i]);
-      if (!old)
-         continue;
-      nvc0_screen_tic_unlock(nvc0->screen, old);
-
-      pipe_sampler_view_reference(&nvc0->textures[s][i], NULL);
+      if (old) {
+         nouveau_bufctx_reset(nvc0->bufctx_3d, NVC0_BIND_TEX(s, i));
+         nvc0_screen_tic_unlock(nvc0->screen, old);
+         pipe_sampler_view_reference(&nvc0->textures[s][i], NULL);
+      }
    }
 
    nvc0->num_textures[s] = nr;
 
-   nouveau_bufctx_reset(nvc0->bufctx_3d, NVC0_BIND_TEX);
-
    nvc0->dirty |= NVC0_NEW_TEXTURES;
 }
 
index 4211fcdefd58fb6662892a0529b804c1ee9ce7c4..3533a5e1ba45a7373ceee7ee9faaf7335c077e02 100644 (file)
@@ -459,12 +459,18 @@ static void
 nvc0_switch_pipe_context(struct nvc0_context *ctx_to)
 {
    struct nvc0_context *ctx_from = ctx_to->screen->cur_ctx;
+   unsigned s;
 
    if (ctx_from)
       ctx_to->state = ctx_from->state;
 
    ctx_to->dirty = ~0;
 
+   for (s = 0; s < 5; ++s) {
+      ctx_to->samplers_dirty[s] = ~0;
+      ctx_to->textures_dirty[s] = ~0;
+   }
+
    if (!ctx_to->vertex)
       ctx_to->dirty &= ~(NVC0_NEW_VERTEX | NVC0_NEW_ARRAYS);
 
index cb5091ae3761f88874848ad719ebba632a8588e8..d1a233fbcf68845d0d645d9f42013cc992666f39 100644 (file)
@@ -769,6 +769,8 @@ nvc0_blitctx_pre_blit(struct nvc0_blitctx *blit, struct nvc0_context *nvc0)
    for (s = 0; s <= 4; ++s) {
       blit->saved.num_textures[s] = nvc0->num_textures[s];
       blit->saved.num_samplers[s] = nvc0->num_samplers[s];
+      nvc0->textures_dirty[s] = ~0;
+      nvc0->samplers_dirty[s] = ~0;
    }
    blit->saved.texture = nvc0->textures[4][0];
    blit->saved.sampler = nvc0->samplers[4][0];
@@ -811,6 +813,8 @@ nvc0_blitctx_post_blit(struct nvc0_context *nvc0, struct nvc0_blitctx *blit)
    for (s = 0; s <= 4; ++s) {
       nvc0->num_textures[s] = blit->saved.num_textures[s];
       nvc0->num_samplers[s] = blit->saved.num_samplers[s];
+      nvc0->textures_dirty[s] = ~0;
+      nvc0->samplers_dirty[s] = ~0;
    }
    nvc0->textures[4][0] = blit->saved.texture;
    nvc0->samplers[4][0] = blit->saved.sampler;
index fd58f80ab970c8879c8245a980fb95b9284c7d97..f6c4ab39bd99c132fd707877471296997f39dfdb 100644 (file)
@@ -206,18 +206,21 @@ nvc0_create_sampler_view(struct pipe_context *pipe,
 static boolean
 nvc0_validate_tic(struct nvc0_context *nvc0, int s)
 {
+   uint32_t commands[32];
    struct nouveau_pushbuf *push = nvc0->base.pushbuf;
    struct nouveau_bo *txc = nvc0->screen->txc;
    unsigned i;
+   unsigned n = 0;
    boolean need_flush = FALSE;
 
    for (i = 0; i < nvc0->num_textures[s]; ++i) {
       struct nv50_tic_entry *tic = nv50_tic_entry(nvc0->textures[s][i]);
       struct nv04_resource *res;
+      const boolean dirty = !!(nvc0->textures_dirty[s] & (1 << i));
 
       if (!tic) {
-         BEGIN_NVC0(push, NVC0_3D(BIND_TIC(s)), 1);
-         PUSH_DATA (push, (i << 1) | 0);
+         if (dirty)
+            commands[n++] = (i << 1) | 0;
          continue;
       }
       res = nv04_resource(tic->pipe.texture);
@@ -248,17 +251,23 @@ nvc0_validate_tic(struct nvc0_context *nvc0, int s)
       res->status &= ~NOUVEAU_BUFFER_STATUS_GPU_WRITING;
       res->status |=  NOUVEAU_BUFFER_STATUS_GPU_READING;
 
-      BCTX_REFN(nvc0->bufctx_3d, TEX, res, RD);
+      if (!dirty)
+         continue;
+      commands[n++] = (tic->id << 9) | (i << 1) | 1;
 
-      BEGIN_NVC0(push, NVC0_3D(BIND_TIC(s)), 1);
-      PUSH_DATA (push, (tic->id << 9) | (i << 1) | 1);
-   }
-   for (; i < nvc0->state.num_textures[s]; ++i) {
-      BEGIN_NVC0(push, NVC0_3D(BIND_TIC(s)), 1);
-      PUSH_DATA (push, (i << 1) | 0);
+      BCTX_REFN(nvc0->bufctx_3d, TEX(s, i), res, RD);
    }
+   for (; i < nvc0->state.num_textures[s]; ++i)
+      commands[n++] = (i << 1) | 0;
+
    nvc0->state.num_textures[s] = nvc0->num_textures[s];
 
+   if (n) {
+      BEGIN_NIC0(push, NVC0_3D(BIND_TIC(s)), n);
+      PUSH_DATAp(push, commands, n);
+   }
+   nvc0->textures_dirty[s] = 0;
+
    return need_flush;
 }
 
@@ -279,16 +288,19 @@ void nvc0_validate_textures(struct nvc0_context *nvc0)
 static boolean
 nvc0_validate_tsc(struct nvc0_context *nvc0, int s)
 {
+   uint32_t commands[16];
    struct nouveau_pushbuf *push = nvc0->base.pushbuf;
    unsigned i;
+   unsigned n = 0;
    boolean need_flush = FALSE;
 
    for (i = 0; i < nvc0->num_samplers[s]; ++i) {
       struct nv50_tsc_entry *tsc = nv50_tsc_entry(nvc0->samplers[s][i]);
 
+      if (!(nvc0->samplers_dirty[s] & (1 << i)))
+         continue;
       if (!tsc) {
-         BEGIN_NVC0(push, NVC0_3D(BIND_TSC(s)), 1);
-         PUSH_DATA (push, (i << 4) | 0);
+         commands[n++] = (i << 4) | 0;
          continue;
       }
       if (tsc->id < 0) {
@@ -301,15 +313,19 @@ nvc0_validate_tsc(struct nvc0_context *nvc0, int s)
       }
       nvc0->screen->tsc.lock[tsc->id / 32] |= 1 << (tsc->id % 32);
 
-      BEGIN_NVC0(push, NVC0_3D(BIND_TSC(s)), 1);
-      PUSH_DATA (push, (tsc->id << 12) | (i << 4) | 1);
-   }
-   for (; i < nvc0->state.num_samplers[s]; ++i) {
-      BEGIN_NVC0(push, NVC0_3D(BIND_TSC(s)), 1);
-      PUSH_DATA (push, (i << 4) | 0);
+      commands[n++] = (tsc->id << 12) | (i << 4) | 1;
    }
+   for (; i < nvc0->state.num_samplers[s]; ++i)
+      commands[n++] = (i << 4) | 0;
+
    nvc0->state.num_samplers[s] = nvc0->num_samplers[s];
 
+   if (n) {
+      BEGIN_NIC0(push, NVC0_3D(BIND_TSC(s)), n);
+      PUSH_DATAp(push, commands, n);
+   }
+   nvc0->samplers_dirty[s] = 0;
+
    return need_flush;
 }