i965: Stop putting 8 NOPs after each prorgam.
authorEric Anholt <eric@anholt.net>
Fri, 31 Aug 2012 18:41:22 +0000 (11:41 -0700)
committerEric Anholt <eric@anholt.net>
Mon, 17 Sep 2012 19:32:52 +0000 (12:32 -0700)
As far as I can see, the intention of the requirement that we do so is to
prevent instruction prefetch from wandering out into either unmapped memory or
memory with a different caching type, and hanging the chip.  The kernel makes
sure that the page after your BO has a valid page of the same caching type,
which meets this requirement, so there's no need to waste space between our
programs (and in instruction cache) on this.

Saves another 9kb instructions in l4d2 shaders.

Acked-by: Kenneth Graunke <kenneth@whitecape.org>
src/mesa/drivers/dri/i965/brw_eu.c

index 130d801edc9e24149cbdd3483232b35b47c906e6..c60b16c3871825c46455a11cc452ad2d0caceb96 100644 (file)
@@ -214,16 +214,8 @@ brw_init_compile(struct brw_context *brw, struct brw_compile *p, void *mem_ctx)
 const GLuint *brw_get_program( struct brw_compile *p,
                               GLuint *sz )
 {
-   GLuint i;
-
    brw_compact_instructions(p);
 
-   /* We emit a cacheline (8 instructions) of NOPs at the end of the program to
-    * make sure that instruction prefetch doesn't wander off into some other BO.
-    */
-   for (i = 0; i < 8; i++)
-      brw_NOP(p);
-
    *sz = p->next_insn_offset;
    return (const GLuint *)p->store;
 }