i965/fs: Disable CSE on instructions writing to HW_REG.
authorMatt Turner <mattst88@gmail.com>
Thu, 26 Sep 2013 20:38:11 +0000 (13:38 -0700)
committerMatt Turner <mattst88@gmail.com>
Mon, 7 Oct 2013 17:43:19 +0000 (10:43 -0700)
CSE would otherwise combine the two mul(8) emitted by [iu]mulExtended:

mul(8)  acc0 x y
mach(8) null x y
mov(8)  lsb  acc0
...
mul(8)  acc0 x y
mach(8) msb  x y
Into:
mul(8)  temp x y
mov(8)  acc0 temp
mach(8) null x y
mov(8)  lsb  acc0
...
mov(8)  acc0 temp
mach(8) msb  x y

But mul(8) into the accumulator produces more than 32-bits of precision,
which is required and lost if multiplying into a general register and
moving to the accumulator.

Reviewed-by: Eric Anholt <eric@anholt.net>
src/mesa/drivers/dri/i965/brw_fs_cse.cpp

index ccd4e5edd1e5c6af01ea2576d78ba4d2b6f9d09a..61b3aeb5ac16622c8b5ec46bdecaf24e6177f147 100644 (file)
@@ -98,7 +98,8 @@ fs_visitor::opt_cse_local(bblock_t *block, exec_list *aeb)
       if (is_expression(inst) &&
           !inst->predicate &&
           !inst->is_partial_write() &&
-          !inst->conditional_mod)
+          !inst->conditional_mod &&
+          inst->dst.file != HW_REG)
       {
         bool found = false;