i965/fs: Don't CSE negated multiplies with saturation.
authorMatt Turner <mattst88@gmail.com>
Mon, 22 Feb 2016 18:25:38 +0000 (10:25 -0800)
committerMatt Turner <mattst88@gmail.com>
Thu, 25 Feb 2016 18:51:04 +0000 (10:51 -0800)
It's not correct to CSE these multiplies

   mul.sat dst1, -a, b
   mul.sat dst2,  a, b

by emitting a negated MOV from dst1 to dst2:

   mul.sat dst1, -a, b
   mov     dst2, -dst1

Take 2.0*2.0 for example. The first multiply would produce 0.0 and the
second would produce 1.0.

Fixes bad generated code in 18 to 22 shaders:

instructions in affected programs: 432 -> 464 (7.41%)
helped: 4
HURT: 18

Cc: mesa-stable@lists.freedesktop.org
Reviewed-by: Ian Romanick <ian.d.romanick@intel.com>
src/mesa/drivers/dri/i965/brw_fs_cse.cpp

index cde6566c05c043a0e721c7272c9126a7a0b154ce..0e743de7faf7ee5f2e12282b77d65c3cf62dc37e 100644 (file)
@@ -139,6 +139,8 @@ operands_match(const fs_inst *a, const fs_inst *b, bool *negate)
       ys[1].f = ys1_imm;
 
       *negate = (xs0_negate != xs1_negate) != (ys0_negate != ys1_negate);
+      if (*negate && (a->saturate || b->saturate))
+         return false;
       return ret;
    } else if (!a->is_commutative()) {
       bool match = true;