i965/gen4-5: Program the execution size correctly for DO/WHILE instructions.
authorFrancisco Jerez <currojerez@riseup.net>
Mon, 6 Jul 2015 16:11:54 +0000 (19:11 +0300)
committerFrancisco Jerez <currojerez@riseup.net>
Tue, 7 Jul 2015 17:20:22 +0000 (20:20 +0300)
From the hardware docs for the DO instruction:

 "Execution size is ignored for this instruction."

My observation on ILK hardware contradicts the spec though, channels
over the execution size of a DO instruction won't enter the loop, and
channels over the execution size of a WHILE instruction will exit the
loop after the first iteration -- The latter is consistent with the
spec though, there's no claim about the execution size being ignored
for the WHILE instruction so it's not completely unexpected that it
has an influence on the evaluation of EMask.

The execute_size argument of brw_DO() shouldn't have any effect on
Gen6 and newer hardware.  On Gen4-5 WHILE instructions inherit the
execution size from the matching DO, so this patch should fix them
too.  The execution size of BREAK and CONT instructions was already
being set correctly.

Fixes some 50 piglit tests on Gen4-5 when forced to run shaders with
conditional and loop instructions 16-wide,
e.g. shaders/glsl-fs-continue-inside-do-while.

Reviewed-by: Matt Turner <mattst88@gmail.com>
Reviewed-by: Kenneth Graunke <kenneth@whitecape.org>
src/mesa/drivers/dri/i965/brw_fs_generator.cpp

index 0a70bdc3c76e434727d4dc20ea6e62bbcd3054fc..c986d91d988dfdfca8331b84ed021b97f88ef753 100644 (file)
@@ -1869,7 +1869,7 @@ fs_generator::generate_code(const cfg_t *cfg, int dispatch_width)
         break;
 
       case BRW_OPCODE_DO:
-        brw_DO(p, BRW_EXECUTE_8);
+        brw_DO(p, dispatch_width == 16 ? BRW_EXECUTE_16 : BRW_EXECUTE_8);
         break;
 
       case BRW_OPCODE_BREAK: