r600: use ieee version of rcp
authorRoland Scheidegger <sroland@vmware.com>
Thu, 9 Nov 2017 18:44:23 +0000 (19:44 +0100)
committerRoland Scheidegger <sroland@vmware.com>
Wed, 15 Nov 2017 02:13:46 +0000 (03:13 +0100)
r600 used the clamped version for rcp, whereas both evergreen and cayman
used the ieee version. I don't know why that discrepancy exists (it does so
since day 1) but there does not seem to be a valid reason for this, so make
it consistent. This seems now safer than before the previous commit (using
the dx10 clamp bit).
Note that rsq still uses clamped version (as before even though the table
may have suggested otherwise for evergreen) for r600/eg, but not for cayman.
Will be changed separately for better regression tracking...

Reviewed-by: Dave Airlie <airlied@redhat.com>
src/gallium/drivers/r600/r600_shader.c

index 805b3b6b3dc95cf97b34056b1636799fb6222eda..547eebac12228ac9319d8059ca1c8674f243d278 100644 (file)
@@ -9161,11 +9161,7 @@ static const struct r600_shader_tgsi_instruction r600_shader_tgsi_instruction[]
        [TGSI_OPCODE_MOV]       = { ALU_OP1_MOV, tgsi_op2},
        [TGSI_OPCODE_LIT]       = { ALU_OP0_NOP, tgsi_lit},
 
-       /* XXX:
-        * For state trackers other than OpenGL, we'll want to use
-        * _RECIP_IEEE instead.
-        */
-       [TGSI_OPCODE_RCP]       = { ALU_OP1_RECIP_CLAMPED, tgsi_trans_srcx_replicate},
+       [TGSI_OPCODE_RCP]       = { ALU_OP1_RECIP_IEEE, tgsi_trans_srcx_replicate},
 
        [TGSI_OPCODE_RSQ]       = { ALU_OP0_NOP, tgsi_rsq},
        [TGSI_OPCODE_EXP]       = { ALU_OP0_NOP, tgsi_exp},
@@ -9366,7 +9362,7 @@ static const struct r600_shader_tgsi_instruction eg_shader_tgsi_instruction[] =
        [TGSI_OPCODE_MOV]       = { ALU_OP1_MOV, tgsi_op2},
        [TGSI_OPCODE_LIT]       = { ALU_OP0_NOP, tgsi_lit},
        [TGSI_OPCODE_RCP]       = { ALU_OP1_RECIP_IEEE, tgsi_trans_srcx_replicate},
-       [TGSI_OPCODE_RSQ]       = { ALU_OP1_RECIPSQRT_IEEE, tgsi_rsq},
+       [TGSI_OPCODE_RSQ]       = { ALU_OP0_NOP, tgsi_rsq},
        [TGSI_OPCODE_EXP]       = { ALU_OP0_NOP, tgsi_exp},
        [TGSI_OPCODE_LOG]       = { ALU_OP0_NOP, tgsi_log},
        [TGSI_OPCODE_MUL]       = { ALU_OP2_MUL_IEEE, tgsi_op2},