ac: generate FMA for inexact instructions for radeonsi
authorMarek Olšák <marek.olsak@amd.com>
Thu, 23 Apr 2020 02:45:45 +0000 (22:45 -0400)
committerMarge Bot <eric+marge@anholt.net>
Mon, 27 Apr 2020 11:20:16 +0000 (11:20 +0000)
commit4b9370cb0f3a2d9030e827f847f66bdefeaf08fd
treea93eed56d3d23dbbbc442f29bf5e88438baaf6c5
parentf2c2a28073dd4ea0d104f284e874d136880a91a5
ac: generate FMA for inexact instructions for radeonsi

NIR mostly does this already.

Totals:
SGPRS: 2588520 -> 2591784 (0.13 %)
VGPRS: 1666984 -> 1666888 (-0.01 %)
Spilled SGPRs: 4074 -> 4131 (1.40 %)
Spilled VGPRs: 38 -> 38 (0.00 %)
Private memory VGPRs: 2176 -> 2176 (0.00 %)
Scratch size: 2228 -> 2228 (0.00 %) dwords per thread
Code Size: 52726872 -> 52715468 (-0.02 %) bytes
LDS: 92 -> 92 (0.00 %) blocks
Max Waves: 479872 -> 479897 (0.01 %)
Wait states: 0 -> 0 (0.00 %)

Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com>
Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/4696>
src/amd/llvm/ac_llvm_helper.cpp
src/amd/llvm/ac_llvm_util.h
src/amd/llvm/ac_nir_to_llvm.c