radeonsi/nir: don't lower fma, instead, fuse fma
authorMarek Olšák <marek.olsak@amd.com>
Wed, 13 Nov 2019 05:21:54 +0000 (00:21 -0500)
committerMarek Olšák <marek.olsak@amd.com>
Fri, 15 Nov 2019 19:34:49 +0000 (14:34 -0500)
commitbda3ec5d5507dd10a62e87fc676eeeac93446e3f
tree5795cd53e72fc9814934ced5308da63936eced83
parentdec34e880d0ce2792ecdac18d28e3e3be4dec72f
radeonsi/nir: don't lower fma, instead, fuse fma

We want fma. This decreases compile times by 4% for Borderlands 2.

48505 shaders in 30515 tests
Totals:
SGPRS: 2206584 -> 2204784 (-0.08 %)
VGPRS: 1647892 -> 1648964 (0.07 %)
Spilled SGPRs: 6256 -> 6078 (-2.85 %)
Spilled VGPRs: 72 -> 72 (0.00 %)
Private memory VGPRs: 2176 -> 2176 (0.00 %)
Scratch size: 2240 -> 2240 (0.00 %) dwords per thread
Code Size: 49680804 -> 49837988 (0.32 %) bytes
LDS: 74 -> 74 (0.00 %) blocks
Max Waves: 371387 -> 371352 (-0.01 %)

Reviewed-by: Timothy Arceri <tarceri@itsqueeze.com>
src/gallium/drivers/radeonsi/si_get.c