radv: using tls to store llvm related info and speed up compiles (v10)
authorDave Airlie <airlied@redhat.com>
Wed, 27 Jun 2018 01:34:25 +0000 (11:34 +1000)
committerDave Airlie <airlied@redhat.com>
Mon, 9 Jul 2018 21:58:03 +0000 (07:58 +1000)
commit6f3aee40f90d725653b671d652d8f0c841ccd2a9
tree25bee56a5908615c5e599bf6ae8beb566479fe48
parentc1ec5820593184304d3ac3622b53f08ef610be4d
radv: using tls to store llvm related info and speed up compiles (v10)

This uses the common compiler passes abstraction to help radv
avoid fixed cost compiler overheads. This uses a linked list per
thread stored in thread local storage, with an entry in the list
for each target machine.

This should remove all the fixed overheads setup costs of creating
the pass manager each time.

This takes a demo app time to compile the radv meta shaders on nocache
and exit from 1.7s to 1s. It also has been reported to take the startup
time of uncached shaders on RoTR from 12m24s to 11m35s (Alex)

v2: fix llvm6 build, inline emit function, handle multiple targets
in one thread
v3: rebase and port onto new structure
v4: rename some vars (Bas)
v5: drag all code into radv for now, we can refactor it out later
for radeonsi if we make it shareable
v6: use a bit more C++ in the wrapper
v7: logic bugs fixed so it actually runs again.
v8: rebase on top of radeonsi changes.
v9: drop some C++ headers, cleanup list entry
v10: use pop_back (didn't have enough caffeine)

Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl>
src/amd/vulkan/Makefile.sources
src/amd/vulkan/meson.build
src/amd/vulkan/radv_debug.h
src/amd/vulkan/radv_device.c
src/amd/vulkan/radv_llvm_helper.cpp [new file with mode: 0644]
src/amd/vulkan/radv_nir_to_llvm.c
src/amd/vulkan/radv_shader.c
src/amd/vulkan/radv_shader_helper.h [new file with mode: 0644]