intel/fs: Add an UNDEF instruction to avoid excess live ranges
authorJason Ekstrand <jason@jlekstrand.net>
Wed, 29 May 2019 22:46:55 +0000 (17:46 -0500)
committerJason Ekstrand <jason@jlekstrand.net>
Tue, 4 Jun 2019 19:27:30 +0000 (14:27 -0500)
commitf4ef34f207d15bcade7aed644328035dd0f2cc16
treeb5e4c42aad4c00f5b342d1ba8311fde07713c74e
parentd482a8f680f7a4aa3073d08a868b5ab69ec86bbb
intel/fs: Add an UNDEF instruction to avoid excess live ranges

With 8 and 16-bit types and anything where we have to use non-trivial
strides registersto deal with restrictions, we end up with things that
look like partial writes even though we don't care about any values in
the register except those written by that instruction.  This is
particularly important when dealing with loops because liveness sees
is_partial_write and the fact that an old version from a previous loop
iteration may be valid at that point and extends all purely partially
written values to the entire loop.

This commit adds a new UNDEF instruction which does nothing (the
generator doesn't emit anything) but which does a fake write to the
register.  This informs liveness that we don't care about any values
before that point so it won't consider those registers to be falsely
live.  We can safely emit UNDEF instructions for all SSA values that
come in from NIR and nearly all temporaries generated by various stages
of the compiler.  In particular, we need to insert UNDEF instructions
when we handle region restrictions because the newly allocated registers
are almost guaranteed to be partially written.

No shader-db changes.

Bugzilla: https://bugs.freedesktop.org/show_bug.cgi?id=110432
Reviewed-by: Matt Turner <mattst88@gmail.com>
src/intel/compiler/brw_eu_defines.h
src/intel/compiler/brw_fs_builder.h
src/intel/compiler/brw_fs_generator.cpp
src/intel/compiler/brw_fs_lower_regioning.cpp
src/intel/compiler/brw_fs_nir.cpp
src/intel/compiler/brw_shader.cpp