Update fall through pattern for FP16 patterns in ARM.
authorTamar Christina <tamar.christina@arm.com>
Thu, 16 Aug 2018 10:39:13 +0000 (10:39 +0000)
committerTamar Christina <tnfchris@gcc.gnu.org>
Thu, 16 Aug 2018 10:39:13 +0000 (10:39 +0000)
commit2a9234e81e7403f86d81f6401aab1460f44a432d
treeb5d753149603a093833e3250e8fecd51186de3b1
parent02e13564acc1984a82e13ecd72542a594ff23a58
Update fall through pattern for FP16 patterns in ARM.

The original issue comes from the fact that the code does

... foo (... bar)
{
  return bar;
}

The expansion of the return statement causes GCC to try to return the value in
a register.  GCC will try to emit the move then, from MEM to REG (due to the SSA
temporary.).  It checks for a mov optab for this which isn't available and
then tries to do the move in bits using emit_move_multi_word.

emit_move_multi_word will split the move into sub parts, but then needs to get
the sub parts and does this using subregs, but it's told it can't do subregs!

The compiler is now stuck in an infinite loop.

The way this is worked around in the back-end is that we have move patterns in
neon.md that usually just force the register instead of checking with the
back-end. This prevents emit_move_multi_word from being needed.  However the
pattern for V4HF and V8HF were guarded by TARGET_NEON && TARGET_FP16.

I don't believe the TARGET_FP16 guard to be needed, because the pattern doesn't
actually generate code and requires another pattern for that, and a reg to reg move
should always be possible anyway. So allowing the force to register here is safe
and it allows the compiler to generate a correct error instead of ICEing in an
infinite loop.

gcc/
2018-08-16  Tamar Christina  <tamar.christina@arm.com>

PR target/84711
* config/arm/arm.c (arm_can_change_mode_class): Disallow subreg.
* config/arm/neon.md (movv4hf, movv8hf): Refactored to..
(mov<mov>): ..this and enable unconditionally.

From-SVN: r263584
gcc/ChangeLog
gcc/config/arm/arm.c
gcc/config/arm/neon.md