internal-fn: Avoid dropping the lhs of some calls [PR94941]
authorRichard Sandiford <richard.sandiford@arm.com>
Mon, 4 May 2020 20:21:16 +0000 (21:21 +0100)
committerRichard Sandiford <richard.sandiford@arm.com>
Mon, 4 May 2020 20:21:16 +0000 (21:21 +0100)
create_output_operand coerces an output operand to the insn's
predicates, using a suggested rtx location if convenient.
But if that rtx location is actually required rather than
optional, the builder of the insn has to emit a move afterwards.

(We could instead add a new interface that does this automatically,
but that's future work.)

This PR shows that we were failing to emit the move for some of the
vector load internal functions.  I think there are other routines in
internal-fn.c that potentially have the same problem, but this patch is
supposed to be a conservative subset suitable for backporting to GCC 10.

2020-05-04  Richard Sandiford  <richard.sandiford@arm.com>

gcc/
PR middle-end/94941
* internal-fn.c (expand_load_lanes_optab_fn): Emit a move if the
chosen lhs is different from the gcall lhs.
(expand_mask_load_optab_fn): Likewise.
(expand_gather_load_optab_fn): Likewise.

gcc/testsuite/
PR middle-end/94941
* gcc.target/aarch64/sve/acle/general/unoptimized_1.c: New test.

gcc/ChangeLog
gcc/internal-fn.c
gcc/testsuite/ChangeLog
gcc/testsuite/gcc.target/aarch64/sve/acle/general/unoptimized_1.c [new file with mode: 0644]

index fb294d83348d67900e70d850ae36d7a23b6e6eba..c22e1556a0c44afad4c5b88e79589b0260a1ac17 100644 (file)
@@ -1,3 +1,11 @@
+2020-05-04  Richard Sandiford  <richard.sandiford@arm.com>
+
+       PR middle-end/94941
+       * internal-fn.c (expand_load_lanes_optab_fn): Emit a move if the
+       chosen lhs is different from the gcall lhs.
+       (expand_mask_load_optab_fn): Likewise.
+       (expand_gather_load_optab_fn): Likewise.
+
 2020-05-04  Uroš Bizjak  <ubizjak@gmail.com>
 
        PR target/94795
index 52d1638917a5202bc33cb0e36df97603c46dd0d2..5e9aa60721e8bbd1e80a0a6b9a9733458afda45e 100644 (file)
@@ -167,6 +167,8 @@ expand_load_lanes_optab_fn (internal_fn, gcall *stmt, convert_optab optab)
   create_output_operand (&ops[0], target, TYPE_MODE (type));
   create_fixed_operand (&ops[1], mem);
   expand_insn (get_multi_vector_move (type, optab), 2, ops);
+  if (!rtx_equal_p (target, ops[0].value))
+    emit_move_insn (target, ops[0].value);
 }
 
 /* Expand STORE_LANES call STMT using optab OPTAB.  */
@@ -2507,6 +2509,8 @@ expand_mask_load_optab_fn (internal_fn, gcall *stmt, convert_optab optab)
   create_fixed_operand (&ops[1], mem);
   create_input_operand (&ops[2], mask, TYPE_MODE (TREE_TYPE (maskt)));
   expand_insn (icode, 3, ops);
+  if (!rtx_equal_p (target, ops[0].value))
+    emit_move_insn (target, ops[0].value);
 }
 
 #define expand_mask_load_lanes_optab_fn expand_mask_load_optab_fn
@@ -2827,6 +2831,8 @@ expand_gather_load_optab_fn (internal_fn, gcall *stmt, direct_optab optab)
   insn_code icode = convert_optab_handler (optab, TYPE_MODE (TREE_TYPE (lhs)),
                                           TYPE_MODE (TREE_TYPE (offset)));
   expand_insn (icode, i, ops);
+  if (!rtx_equal_p (lhs_rtx, ops[0].value))
+    emit_move_insn (lhs_rtx, ops[0].value);
 }
 
 /* Expand DIVMOD() using:
index 48a76ebecc07c37c5e31ebb70398cdb3af9e244c..4a36c855d39f4b4f5b3ef8be4b4c37963c578db2 100644 (file)
@@ -1,3 +1,8 @@
+2020-05-04  Richard Sandiford  <richard.sandiford@arm.com>
+
+       PR middle-end/94941
+       * gcc.target/aarch64/sve/acle/general/unoptimized_1.c: New test.
+
 2020-05-04  Uroš Bizjak  <ubizjak@gmail.com>
 
        PR target/94795
diff --git a/gcc/testsuite/gcc.target/aarch64/sve/acle/general/unoptimized_1.c b/gcc/testsuite/gcc.target/aarch64/sve/acle/general/unoptimized_1.c
new file mode 100644 (file)
index 0000000..18d73e2
--- /dev/null
@@ -0,0 +1,21 @@
+/* { dg-do run { target aarch64_sve_hw } } */
+
+#include <arm_sve.h>
+
+svfloat32_t
+foo (float *ptr)
+{
+  svbool_t pg = svptrue_pat_b32 (SV_VL1);
+  svfloat32_t res = svld1 (pg, ptr);
+  return res;
+}
+
+int
+main (void)
+{
+  svbool_t pg = svptrue_pat_b32 (SV_VL1);
+  float x[1] = { 1 };
+  if (svptest_any (pg, svcmpne (pg, foo (x), 1.0)))
+    __builtin_abort ();
+  return 0;
+}