i386: Use ix86_output_ssemov for SFmode TYPE_SSEMOV
authorH.J. Lu <hjl.tools@gmail.com>
Sun, 15 Mar 2020 17:21:08 +0000 (10:21 -0700)
committerH.J. Lu <hjl.tools@gmail.com>
Sun, 15 Mar 2020 17:21:21 +0000 (10:21 -0700)
There is no need to set mode attribute to V16SFmode since ix86_output_ssemov
can properly encode xmm16-xmm31 registers with and without AVX512VL.

gcc/

PR target/89229
* config/i386/i386.c (ix86_output_ssemov): Handle MODE_SI and
MODE_SF.
* config/i386/i386.md (*movsf_internal): Call ix86_output_ssemov
for TYPE_SSEMOV.  Remove TARGET_PREFER_AVX256, TARGET_AVX512VL
and ext_sse_reg_operand check.

gcc/testsuite/

PR target/89229
* gcc.target/i386/pr89229-6a.c: New test.
* gcc.target/i386/pr89229-6b.c: Likewise.
* gcc.target/i386/pr89229-6c.c: Likewise.

gcc/ChangeLog
gcc/config/i386/i386.c
gcc/config/i386/i386.md
gcc/testsuite/ChangeLog
gcc/testsuite/gcc.target/i386/pr89229-6a.c [new file with mode: 0644]
gcc/testsuite/gcc.target/i386/pr89229-6b.c [new file with mode: 0644]
gcc/testsuite/gcc.target/i386/pr89229-6c.c [new file with mode: 0644]

index af96a9bbb81c1056e7e657592707c7e2146ff848..6718f712b8b2bfe3e28aadec5636dbad05b5a9bb 100644 (file)
@@ -1,3 +1,12 @@
+2020-03-15  H.J. Lu  <hongjiu.lu@intel.com>
+
+       PR target/89229
+       * config/i386/i386.c (ix86_output_ssemov): Handle MODE_SI and
+       MODE_SF.
+       * config/i386/i386.md (*movsf_internal): Call ix86_output_ssemov
+       for TYPE_SSEMOV.  Remove TARGET_PREFER_AVX256, TARGET_AVX512VL
+       and ext_sse_reg_operand check.
+
 2020-03-15  Lewis Hyatt  <lhyatt@gmail.com>
 
        * common.opt: Avoid redundancy in the help text.
index 924f9558b244b0f287deadebb89dd2cf7581353b..d1910b42b1b1fff5d168536ecae38d51f5086c2a 100644 (file)
@@ -5127,12 +5127,21 @@ ix86_output_ssemov (rtx_insn *insn, rtx *operands)
       else
        return "%vmovq\t{%1, %0|%0, %1}";
 
+    case MODE_SI:
+      return "%vmovd\t{%1, %0|%0, %1}";
+
     case MODE_DF:
       if (TARGET_AVX && REG_P (operands[0]) && REG_P (operands[1]))
        return "vmovsd\t{%d1, %0|%0, %d1}";
       else
        return "%vmovsd\t{%1, %0|%0, %1}";
 
+    case MODE_SF:
+      if (TARGET_AVX && REG_P (operands[0]) && REG_P (operands[1]))
+       return "vmovss\t{%d1, %0|%0, %d1}";
+      else
+       return "%vmovss\t{%1, %0|%0, %1}";
+
     case MODE_V1DF:
       gcc_assert (!TARGET_AVX);
       return "movlpd\t{%1, %0|%0, %1}";
index 6fa5db0a452add6d802369c167cc3068c6acd64f..af39f90c68e3d379fe51dc44fd0838a72aea8864 100644 (file)
       return standard_sse_constant_opcode (insn, operands);
 
     case TYPE_SSEMOV:
-      switch (get_attr_mode (insn))
-       {
-       case MODE_SF:
-         if (TARGET_AVX && REG_P (operands[0]) && REG_P (operands[1]))
-           return "vmovss\t{%d1, %0|%0, %d1}";
-         return "%vmovss\t{%1, %0|%0, %1}";
-
-       case MODE_V16SF:
-         return "vmovaps\t{%g1, %g0|%g0, %g1}";
-       case MODE_V4SF:
-         return "%vmovaps\t{%1, %0|%0, %1}";
-
-       case MODE_SI:
-         return "%vmovd\t{%1, %0|%0, %1}";
-
-       default:
-         gcc_unreachable ();
-       }
+      return ix86_output_ssemov (insn, operands);
 
     case TYPE_MMXMOV:
       switch (get_attr_mode (insn))
                  better to maintain the whole registers in single format
                  to avoid problems on using packed logical operations.  */
               (eq_attr "alternative" "6")
-                (cond [(and (ior (not (match_test "TARGET_PREFER_AVX256"))
-                                 (not (match_test "TARGET_AVX512VL")))
-                            (ior (match_operand 0 "ext_sse_reg_operand")
-                                 (match_operand 1 "ext_sse_reg_operand")))
-                         (const_string "V16SF")
-                       (ior (match_test "TARGET_SSE_PARTIAL_REG_DEPENDENCY")
+                (cond [(ior (match_test "TARGET_SSE_PARTIAL_REG_DEPENDENCY")
                             (match_test "TARGET_SSE_SPLIT_REGS"))
                          (const_string "V4SF")
                       ]
index 02205f18219d1261b55ae1215f167116b049e3a4..f79f1c7c303bb38bd4974dd4906c18a8e2949d57 100644 (file)
@@ -1,3 +1,10 @@
+2020-03-15  H.J. Lu  <hongjiu.lu@intel.com>
+
+       PR target/89229
+       * gcc.target/i386/pr89229-6a.c: New test.
+       * gcc.target/i386/pr89229-6b.c: Likewise.
+       * gcc.target/i386/pr89229-6c.c: Likewise.
+
 2020-03-15  Lewis Hyatt  <lhyatt@gmail.com>
 
        * gcc.misc-tests/help.exp: Adapt to new output for
diff --git a/gcc/testsuite/gcc.target/i386/pr89229-6a.c b/gcc/testsuite/gcc.target/i386/pr89229-6a.c
new file mode 100644 (file)
index 0000000..856115b
--- /dev/null
@@ -0,0 +1,16 @@
+/* { dg-do compile { target { ! ia32 } } } */
+/* { dg-options "-O2 -march=skylake-avx512" } */
+
+extern float d;
+
+void
+foo1 (float x)
+{
+  register float xmm16 __asm ("xmm16") = x;
+  asm volatile ("" : "+v" (xmm16));
+  register float xmm17 __asm ("xmm17") = xmm16;
+  asm volatile ("" : "+v" (xmm17));
+  d = xmm17;
+}
+
+/* { dg-final { scan-assembler-not "%zmm\[0-9\]+" } } */
diff --git a/gcc/testsuite/gcc.target/i386/pr89229-6b.c b/gcc/testsuite/gcc.target/i386/pr89229-6b.c
new file mode 100644 (file)
index 0000000..a74f716
--- /dev/null
@@ -0,0 +1,6 @@
+/* { dg-do compile { target { ! ia32 } } } */
+/* { dg-options "-O2 -march=skylake-avx512 -mno-avx512vl" } */
+
+#include "pr89229-6a.c"
+
+/* { dg-final { scan-assembler-times "vmovaps\[^\n\r]*zmm1\[67]\[^\n\r]*zmm1\[67]" 1 } } */
diff --git a/gcc/testsuite/gcc.target/i386/pr89229-6c.c b/gcc/testsuite/gcc.target/i386/pr89229-6c.c
new file mode 100644 (file)
index 0000000..7a4d254
--- /dev/null
@@ -0,0 +1,6 @@
+/* { dg-do compile { target { ! ia32 } } } */
+/* { dg-options "-O2 -march=skylake-avx512 -mprefer-vector-width=512" } */
+
+#include "pr89229-6a.c"
+
+/* { dg-final { scan-assembler-not "%zmm\[0-9\]+" } } */