nvptx: Support floating point reciprocal instructions

author Roger Sayle <roger@nextmovesoftware.com>

Tue, 28 Jul 2020 13:55:47 +0000 (15:55 +0200)

committer Tom de Vries <tdevries@suse.de>

Wed, 29 Jul 2020 21:05:46 +0000 (23:05 +0200)
author Roger Sayle <roger@nextmovesoftware.com>
Tue, 28 Jul 2020 13:55:47 +0000 (15:55 +0200)
committer Tom de Vries <tdevries@suse.de>
Wed, 29 Jul 2020 21:05:46 +0000 (23:05 +0200)
diff --git a/gcc/config/nvptx/nvptx.md b/gcc/config/nvptx/nvptx.md

index 0538e834a4c263a75c9201724d5a71e0f5494192..746d6ec4124a9041bd205d9aaba6fd548a19e497 100644 (file)
--- a/gcc/config/nvptx/nvptx.md
+++ b/gcc/config/nvptx/nvptx.md
@@ -879,6 +879,15 @@
    ""
    "%.\\tfma%#%t0\\t%0, %1, %2, %3;")
  
+(define_insn "*recip<mode>2"
+  [(set (match_operand:SDFM 0 "nvptx_register_operand" "=R")
+       (div:SDFM
+         (match_operand:SDFM 2 "const_double_operand" "F")
+         (match_operand:SDFM 1 "nvptx_register_operand" "R")))]
+  "CONST_DOUBLE_P (operands[2])
+   && real_identical (CONST_DOUBLE_REAL_VALUE (operands[2]), &dconst1)"
+  "%.\\trcp%#%t0\\t%0, %1;")
+
  (define_insn "div<mode>3"
    [(set (match_operand:SDFM 0 "nvptx_register_operand" "=R")
         (div:SDFM (match_operand:SDFM 1 "nvptx_register_operand" "R")
diff --git a/gcc/testsuite/gcc.target/nvptx/recip-1.c b/gcc/testsuite/gcc.target/nvptx/recip-1.c

new file mode 100644 (file)

index 0000000..1812787
--- /dev/null
+++ b/gcc/testsuite/gcc.target/nvptx/recip-1.c
@@ -0,0 +1,18 @@
+/* { dg-do assemble } */
+/* { dg-options "-O2 -save-temps" } */
+
+double
+foo (double x)
+{
+  return 1.0 / x;
+}
+
+float
+foof (float x)
+{
+  return 1.0f / x;
+}
+
+/* { dg-final { scan-assembler-times "rcp.rn.f64" 1 } } */
+/* { dg-final { scan-assembler-times "rcp.rn.f32" 1 } } */
+
author	Roger Sayle <roger@nextmovesoftware.com>
	Tue, 28 Jul 2020 13:55:47 +0000 (15:55 +0200)
committer	Tom de Vries <tdevries@suse.de>
	Wed, 29 Jul 2020 21:05:46 +0000 (23:05 +0200)
gcc/config/nvptx/nvptx.md		patch \| blob \| history
gcc/testsuite/gcc.target/nvptx/recip-1.c	[new file with mode: 0644]	patch \| blob