aarch64: Reimplememnt vmovn/vmovl intrinsics with builtins instead

author Kyrylo Tkachov <kyrylo.tkachov@arm.com>

Wed, 13 Jan 2021 12:48:57 +0000 (12:48 +0000)

committer Kyrylo Tkachov <kyrylo.tkachov@arm.com>

Thu, 14 Jan 2021 08:36:19 +0000 (08:36 +0000)
author Kyrylo Tkachov <kyrylo.tkachov@arm.com>
Wed, 13 Jan 2021 12:48:57 +0000 (12:48 +0000)
committer Kyrylo Tkachov <kyrylo.tkachov@arm.com>
Thu, 14 Jan 2021 08:36:19 +0000 (08:36 +0000)
diff --git a/gcc/config/aarch64/aarch64-simd-builtins.def b/gcc/config/aarch64/aarch64-simd-builtins.def

index 27e9026d9e8b7ff980c5b8d9ff1b00490e3a18cb..f56e59cf6721229cf84d76f14def9472bc13ba42 100644 (file)
--- a/gcc/config/aarch64/aarch64-simd-builtins.def
+++ b/gcc/config/aarch64/aarch64-simd-builtins.def
@@ -171,6 +171,13 @@
    BUILTIN_VQN (TERNOP, raddhn2, 0, NONE)
    BUILTIN_VQN (TERNOP, rsubhn2, 0, NONE)
  
+  /* Implemented by aarch64_<us>xtl<mode>.  */
+  BUILTIN_VQN (UNOP, sxtl, 0, NONE)
+  BUILTIN_VQN (UNOPU, uxtl, 0, NONE)
+
+  /* Implemented by aarch64_xtn<mode>.  */
+  BUILTIN_VQN (UNOP, xtn, 0, NONE)
+
    BUILTIN_VSQN_HSDI (UNOPUS, sqmovun, 0, ALL)
    /* Implemented by aarch64_<sur>qmovn<mode>.  */
    BUILTIN_VSQN_HSDI (UNOP, sqmovn, 0, ALL)
diff --git a/gcc/config/aarch64/aarch64-simd.md b/gcc/config/aarch64/aarch64-simd.md

index 0827f0eb579cd706c9e18550652c0916fc18230c..4b869ded918fd91ffd41e6ba068239a752b331e5 100644 (file)
--- a/gcc/config/aarch64/aarch64-simd.md
+++ b/gcc/config/aarch64/aarch64-simd.md
@@ -7301,6 +7301,20 @@
    [(set_attr "type" "neon_shift_imm_long")]
  )
  
+(define_expand "aarch64_<su>xtl<mode>"
+  [(set (match_operand:VQN 0 "register_operand" "=w")
+       (ANY_EXTEND:VQN (match_operand:<VNARROWQ> 1 "register_operand" "w")))]
+  "TARGET_SIMD"
+  ""
+)
+
+(define_expand "aarch64_xtn<mode>"
+  [(set (match_operand:<VNARROWQ> 0 "register_operand" "=w")
+       (truncate:<VNARROWQ> (match_operand:VQN 1 "register_operand" "w")))]
+  "TARGET_SIMD"
+  ""
+)
+
  ;; Truncate a 128-bit integer vector to a 64-bit vector.
  (define_insn "trunc<mode><Vnarrowq>2"
    [(set (match_operand:<VNARROWQ> 0 "register_operand" "=w")
diff --git a/gcc/config/aarch64/arm_neon.h b/gcc/config/aarch64/arm_neon.h

index 6095c0dcbfa51ddbbdb4c1e659d9cad6ce7e4c7a..46331ae6f953ba27e39b0d426bc30c5c78af9a06 100644 (file)
--- a/gcc/config/aarch64/arm_neon.h
+++ b/gcc/config/aarch64/arm_neon.h
@@ -8709,42 +8709,42 @@ __extension__ extern __inline int16x8_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovl_s8 (int8x8_t __a)
  {
-  return __builtin_convertvector (__a, int16x8_t);
+  return __builtin_aarch64_sxtlv8hi (__a);
  }
  
  __extension__ extern __inline int32x4_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovl_s16 (int16x4_t __a)
  {
-  return __builtin_convertvector (__a, int32x4_t);
+  return __builtin_aarch64_sxtlv4si (__a);
  }
  
  __extension__ extern __inline int64x2_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovl_s32 (int32x2_t __a)
  {
-  return __builtin_convertvector (__a, int64x2_t);
+  return __builtin_aarch64_sxtlv2di (__a);
  }
  
  __extension__ extern __inline uint16x8_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovl_u8 (uint8x8_t __a)
  {
-  return __builtin_convertvector (__a, uint16x8_t);
+  return __builtin_aarch64_uxtlv8hi_uu (__a);
  }
  
  __extension__ extern __inline uint32x4_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovl_u16 (uint16x4_t __a)
  {
-  return __builtin_convertvector (__a, uint32x4_t);
+  return __builtin_aarch64_uxtlv4si_uu (__a);
  }
  
  __extension__ extern __inline uint64x2_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovl_u32 (uint32x2_t __a)
  {
-  return __builtin_convertvector (__a, uint64x2_t);
+  return __builtin_aarch64_uxtlv2di_uu (__a);
  }
  
  __extension__ extern __inline int8x16_t
@@ -8796,42 +8796,42 @@ __extension__ extern __inline int8x8_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovn_s16 (int16x8_t __a)
  {
-  return __builtin_convertvector (__a, int8x8_t);
+  return __builtin_aarch64_xtnv8hi (__a);
  }
  
  __extension__ extern __inline int16x4_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovn_s32 (int32x4_t __a)
  {
-  return __builtin_convertvector (__a, int16x4_t);
+  return __builtin_aarch64_xtnv4si (__a);
  }
  
  __extension__ extern __inline int32x2_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovn_s64 (int64x2_t __a)
  {
-  return __builtin_convertvector (__a, int32x2_t);
+  return __builtin_aarch64_xtnv2di (__a);
  }
  
  __extension__ extern __inline uint8x8_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovn_u16 (uint16x8_t __a)
  {
-  return __builtin_convertvector (__a, uint8x8_t);
+  return (uint8x8_t)__builtin_aarch64_xtnv8hi ((int16x8_t) __a);
  }
  
  __extension__ extern __inline uint16x4_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovn_u32 (uint32x4_t __a)
  {
-  return __builtin_convertvector (__a, uint16x4_t);
+  return (uint16x4_t) __builtin_aarch64_xtnv4si ((int32x4_t )__a);
  }
  
  __extension__ extern __inline uint32x2_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vmovn_u64 (uint64x2_t __a)
  {
-  return __builtin_convertvector (__a, uint32x2_t);
+  return (uint32x2_t) __builtin_aarch64_xtnv2di ((int64x2_t) __a);
  }
  
  #define vmull_high_lane_s16(a, b, c)                                    \
author	Kyrylo Tkachov <kyrylo.tkachov@arm.com>
	Wed, 13 Jan 2021 12:48:57 +0000 (12:48 +0000)
committer	Kyrylo Tkachov <kyrylo.tkachov@arm.com>
	Thu, 14 Jan 2021 08:36:19 +0000 (08:36 +0000)
gcc/config/aarch64/aarch64-simd-builtins.def		patch \| blob \| history
gcc/config/aarch64/aarch64-simd.md		patch \| blob \| history
gcc/config/aarch64/arm_neon.h		patch \| blob \| history