aarch64: intrinsics extract half of bf16 vector

author Dennis Zhang <denzha01@e124712.cambridge.arm.com>

Tue, 3 Nov 2020 16:56:02 +0000 (16:56 +0000)

committer Dennis Zhang <denzha01@e124712.cambridge.arm.com>

Tue, 3 Nov 2020 16:56:02 +0000 (16:56 +0000)
author Dennis Zhang <denzha01@e124712.cambridge.arm.com>
Tue, 3 Nov 2020 16:56:02 +0000 (16:56 +0000)
committer Dennis Zhang <denzha01@e124712.cambridge.arm.com>
Tue, 3 Nov 2020 16:56:02 +0000 (16:56 +0000)
diff --git a/gcc/ChangeLog b/gcc/ChangeLog

index 5de466df34787d956fe26123e988c651cff30244..748614418b240df121aea2045de2b0b40b671ef7 100644 (file)
--- a/gcc/ChangeLog
+++ b/gcc/ChangeLog
@@ -1,3 +1,12 @@
+2020-11-03  Dennis Zhang  <dennis.zhang@arm.com>
+
+       * config/aarch64/aarch64-simd-builtins.def (vget_lo_half): New entry.
+       (vget_hi_half): Likewise.
+       * config/aarch64/aarch64-simd.md (aarch64_vget_lo_halfv8bf): New entry.
+       (aarch64_vget_hi_halfv8bf): Likewise.
+       * config/aarch64/arm_neon.h (vget_low_bf16): New intrinsic.
+       (vget_high_bf16): Likewise.
+
  2020-11-03  Bernd Edlinger  <bernd.edlinger@hotmail.de>
  
         PR target/97205
diff --git a/gcc/config/aarch64/aarch64-simd-builtins.def b/gcc/config/aarch64/aarch64-simd-builtins.def

index 5b78bc536e02b9aa14152f944db30da8d9b4a2b6..6d898d4503a8d42897aead4725d96545db09cc7f 100644 (file)
--- a/gcc/config/aarch64/aarch64-simd-builtins.def
+++ b/gcc/config/aarch64/aarch64-simd-builtins.def
@@ -722,6 +722,10 @@
    VAR1 (QUADOP_LANE, bfmlalb_lane_q, 0, ALL, v4sf)
    VAR1 (QUADOP_LANE, bfmlalt_lane_q, 0, ALL, v4sf)
  
+  /* Implemented by aarch64_vget_lo/hi_halfv8bf.  */
+  VAR1 (UNOP, vget_lo_half, 0, AUTO_FP, v8bf)
+  VAR1 (UNOP, vget_hi_half, 0, AUTO_FP, v8bf)
+
    /* Implemented by aarch64_simd_<sur>mmlav16qi.  */
    VAR1 (TERNOP, simd_smmla, 0, NONE, v16qi)
    VAR1 (TERNOPU, simd_ummla, 0, NONE, v16qi)
diff --git a/gcc/config/aarch64/aarch64-simd.md b/gcc/config/aarch64/aarch64-simd.md

index 030a086d31c29ebbebef2b89a6430dc1547aad4b..a667efa15ed7c322a536e35c0684b498c08545e8 100644 (file)
--- a/gcc/config/aarch64/aarch64-simd.md
+++ b/gcc/config/aarch64/aarch64-simd.md
@@ -7159,6 +7159,27 @@
    [(set_attr "type" "neon_dot<VDQSF:q>")]
  )
  
+;; vget_low/high_bf16
+(define_expand "aarch64_vget_lo_halfv8bf"
+  [(match_operand:V4BF 0 "register_operand")
+   (match_operand:V8BF 1 "register_operand")]
+  "TARGET_BF16_SIMD"
+{
+  rtx p = aarch64_simd_vect_par_cnst_half (V8BFmode, 8, false);
+  emit_insn (gen_aarch64_get_halfv8bf (operands[0], operands[1], p));
+  DONE;
+})
+
+(define_expand "aarch64_vget_hi_halfv8bf"
+  [(match_operand:V4BF 0 "register_operand")
+   (match_operand:V8BF 1 "register_operand")]
+  "TARGET_BF16_SIMD"
+{
+  rtx p = aarch64_simd_vect_par_cnst_half (V8BFmode, 8, true);
+  emit_insn (gen_aarch64_get_halfv8bf (operands[0], operands[1], p));
+  DONE;
+})
+
  ;; bfmmla
  (define_insn "aarch64_bfmmlaqv4sf"
    [(set (match_operand:V4SF 0 "register_operand" "=w")
diff --git a/gcc/config/aarch64/arm_neon.h b/gcc/config/aarch64/arm_neon.h

index 69cccd3278642814f3961c5bf52be5639f5ef3f3..0009e50f3feb6235ddc200afa3da7c45ea5755fe 100644 (file)
--- a/gcc/config/aarch64/arm_neon.h
+++ b/gcc/config/aarch64/arm_neon.h
@@ -35680,6 +35680,20 @@ vbfmlaltq_laneq_f32 (float32x4_t __r, bfloat16x8_t __a, bfloat16x8_t __b,
    return __builtin_aarch64_bfmlalt_lane_qv4sf (__r, __a, __b, __index);
  }
  
+__extension__ extern __inline bfloat16x4_t
+__attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
+vget_low_bf16 (bfloat16x8_t __a)
+{
+  return __builtin_aarch64_vget_lo_halfv8bf (__a);
+}
+
+__extension__ extern __inline bfloat16x4_t
+__attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
+vget_high_bf16 (bfloat16x8_t __a)
+{
+  return __builtin_aarch64_vget_hi_halfv8bf (__a);
+}
+
  __extension__ extern __inline float32x4_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vcvt_f32_bf16 (bfloat16x4_t __a)
diff --git a/gcc/testsuite/ChangeLog b/gcc/testsuite/ChangeLog

index d4814947cab1dd3b37aa4f5340a8fe60e3ce0933..7068f80a4bef9d360867bed0b1348d8a5e37364a 100644 (file)
--- a/gcc/testsuite/ChangeLog
+++ b/gcc/testsuite/ChangeLog
@@ -1,3 +1,8 @@
+2020-11-03  Dennis Zhang  <dennis.zhang@arm.com>
+
+       * gcc.target/aarch64/advsimd-intrinsics/bf16_get.c: New test.
+       * gcc.target/aarch64/advsimd-intrinsics/bf16_get-be.c: New test.
+       
  2020-11-03  Bernd Edlinger  <bernd.edlinger@hotmail.de>
  
         PR target/97205
diff --git a/gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bf16_get-be.c b/gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bf16_get-be.c

new file mode 100644 (file)

index 0000000..bd9bb11
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bf16_get-be.c
@@ -0,0 +1,27 @@
+/* { dg-do assemble { target { aarch64*-*-* } } } */
+/* { dg-require-effective-target arm_v8_2a_bf16_neon_ok } */
+/* { dg-add-options arm_v8_2a_bf16_neon } */
+/* { dg-additional-options "-mbig-endian -save-temps" } */
+/* { dg-final { check-function-bodies "**" "" {-O[^0]} } } */
+/* { dg-skip-if "" { *-*-* } { "-fno-fat-lto-objects" } } */
+
+#include <arm_neon.h>
+
+/*
+**test_vget_low_bf16:
+**     ret
+*/
+bfloat16x4_t test_vget_low_bf16 (bfloat16x8_t a)
+{
+  return vget_low_bf16 (a);
+}
+
+/*
+**test_vget_high_bf16:
+**     dup     d0, v0.d\[1\]
+**     ret
+*/
+bfloat16x4_t test_vget_high_bf16 (bfloat16x8_t a)
+{
+  return vget_high_bf16 (a);
+}
diff --git a/gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bf16_get.c b/gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bf16_get.c

new file mode 100644 (file)

index 0000000..2193753
--- /dev/null
+++ b/gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bf16_get.c
@@ -0,0 +1,27 @@
+/* { dg-do assemble { target { aarch64*-*-* } } } */
+/* { dg-require-effective-target arm_v8_2a_bf16_neon_ok } */
+/* { dg-add-options arm_v8_2a_bf16_neon } */
+/* { dg-additional-options "-save-temps" } */
+/* { dg-final { check-function-bodies "**" "" {-O[^0]} } } */
+/* { dg-skip-if "" { *-*-* } { "-fno-fat-lto-objects" } } */
+
+#include <arm_neon.h>
+
+/*
+**test_vget_low_bf16:
+**     ret
+*/
+bfloat16x4_t test_vget_low_bf16 (bfloat16x8_t a)
+{
+  return vget_low_bf16 (a);
+}
+
+/*
+**test_vget_high_bf16:
+**     dup     d0, v0.d\[1\]
+**     ret
+*/
+bfloat16x4_t test_vget_high_bf16 (bfloat16x8_t a)
+{
+  return vget_high_bf16 (a);
+}
author	Dennis Zhang <denzha01@e124712.cambridge.arm.com>
	Tue, 3 Nov 2020 16:56:02 +0000 (16:56 +0000)
committer	Dennis Zhang <denzha01@e124712.cambridge.arm.com>
	Tue, 3 Nov 2020 16:56:02 +0000 (16:56 +0000)
gcc/ChangeLog		patch \| blob \| history
gcc/config/aarch64/aarch64-simd-builtins.def		patch \| blob \| history
gcc/config/aarch64/aarch64-simd.md		patch \| blob \| history
gcc/config/aarch64/arm_neon.h		patch \| blob \| history
gcc/testsuite/ChangeLog		patch \| blob \| history
gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bf16_get-be.c	[new file with mode: 0644]	patch \| blob
gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bf16_get.c	[new file with mode: 0644]	patch \| blob