aarch64: ACLE intrinsics convert BF16 to Float32

author Dennis Zhang <denzha01@e124712.cambridge.arm.com>

Tue, 3 Nov 2020 13:00:51 +0000 (13:00 +0000)

committer Dennis Zhang <denzha01@e124712.cambridge.arm.com>

Tue, 3 Nov 2020 13:00:51 +0000 (13:00 +0000)
author Dennis Zhang <denzha01@e124712.cambridge.arm.com>
Tue, 3 Nov 2020 13:00:51 +0000 (13:00 +0000)
committer Dennis Zhang <denzha01@e124712.cambridge.arm.com>
Tue, 3 Nov 2020 13:00:51 +0000 (13:00 +0000)
diff --git a/gcc/ChangeLog b/gcc/ChangeLog

index 9f743ecc89a6d61563c159e1ae1cd53b6a8b8c32..2ff5c4e76d1fe3bd89cfebb515a37e33799b6047 100644 (file)
--- a/gcc/ChangeLog
+++ b/gcc/ChangeLog
@@ -1,3 +1,13 @@
+2020-11-03  Dennis Zhang  <dennis.zhang@arm.com>
+
+       * config/aarch64/aarch64-simd-builtins.def(vbfcvt): New entry.
+       (vbfcvt_high, bfcvt): Likewise.
+       * config/aarch64/aarch64-simd.md(aarch64_vbfcvt<mode>): New entry.
+       (aarch64_vbfcvt_highv8bf, aarch64_bfcvtsf): Likewise.
+       * config/aarch64/arm_bf16.h (vcvtah_f32_bf16): New intrinsic.
+       * config/aarch64/arm_neon.h (vcvt_f32_bf16): Likewise.
+       (vcvtq_low_f32_bf16, vcvtq_high_f32_bf16): Likewise.
+
  2020-11-02  Alan Modra  <amodra@gmail.com>
  
         PR middle-end/97267
diff --git a/gcc/config/aarch64/aarch64-simd-builtins.def b/gcc/config/aarch64/aarch64-simd-builtins.def

index eb8e6f7b3d83da0b391bb6f7d5fc4c7ea454dbe3..f494b535a30563da03d3f16d7dfa3f346b3b726a 100644 (file)
--- a/gcc/config/aarch64/aarch64-simd-builtins.def
+++ b/gcc/config/aarch64/aarch64-simd-builtins.def
@@ -732,3 +732,8 @@
    VAR1 (UNOP, bfcvtn_q, 0, FP, v8bf)
    VAR1 (BINOP, bfcvtn2, 0, FP, v8bf)
    VAR1 (UNOP, bfcvt, 0, FP, bf)
+
+  /* Implemented by aarch64_{v}bfcvt{_high}<mode>.  */
+  VAR2 (UNOP, vbfcvt, 0, AUTO_FP, v4bf, v8bf)
+  VAR1 (UNOP, vbfcvt_high, 0, AUTO_FP, v8bf)
+  VAR1 (UNOP, bfcvt, 0, AUTO_FP, sf)
diff --git a/gcc/config/aarch64/aarch64-simd.md b/gcc/config/aarch64/aarch64-simd.md

index 381a702eba003520d2e83e91065d2a808b9c6493..030a086d31c29ebbebef2b89a6430dc1547aad4b 100644 (file)
--- a/gcc/config/aarch64/aarch64-simd.md
+++ b/gcc/config/aarch64/aarch64-simd.md
@@ -7238,3 +7238,31 @@
    "bfcvt\\t%h0, %s1"
    [(set_attr "type" "f_cvt")]
  )
+
+;; Use shl/shll/shll2 to convert BF scalar/vector modes to SF modes.
+(define_insn "aarch64_vbfcvt<mode>"
+  [(set (match_operand:V4SF 0 "register_operand" "=w")
+       (unspec:V4SF [(match_operand:VBF 1 "register_operand" "w")]
+                     UNSPEC_BFCVTN))]
+  "TARGET_BF16_SIMD"
+  "shll\\t%0.4s, %1.4h, #16"
+  [(set_attr "type" "neon_shift_imm_long")]
+)
+
+(define_insn "aarch64_vbfcvt_highv8bf"
+  [(set (match_operand:V4SF 0 "register_operand" "=w")
+       (unspec:V4SF [(match_operand:V8BF 1 "register_operand" "w")]
+                     UNSPEC_BFCVTN2))]
+  "TARGET_BF16_SIMD"
+  "shll2\\t%0.4s, %1.8h, #16"
+  [(set_attr "type" "neon_shift_imm_long")]
+)
+
+(define_insn "aarch64_bfcvtsf"
+  [(set (match_operand:SF 0 "register_operand" "=w")
+       (unspec:SF [(match_operand:BF 1 "register_operand" "w")]
+                   UNSPEC_BFCVT))]
+  "TARGET_BF16_FP"
+  "shl\\t%d0, %d1, #16"
+  [(set_attr "type" "neon_shift_imm")]
+)
diff --git a/gcc/config/aarch64/arm_bf16.h b/gcc/config/aarch64/arm_bf16.h

index 984875dcc014300c489209c11abf41b1c47b7fbe..881615498d3d52662d7ebb3ab1e8d52d5a40cab8 100644 (file)
--- a/gcc/config/aarch64/arm_bf16.h
+++ b/gcc/config/aarch64/arm_bf16.h
@@ -40,6 +40,13 @@ vcvth_bf16_f32 (float32_t __a)
    return __builtin_aarch64_bfcvtbf (__a);
  }
  
+__extension__ extern __inline float32_t
+__attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
+vcvtah_f32_bf16 (bfloat16_t __a)
+{
+  return __builtin_aarch64_bfcvtsf (__a);
+}
+
  #pragma GCC pop_options
  
  #endif
diff --git a/gcc/config/aarch64/arm_neon.h b/gcc/config/aarch64/arm_neon.h

index 95bfa5ebba21b739ee3c84e3971337646f8881d4..69cccd3278642814f3961c5bf52be5639f5ef3f3 100644 (file)
--- a/gcc/config/aarch64/arm_neon.h
+++ b/gcc/config/aarch64/arm_neon.h
@@ -35680,6 +35680,27 @@ vbfmlaltq_laneq_f32 (float32x4_t __r, bfloat16x8_t __a, bfloat16x8_t __b,
    return __builtin_aarch64_bfmlalt_lane_qv4sf (__r, __a, __b, __index);
  }
  
+__extension__ extern __inline float32x4_t
+__attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
+vcvt_f32_bf16 (bfloat16x4_t __a)
+{
+  return __builtin_aarch64_vbfcvtv4bf (__a);
+}
+
+__extension__ extern __inline float32x4_t
+__attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
+vcvtq_low_f32_bf16 (bfloat16x8_t __a)
+{
+  return __builtin_aarch64_vbfcvtv8bf (__a);
+}
+
+__extension__ extern __inline float32x4_t
+__attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
+vcvtq_high_f32_bf16 (bfloat16x8_t __a)
+{
+  return __builtin_aarch64_vbfcvt_highv8bf (__a);
+}
+
  __extension__ extern __inline bfloat16x4_t
  __attribute__ ((__always_inline__, __gnu_inline__, __artificial__))
  vcvt_bf16_f32 (float32x4_t __a)
diff --git a/gcc/testsuite/ChangeLog b/gcc/testsuite/ChangeLog

index 94bddaaee0925abec45d5fb66940b97e4c9fe802..a7bbb1bd1819ccc2ab697db7d412a38968c21857 100644 (file)
--- a/gcc/testsuite/ChangeLog
+++ b/gcc/testsuite/ChangeLog
@@ -1,3 +1,9 @@
+2020-11-03  Dennis Zhang  <dennis.zhang@arm.com>
+
+       * gcc.target/aarch64/advsimd-intrinsics/bfcvt-compile.c
+       (test_vcvt_f32_bf16, test_vcvtq_low_f32_bf16): New tests.
+       (test_vcvtq_high_f32_bf16, test_vcvth_f32_bf16): Likewise.
+       
  2020-11-02  Alan Modra  <amodra@gmail.com>
  
         PR middle-end/97267
diff --git a/gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bfcvt-compile.c b/gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bfcvt-compile.c

index bbea630b1820d578bdf1619834f29b919f5c3f32..47af7c494d9b9d1f4b63e802efc293348a40e270 100644 (file)
--- a/gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bfcvt-compile.c
+++ b/gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bfcvt-compile.c
@@ -46,3 +46,43 @@ bfloat16_t test_bfcvt (float32_t a)
  {
    return vcvth_bf16_f32 (a);
  }
+
+/*
+**test_vcvt_f32_bf16:
+**     shll    v0.4s, v0.4h, #16
+**     ret
+*/
+float32x4_t test_vcvt_f32_bf16 (bfloat16x4_t a)
+{
+  return vcvt_f32_bf16 (a);
+}
+
+/*
+**test_vcvtq_low_f32_bf16:
+**     shll    v0.4s, v0.4h, #16
+**     ret
+*/
+float32x4_t test_vcvtq_low_f32_bf16 (bfloat16x8_t a)
+{
+  return vcvtq_low_f32_bf16 (a);
+}
+
+/*
+**test_vcvtq_high_f32_bf16:
+**     shll2   v0.4s, v0.8h, #16
+**     ret
+*/
+float32x4_t test_vcvtq_high_f32_bf16 (bfloat16x8_t a)
+{
+  return vcvtq_high_f32_bf16 (a);
+}
+
+/*
+**test_vcvtah_f32_bf16:
+**     shl     d0, d0, #16
+**     ret
+*/
+float32_t test_vcvtah_f32_bf16 (bfloat16_t a)
+{
+  return vcvtah_f32_bf16 (a);
+}
author	Dennis Zhang <denzha01@e124712.cambridge.arm.com>
	Tue, 3 Nov 2020 13:00:51 +0000 (13:00 +0000)
committer	Dennis Zhang <denzha01@e124712.cambridge.arm.com>
	Tue, 3 Nov 2020 13:00:51 +0000 (13:00 +0000)
gcc/ChangeLog		patch \| blob \| history
gcc/config/aarch64/aarch64-simd-builtins.def		patch \| blob \| history
gcc/config/aarch64/aarch64-simd.md		patch \| blob \| history
gcc/config/aarch64/arm_bf16.h		patch \| blob \| history
gcc/config/aarch64/arm_neon.h		patch \| blob \| history
gcc/testsuite/ChangeLog		patch \| blob \| history
gcc/testsuite/gcc.target/aarch64/advsimd-intrinsics/bfcvt-compile.c		patch \| blob \| history