+2016-11-22 Jakub Jelinek <jakub@redhat.com>
+
+ PR target/78451
+ * config/i386/avx512bwintrin.h (_mm512_setzero_qi,
+ _mm512_setzero_hi): Removed.
+ (_mm512_maskz_mov_epi16, _mm512_maskz_loadu_epi16,
+ _mm512_maskz_mov_epi8, _mm512_maskz_loadu_epi8,
+ _mm512_maskz_broadcastb_epi8, _mm512_maskz_set1_epi8,
+ _mm512_maskz_broadcastw_epi16, _mm512_maskz_set1_epi16,
+ _mm512_mulhrs_epi16, _mm512_maskz_mulhrs_epi16, _mm512_mulhi_epi16,
+ _mm512_maskz_mulhi_epi16, _mm512_mulhi_epu16,
+ _mm512_maskz_mulhi_epu16, _mm512_maskz_mullo_epi16,
+ _mm512_cvtepi8_epi16, _mm512_maskz_cvtepi8_epi16, _mm512_cvtepu8_epi16,
+ _mm512_maskz_cvtepu8_epi16, _mm512_permutexvar_epi16,
+ _mm512_maskz_permutexvar_epi16, _mm512_avg_epu8, _mm512_maskz_avg_epu8,
+ _mm512_maskz_add_epi8, _mm512_maskz_sub_epi8, _mm512_avg_epu16,
+ _mm512_maskz_avg_epu16, _mm512_subs_epi8, _mm512_maskz_subs_epi8,
+ _mm512_subs_epu8, _mm512_maskz_subs_epu8, _mm512_adds_epi8,
+ _mm512_maskz_adds_epi8, _mm512_adds_epu8, _mm512_maskz_adds_epu8,
+ _mm512_maskz_sub_epi16, _mm512_subs_epi16, _mm512_maskz_subs_epi16,
+ _mm512_subs_epu16, _mm512_maskz_subs_epu16, _mm512_maskz_add_epi16,
+ _mm512_adds_epi16, _mm512_maskz_adds_epi16, _mm512_adds_epu16,
+ _mm512_maskz_adds_epu16, _mm512_srl_epi16, _mm512_maskz_srl_epi16,
+ _mm512_packs_epi16, _mm512_sll_epi16, _mm512_maskz_sll_epi16,
+ _mm512_maddubs_epi16, _mm512_maskz_maddubs_epi16, _mm512_unpackhi_epi8,
+ _mm512_maskz_unpackhi_epi8, _mm512_unpackhi_epi16,
+ _mm512_maskz_unpackhi_epi16, _mm512_unpacklo_epi8,
+ _mm512_maskz_unpacklo_epi8, _mm512_unpacklo_epi16,
+ _mm512_maskz_unpacklo_epi16, _mm512_shuffle_epi8,
+ _mm512_maskz_shuffle_epi8, _mm512_min_epu16, _mm512_maskz_min_epu16,
+ _mm512_min_epi16, _mm512_maskz_min_epi16, _mm512_max_epu8,
+ _mm512_maskz_max_epu8, _mm512_max_epi8, _mm512_maskz_max_epi8,
+ _mm512_min_epu8, _mm512_maskz_min_epu8, _mm512_min_epi8,
+ _mm512_maskz_min_epi8, _mm512_max_epi16, _mm512_maskz_max_epi16,
+ _mm512_max_epu16, _mm512_maskz_max_epu16, _mm512_sra_epi16,
+ _mm512_maskz_sra_epi16, _mm512_srav_epi16, _mm512_maskz_srav_epi16,
+ _mm512_srlv_epi16, _mm512_maskz_srlv_epi16, _mm512_sllv_epi16,
+ _mm512_maskz_sllv_epi16, _mm512_maskz_packs_epi16, _mm512_packus_epi16,
+ _mm512_maskz_packus_epi16, _mm512_abs_epi8, _mm512_maskz_abs_epi8,
+ _mm512_abs_epi16, _mm512_maskz_abs_epi16, _mm512_dbsad_epu8,
+ _mm512_maskz_dbsad_epu8, _mm512_srli_epi16, _mm512_maskz_srli_epi16,
+ _mm512_slli_epi16, _mm512_maskz_slli_epi16, _mm512_shufflehi_epi16,
+ _mm512_maskz_shufflehi_epi16, _mm512_shufflelo_epi16,
+ _mm512_maskz_shufflelo_epi16, _mm512_srai_epi16,
+ _mm512_maskz_srai_epi16, _mm512_packs_epi32,
+ _mm512_maskz_packs_epi32, _mm512_packus_epi32,
+ _mm512_maskz_packus_epi32): Use _mm512_setzero_si512 instead of
+ _mm512_setzero_qi or _mm512_setzero_hi.
+ (_mm512_maskz_alignr_epi8, _mm512_dbsad_epu8,
+ _mm512_maskz_dbsad_epu8): Formatting fixes.
+ (_mm512_srli_epi16, _mm512_maskz_srli_epi16, _mm512_slli_epi16,
+ _mm512_maskz_slli_epi16, _mm512_shufflehi_epi16,
+ _mm512_maskz_shufflehi_epi16, _mm512_shufflelo_epi16,
+ _mm512_maskz_shufflelo_epi16, _mm512_srai_epi16,
+ _mm512_maskz_srai_epi16): Use _mm512_setzero_si512 instead of
+ _mm512_setzero_qi or _mm512_setzero_hi.
+
2016-11-22 Nathan Sidwell <nathan@acm.org>
* gcc-ar.c (main): Fix indentation.
typedef unsigned long long __mmask64;
-extern __inline __m512i
-__attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
-_mm512_setzero_qi (void)
-{
- return __extension__ (__m512i)(__v64qi){ 0, 0, 0, 0, 0, 0, 0, 0,
- 0, 0, 0, 0, 0, 0, 0, 0,
- 0, 0, 0, 0, 0, 0, 0, 0,
- 0, 0, 0, 0, 0, 0, 0, 0,
- 0, 0, 0, 0, 0, 0, 0, 0,
- 0, 0, 0, 0, 0, 0, 0, 0,
- 0, 0, 0, 0, 0, 0, 0, 0,
- 0, 0, 0, 0, 0, 0, 0, 0 };
-}
-
-extern __inline __m512i
-__attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
-_mm512_setzero_hi (void)
-{
- return __extension__ (__m512i)(__v32hi){ 0, 0, 0, 0, 0, 0, 0, 0,
- 0, 0, 0, 0, 0, 0, 0, 0,
- 0, 0, 0, 0, 0, 0, 0, 0,
- 0, 0, 0, 0, 0, 0, 0, 0 };
-}
-
extern __inline __m512i
__attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
_mm512_mask_mov_epi16 (__m512i __W, __mmask32 __U, __m512i __A)
{
return (__m512i) __builtin_ia32_movdquhi512_mask ((__v32hi) __A,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
{
return (__m512i) __builtin_ia32_loaddquhi512_mask ((const short *) __P,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
{
return (__m512i) __builtin_ia32_movdquqi512_mask ((__v64qi) __A,
(__v64qi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
{
return (__m512i) __builtin_ia32_loaddquqi512_mask ((const char *) __P,
(__v64qi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
{
return (__m512i) __builtin_ia32_pbroadcastb512_mask ((__v16qi) __A,
(__v64qi)
- _mm512_setzero_qi(),
+ _mm512_setzero_si512 (),
__M);
}
__attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
_mm512_maskz_set1_epi8 (__mmask64 __M, char __A)
{
- return (__m512i) __builtin_ia32_pbroadcastb512_gpr_mask (__A,
- (__v64qi)
- _mm512_setzero_qi(),
- __M);
+ return (__m512i)
+ __builtin_ia32_pbroadcastb512_gpr_mask (__A,
+ (__v64qi)
+ _mm512_setzero_si512 (),
+ __M);
}
extern __inline __m512i
{
return (__m512i) __builtin_ia32_pbroadcastw512_mask ((__v8hi) __A,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
__M);
}
__attribute__ ((__gnu_inline__, __always_inline__, __artificial__))
_mm512_maskz_set1_epi16 (__mmask32 __M, short __A)
{
- return (__m512i) __builtin_ia32_pbroadcastw512_gpr_mask (__A,
- (__v32hi)
- _mm512_setzero_hi(),
- __M);
+ return (__m512i)
+ __builtin_ia32_pbroadcastw512_gpr_mask (__A,
+ (__v32hi)
+ _mm512_setzero_si512 (),
+ __M);
}
extern __inline __m512i
return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_pmullw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
{
return (__m512i) __builtin_ia32_pmovsxbw512_mask ((__v32qi) __A,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
{
return (__m512i) __builtin_ia32_pmovsxbw512_mask ((__v32qi) __A,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
{
return (__m512i) __builtin_ia32_pmovzxbw512_mask ((__v32qi) __A,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
{
return (__m512i) __builtin_ia32_pmovzxbw512_mask ((__v32qi) __A,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
(__v32hi) __A,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
(__v32hi) __A,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __M);
}
return (__m512i) __builtin_ia32_pavgb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_pavgb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi(),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
return (__m512i) __builtin_ia32_paddb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
return (__m512i) __builtin_ia32_psubb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
return (__m512i) __builtin_ia32_pavgw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pavgw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
return (__m512i) __builtin_ia32_psubw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_paddw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_psrlw512_mask ((__v32hi) __A,
(__v8hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_psrlw512_mask ((__v32hi) __A,
(__v8hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_packsswb512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_psllw512_mask ((__v32hi) __A,
(__v8hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_psllw512_mask ((__v32hi) __A,
(__v8hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
(__v64qi) __Y,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
(__v64qi) __Y,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_punpckhbw512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_punpckhbw512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi(),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
return (__m512i) __builtin_ia32_punpckhwd512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_punpckhwd512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_punpcklbw512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_punpcklbw512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi(),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
return (__m512i) __builtin_ia32_punpcklwd512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_punpcklwd512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_pshufb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_pshufb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __M);
}
return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __M);
}
return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi(),
+ _mm512_setzero_si512 (),
(__mmask64) __M);
}
return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi(),
+ _mm512_setzero_si512 (),
(__mmask64) __M);
}
return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi(),
+ _mm512_setzero_si512 (),
(__mmask64) __M);
}
return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
(__v64qi) __B,
(__v64qi)
- _mm512_setzero_qi(),
+ _mm512_setzero_si512 (),
(__mmask64) __M);
}
return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __M);
}
return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __M);
}
return (__m512i) __builtin_ia32_psraw512_mask ((__v32hi) __A,
(__v8hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_psraw512_mask ((__v32hi) __A,
(__v8hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_psrav32hi_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_psrav32hi_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_psrlv32hi_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_psrlv32hi_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_psllv32hi_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_psllv32hi_mask ((__v32hi) __A,
(__v32hi) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_packsswb512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v64qi)
- _mm512_setzero_qi(),
+ _mm512_setzero_si512 (),
__M);
}
return (__m512i) __builtin_ia32_packuswb512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
return (__m512i) __builtin_ia32_packuswb512_mask ((__v32hi) __A,
(__v32hi) __B,
(__v64qi)
- _mm512_setzero_qi(),
+ _mm512_setzero_si512 (),
(__mmask64) __M);
}
{
return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) -1);
}
{
return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
(__v64qi)
- _mm512_setzero_qi (),
+ _mm512_setzero_si512 (),
(__mmask64) __U);
}
{
return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
{
return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
(__v64qi) __B,
__imm,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
(__v64qi) __B,
__imm,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
{
return (__m512i) __builtin_ia32_psrlwi512_mask ((__v32hi) __A, __imm,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
{
return (__m512i) __builtin_ia32_psrlwi512_mask ((__v32hi) __A, __imm,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
{
return (__m512i) __builtin_ia32_psllwi512_mask ((__v32hi) __A, __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
{
return (__m512i) __builtin_ia32_psllwi512_mask ((__v32hi) __A, __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_pshufhw512_mask ((__v32hi) __A,
__imm,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pshufhw512_mask ((__v32hi) __A,
__imm,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_pshuflw512_mask ((__v32hi) __A,
__imm,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_pshuflw512_mask ((__v32hi) __A,
__imm,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
{
return (__m512i) __builtin_ia32_psrawi512_mask ((__v32hi) __A, __imm,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
{
return (__m512i) __builtin_ia32_psrawi512_mask ((__v32hi) __A, __imm,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) __U);
}
return (__m512i) __builtin_ia32_packssdw512_mask ((__v16si) __A,
(__v16si) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_packssdw512_mask ((__v16si) __A,
(__v16si) __B,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
__M);
}
return (__m512i) __builtin_ia32_packusdw512_mask ((__v16si) __A,
(__v16si) __B,
(__v32hi)
- _mm512_setzero_hi (),
+ _mm512_setzero_si512 (),
(__mmask32) -1);
}
return (__m512i) __builtin_ia32_packusdw512_mask ((__v16si) __A,
(__v16si) __B,
(__v32hi)
- _mm512_setzero_hi(),
+ _mm512_setzero_si512 (),
__M);
}
#define _mm512_maskz_alignr_epi8(U, X, Y, N) \
((__m512i) __builtin_ia32_palignr512_mask ((__v8di)(__m512i)(X), \
- (__v8di)(__m512i)(Y), (int)(N * 8), \
- (__v8di)(__m512i)_mm512_setzero_si512 (), \
- (__mmask64)(U)))
+ (__v8di)(__m512i)(Y), (int)(N * 8), \
+ (__v8di)(__m512i) \
+ _mm512_setzero_si512 (), \
+ (__mmask64)(U)))
#define _mm512_dbsad_epu8(X, Y, C) \
((__m512i) __builtin_ia32_dbpsadbw512_mask ((__v64qi)(__m512i) (X), \
(__v64qi)(__m512i) (Y), (int) (C), \
- (__v32hi)(__m512i)_mm512_setzero_si512 (),\
+ (__v32hi)(__m512i) \
+ _mm512_setzero_si512 (), \
(__mmask32)-1))
#define _mm512_mask_dbsad_epu8(W, U, X, Y, C) \
#define _mm512_maskz_dbsad_epu8(U, X, Y, C) \
((__m512i) __builtin_ia32_dbpsadbw512_mask ((__v64qi)(__m512i) (X), \
(__v64qi)(__m512i) (Y), (int) (C), \
- (__v32hi)(__m512i)_mm512_setzero_si512 (),\
+ (__v32hi)(__m512i) \
+ _mm512_setzero_si512 (), \
(__mmask32)(U)))
#define _mm512_srli_epi16(A, B) \
((__m512i) __builtin_ia32_psrlwi512_mask ((__v32hi)(__m512i)(A), \
- (int)(B), (__v32hi)_mm512_setzero_hi(), (__mmask32)-1))
+ (int)(B), (__v32hi)_mm512_setzero_si512 (), (__mmask32)-1))
#define _mm512_mask_srli_epi16(W, U, A, B) \
((__m512i) __builtin_ia32_psrlwi512_mask ((__v32hi)(__m512i)(A), \
#define _mm512_maskz_srli_epi16(U, A, B) \
((__m512i) __builtin_ia32_psrlwi512_mask ((__v32hi)(__m512i)(A), \
- (int)(B), (__v32hi)_mm512_setzero_hi(), (__mmask32)(U)))
+ (int)(B), (__v32hi)_mm512_setzero_si512 (), (__mmask32)(U)))
#define _mm512_slli_epi16(X, C) \
((__m512i)__builtin_ia32_psllwi512_mask ((__v32hi)(__m512i)(X), (int)(C),\
- (__v32hi)(__m512i)_mm512_setzero_hi(),\
+ (__v32hi)(__m512i)_mm512_setzero_si512 (), \
(__mmask32)-1))
#define _mm512_mask_slli_epi16(W, U, X, C) \
#define _mm512_maskz_slli_epi16(U, X, C) \
((__m512i)__builtin_ia32_psllwi512_mask ((__v32hi)(__m512i)(X), (int)(C),\
- (__v32hi)(__m512i)_mm512_setzero_hi(),\
+ (__v32hi)(__m512i)_mm512_setzero_si512 (), \
(__mmask32)(U)))
#define _mm512_shufflehi_epi16(A, B) \
((__m512i) __builtin_ia32_pshufhw512_mask ((__v32hi)(__m512i)(A), (int)(B), \
- (__v32hi)(__m512i)_mm512_setzero_hi(), \
+ (__v32hi)(__m512i) \
+ _mm512_setzero_si512 (), \
(__mmask32)-1))
#define _mm512_mask_shufflehi_epi16(W, U, A, B) \
#define _mm512_maskz_shufflehi_epi16(U, A, B) \
((__m512i) __builtin_ia32_pshufhw512_mask ((__v32hi)(__m512i)(A), (int)(B), \
- (__v32hi)(__m512i)_mm512_setzero_hi(), \
+ (__v32hi)(__m512i) \
+ _mm512_setzero_si512 (), \
(__mmask32)(U)))
#define _mm512_shufflelo_epi16(A, B) \
((__m512i) __builtin_ia32_pshuflw512_mask ((__v32hi)(__m512i)(A), (int)(B), \
- (__v32hi)(__m512i)_mm512_setzero_hi(), \
+ (__v32hi)(__m512i) \
+ _mm512_setzero_si512 (), \
(__mmask32)-1))
#define _mm512_mask_shufflelo_epi16(W, U, A, B) \
#define _mm512_maskz_shufflelo_epi16(U, A, B) \
((__m512i) __builtin_ia32_pshuflw512_mask ((__v32hi)(__m512i)(A), (int)(B), \
- (__v32hi)(__m512i)_mm512_setzero_hi(), \
+ (__v32hi)(__m512i) \
+ _mm512_setzero_si512 (), \
(__mmask32)(U)))
#define _mm512_srai_epi16(A, B) \
((__m512i) __builtin_ia32_psrawi512_mask ((__v32hi)(__m512i)(A), \
- (int)(B), (__v32hi)_mm512_setzero_hi(), (__mmask32)-1))
+ (int)(B), (__v32hi)_mm512_setzero_si512 (), (__mmask32)-1))
#define _mm512_mask_srai_epi16(W, U, A, B) \
((__m512i) __builtin_ia32_psrawi512_mask ((__v32hi)(__m512i)(A), \
#define _mm512_maskz_srai_epi16(U, A, B) \
((__m512i) __builtin_ia32_psrawi512_mask ((__v32hi)(__m512i)(A), \
- (int)(B), (__v32hi)_mm512_setzero_hi(), (__mmask32)(U)))
+ (int)(B), (__v32hi)_mm512_setzero_si512 (), (__mmask32)(U)))
#define _mm512_mask_blend_epi16(__U, __A, __W) \
((__m512i) __builtin_ia32_blendmw_512_mask ((__v32hi) (__A), \