25 #error "Never use <avx512bwintrin.h> directly; include <immintrin.h> instead."
28 #ifndef __AVX512BWINTRIN_H
29 #define __AVX512BWINTRIN_H
35 #define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512bw")))
39 return (__m512i)(__v64qi){ 0, 0, 0, 0, 0, 0, 0, 0,
40 0, 0, 0, 0, 0, 0, 0, 0,
41 0, 0, 0, 0, 0, 0, 0, 0,
42 0, 0, 0, 0, 0, 0, 0, 0,
43 0, 0, 0, 0, 0, 0, 0, 0,
44 0, 0, 0, 0, 0, 0, 0, 0,
45 0, 0, 0, 0, 0, 0, 0, 0,
46 0, 0, 0, 0, 0, 0, 0, 0 };
51 return (__m512i)(__v32hi){ 0, 0, 0, 0, 0, 0, 0, 0,
52 0, 0, 0, 0, 0, 0, 0, 0,
53 0, 0, 0, 0, 0, 0, 0, 0,
54 0, 0, 0, 0, 0, 0, 0, 0 };
61 return (
__mmask64)__builtin_ia32_pcmpeqb512_mask((__v64qi)__a, (__v64qi)__b,
67 return (
__mmask64)__builtin_ia32_pcmpeqb512_mask((__v64qi)__a, (__v64qi)__b,
73 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 0,
79 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 0,
85 return (
__mmask32)__builtin_ia32_pcmpeqw512_mask((__v32hi)__a, (__v32hi)__b,
91 return (
__mmask32)__builtin_ia32_pcmpeqw512_mask((__v32hi)__a, (__v32hi)__b,
97 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 0,
103 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 0,
109 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 5,
115 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 5,
121 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 5,
127 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 5,
133 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 5,
139 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 5,
145 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 5,
151 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 5,
157 return (
__mmask64)__builtin_ia32_pcmpgtb512_mask((__v64qi)__a, (__v64qi)__b,
163 return (
__mmask64)__builtin_ia32_pcmpgtb512_mask((__v64qi)__a, (__v64qi)__b,
169 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 6,
175 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 6,
181 return (
__mmask32)__builtin_ia32_pcmpgtw512_mask((__v32hi)__a, (__v32hi)__b,
187 return (
__mmask32)__builtin_ia32_pcmpgtw512_mask((__v32hi)__a, (__v32hi)__b,
193 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 6,
199 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 6,
205 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 2,
211 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 2,
217 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 2,
223 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 2,
229 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 2,
235 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 2,
241 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 2,
247 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 2,
253 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 1,
259 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 1,
265 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 1,
271 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 1,
277 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 1,
283 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 1,
289 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 1,
295 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 1,
301 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 4,
307 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 4,
313 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 4,
319 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 4,
325 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 4,
331 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 4,
337 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 4,
343 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 4,
349 return (__m512i) ((__v64qu) __A + (__v64qu) __B);
354 return (__m512i) __builtin_ia32_paddb512_mask ((__v64qi) __A,
362 return (__m512i) __builtin_ia32_paddb512_mask ((__v64qi) __A,
370 return (__m512i) ((__v64qu) __A - (__v64qu) __B);
375 return (__m512i) __builtin_ia32_psubb512_mask ((__v64qi) __A,
383 return (__m512i) __builtin_ia32_psubb512_mask ((__v64qi) __A,
391 return (__m512i) ((__v32hu) __A + (__v32hu) __B);
396 return (__m512i) __builtin_ia32_paddw512_mask ((__v32hi) __A,
404 return (__m512i) __builtin_ia32_paddw512_mask ((__v32hi) __A,
412 return (__m512i) ((__v32hu) __A - (__v32hu) __B);
417 return (__m512i) __builtin_ia32_psubw512_mask ((__v32hi) __A,
425 return (__m512i) __builtin_ia32_psubw512_mask ((__v32hi) __A,
433 return (__m512i) ((__v32hu) __A * (__v32hu) __B);
438 return (__m512i) __builtin_ia32_pmullw512_mask ((__v32hi) __A,
446 return (__m512i) __builtin_ia32_pmullw512_mask ((__v32hi) __A,
455 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
463 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
471 return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
479 return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
487 return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
495 return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
503 return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
511 return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
519 return (__m512i) __builtin_ia32_packssdw512_mask ((__v16si) __A,
528 return (__m512i) __builtin_ia32_packssdw512_mask ((__v16si) __A,
538 return (__m512i) __builtin_ia32_packssdw512_mask ((__v16si) __A,
547 return (__m512i) __builtin_ia32_packsswb512_mask ((__v32hi) __A,
557 return (__m512i) __builtin_ia32_packsswb512_mask ((__v32hi) __A,
566 return (__m512i) __builtin_ia32_packsswb512_mask ((__v32hi) __A,
575 return (__m512i) __builtin_ia32_packusdw512_mask ((__v16si) __A,
584 return (__m512i) __builtin_ia32_packusdw512_mask ((__v16si) __A,
594 return (__m512i) __builtin_ia32_packusdw512_mask ((__v16si) __A,
603 return (__m512i) __builtin_ia32_packuswb512_mask ((__v32hi) __A,
613 return (__m512i) __builtin_ia32_packuswb512_mask ((__v32hi) __A,
622 return (__m512i) __builtin_ia32_packuswb512_mask ((__v32hi) __A,
631 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
641 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
650 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
659 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
669 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
678 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
687 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
697 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
706 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
715 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
725 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
734 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
743 return (__m512i) __builtin_ia32_pavgb512_mask ((__v64qi) __A,
753 return (__m512i) __builtin_ia32_pavgb512_mask ((__v64qi) __A,
762 return (__m512i) __builtin_ia32_pavgb512_mask ((__v64qi) __A,
771 return (__m512i) __builtin_ia32_pavgw512_mask ((__v32hi) __A,
781 return (__m512i) __builtin_ia32_pavgw512_mask ((__v32hi) __A,
790 return (__m512i) __builtin_ia32_pavgw512_mask ((__v32hi) __A,
799 return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
808 return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
818 return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
827 return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
836 return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
846 return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
855 return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
864 return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
874 return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
883 return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
892 return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
902 return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
911 return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
920 return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
930 return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
939 return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
948 return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
958 return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
967 return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
976 return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
986 return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
995 return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
1004 return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
1014 return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
1023 return (__m512i) __builtin_ia32_pshufb512_mask ((__v64qi) __A,
1033 return (__m512i) __builtin_ia32_pshufb512_mask ((__v64qi) __A,
1042 return (__m512i) __builtin_ia32_pshufb512_mask ((__v64qi) __A,
1051 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
1061 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
1070 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
1079 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
1089 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
1098 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
1107 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
1117 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
1126 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
1135 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
1145 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
1154 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
1164 return (__m512i) __builtin_ia32_vpermi2varhi512_mask ((__v32hi) __A,
1173 return (__m512i) __builtin_ia32_vpermt2varhi512_mask ((__v32hi) __I ,
1181 __m512i __I, __m512i __B)
1183 return (__m512i) __builtin_ia32_vpermt2varhi512_mask ((__v32hi) __I ,
1191 __m512i __I, __m512i __B)
1193 return (__m512i) __builtin_ia32_vpermt2varhi512_maskz ((__v32hi) __I
1203 return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
1213 return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
1222 return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
1231 return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
1241 return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
1250 return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
1259 return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
1269 return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
1278 return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
1286 return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
1295 return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
1303 return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
1311 return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
1320 return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
1328 return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
1336 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1343 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1350 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1357 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1364 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1371 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1378 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1385 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1392 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1400 __builtin_ia32_pmovwb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1406 __builtin_ia32_pmovswb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1412 __builtin_ia32_pmovuswb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1417 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1419 10, 64+10, 11, 64+11,
1420 12, 64+12, 13, 64+13,
1421 14, 64+14, 15, 64+15,
1422 24, 64+24, 25, 64+25,
1423 26, 64+26, 27, 64+27,
1424 28, 64+28, 29, 64+29,
1425 30, 64+30, 31, 64+31,
1426 40, 64+40, 41, 64+41,
1427 42, 64+42, 43, 64+43,
1428 44, 64+44, 45, 64+45,
1429 46, 64+46, 47, 64+47,
1430 56, 64+56, 57, 64+57,
1431 58, 64+58, 59, 64+59,
1432 60, 64+60, 61, 64+61,
1433 62, 64+62, 63, 64+63);
1438 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1445 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1452 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1455 12, 32+12, 13, 32+13,
1456 14, 32+14, 15, 32+15,
1457 20, 32+20, 21, 32+21,
1458 22, 32+22, 23, 32+23,
1459 28, 32+28, 29, 32+29,
1460 30, 32+30, 31, 32+31);
1465 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1472 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1479 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1484 16, 64+16, 17, 64+17,
1485 18, 64+18, 19, 64+19,
1486 20, 64+20, 21, 64+21,
1487 22, 64+22, 23, 64+23,
1488 32, 64+32, 33, 64+33,
1489 34, 64+34, 35, 64+35,
1490 36, 64+36, 37, 64+37,
1491 38, 64+38, 39, 64+39,
1492 48, 64+48, 49, 64+49,
1493 50, 64+50, 51, 64+51,
1494 52, 64+52, 53, 64+53,
1495 54, 64+54, 55, 64+55);
1500 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1507 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1514 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1518 10, 32+10, 11, 32+11,
1519 16, 32+16, 17, 32+17,
1520 18, 32+18, 19, 32+19,
1521 24, 32+24, 25, 32+25,
1522 26, 32+26, 27, 32+27);
1527 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1534 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1542 return (__m512i) __builtin_ia32_pmovsxbw512_mask ((__v32qi) __A,
1551 return (__m512i) __builtin_ia32_pmovsxbw512_mask ((__v32qi) __A,
1559 return (__m512i) __builtin_ia32_pmovsxbw512_mask ((__v32qi) __A,
1568 return (__m512i) __builtin_ia32_pmovzxbw512_mask ((__v32qi) __A,
1577 return (__m512i) __builtin_ia32_pmovzxbw512_mask ((__v32qi) __A,
1585 return (__m512i) __builtin_ia32_pmovzxbw512_mask ((__v32qi) __A,
1592 #define _mm512_cmp_epi8_mask(a, b, p) __extension__ ({ \
1593 (__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \
1594 (__v64qi)(__m512i)(b), (int)(p), \
1597 #define _mm512_mask_cmp_epi8_mask(m, a, b, p) __extension__ ({ \
1598 (__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \
1599 (__v64qi)(__m512i)(b), (int)(p), \
1602 #define _mm512_cmp_epu8_mask(a, b, p) __extension__ ({ \
1603 (__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \
1604 (__v64qi)(__m512i)(b), (int)(p), \
1607 #define _mm512_mask_cmp_epu8_mask(m, a, b, p) __extension__ ({ \
1608 (__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \
1609 (__v64qi)(__m512i)(b), (int)(p), \
1612 #define _mm512_cmp_epi16_mask(a, b, p) __extension__ ({ \
1613 (__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \
1614 (__v32hi)(__m512i)(b), (int)(p), \
1617 #define _mm512_mask_cmp_epi16_mask(m, a, b, p) __extension__ ({ \
1618 (__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \
1619 (__v32hi)(__m512i)(b), (int)(p), \
1622 #define _mm512_cmp_epu16_mask(a, b, p) __extension__ ({ \
1623 (__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \
1624 (__v32hi)(__m512i)(b), (int)(p), \
1627 #define _mm512_mask_cmp_epu16_mask(m, a, b, p) __extension__ ({ \
1628 (__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \
1629 (__v32hi)(__m512i)(b), (int)(p), \
1632 #define _mm512_shufflehi_epi16(A, imm) __extension__ ({ \
1633 (__m512i)__builtin_shufflevector((__v32hi)(__m512i)(A), \
1634 (__v32hi)_mm512_undefined_epi32(), \
1636 4 + (((imm) >> 0) & 0x3), \
1637 4 + (((imm) >> 2) & 0x3), \
1638 4 + (((imm) >> 4) & 0x3), \
1639 4 + (((imm) >> 6) & 0x3), \
1641 12 + (((imm) >> 0) & 0x3), \
1642 12 + (((imm) >> 2) & 0x3), \
1643 12 + (((imm) >> 4) & 0x3), \
1644 12 + (((imm) >> 6) & 0x3), \
1646 20 + (((imm) >> 0) & 0x3), \
1647 20 + (((imm) >> 2) & 0x3), \
1648 20 + (((imm) >> 4) & 0x3), \
1649 20 + (((imm) >> 6) & 0x3), \
1651 28 + (((imm) >> 0) & 0x3), \
1652 28 + (((imm) >> 2) & 0x3), \
1653 28 + (((imm) >> 4) & 0x3), \
1654 28 + (((imm) >> 6) & 0x3)); })
1656 #define _mm512_mask_shufflehi_epi16(W, U, A, imm) __extension__ ({ \
1657 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1658 (__v32hi)_mm512_shufflehi_epi16((A), \
1660 (__v32hi)(__m512i)(W)); })
1662 #define _mm512_maskz_shufflehi_epi16(U, A, imm) __extension__ ({ \
1663 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1664 (__v32hi)_mm512_shufflehi_epi16((A), \
1666 (__v32hi)_mm512_setzero_hi()); })
1668 #define _mm512_shufflelo_epi16(A, imm) __extension__ ({ \
1669 (__m512i)__builtin_shufflevector((__v32hi)(__m512i)(A), \
1670 (__v32hi)_mm512_undefined_epi32(), \
1671 0 + (((imm) >> 0) & 0x3), \
1672 0 + (((imm) >> 2) & 0x3), \
1673 0 + (((imm) >> 4) & 0x3), \
1674 0 + (((imm) >> 6) & 0x3), \
1676 8 + (((imm) >> 0) & 0x3), \
1677 8 + (((imm) >> 2) & 0x3), \
1678 8 + (((imm) >> 4) & 0x3), \
1679 8 + (((imm) >> 6) & 0x3), \
1681 16 + (((imm) >> 0) & 0x3), \
1682 16 + (((imm) >> 2) & 0x3), \
1683 16 + (((imm) >> 4) & 0x3), \
1684 16 + (((imm) >> 6) & 0x3), \
1686 24 + (((imm) >> 0) & 0x3), \
1687 24 + (((imm) >> 2) & 0x3), \
1688 24 + (((imm) >> 4) & 0x3), \
1689 24 + (((imm) >> 6) & 0x3), \
1693 #define _mm512_mask_shufflelo_epi16(W, U, A, imm) __extension__ ({ \
1694 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1695 (__v32hi)_mm512_shufflelo_epi16((A), \
1697 (__v32hi)(__m512i)(W)); })
1700 #define _mm512_maskz_shufflelo_epi16(U, A, imm) __extension__ ({ \
1701 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1702 (__v32hi)_mm512_shufflelo_epi16((A), \
1704 (__v32hi)_mm512_setzero_hi()); })
1709 return (__m512i) __builtin_ia32_psllv32hi_mask ((__v32hi) __A,
1720 return (__m512i) __builtin_ia32_psllv32hi_mask ((__v32hi) __A,
1729 return (__m512i) __builtin_ia32_psllv32hi_mask ((__v32hi) __A,
1739 return (__m512i) __builtin_ia32_psllw512_mask ((__v32hi) __A,
1750 return (__m512i) __builtin_ia32_psllw512_mask ((__v32hi) __A,
1759 return (__m512i) __builtin_ia32_psllw512_mask ((__v32hi) __A,
1766 #define _mm512_slli_epi16(A, B) __extension__ ({ \
1767 (__m512i)__builtin_ia32_psllwi512_mask((__v32hi)(__m512i)(A), (int)(B), \
1768 (__v32hi)_mm512_setzero_hi(), \
1771 #define _mm512_mask_slli_epi16(W, U, A, B) __extension__ ({ \
1772 (__m512i)__builtin_ia32_psllwi512_mask((__v32hi)(__m512i)(A), (int)(B), \
1773 (__v32hi)(__m512i)(W), \
1776 #define _mm512_maskz_slli_epi16(U, A, B) __extension__ ({ \
1777 (__m512i)__builtin_ia32_psllwi512_mask((__v32hi)(__m512i)(A), (int)(B), \
1778 (__v32hi)_mm512_setzero_hi(), \
1781 #define _mm512_bslli_epi128(a, imm) __extension__ ({ \
1782 (__m512i)__builtin_shufflevector( \
1783 (__v64qi)_mm512_setzero_si512(), \
1784 (__v64qi)(__m512i)(a), \
1785 ((char)(imm)&0xF0) ? 0 : ((char)(imm)>0x0 ? 16 : 64) - (char)(imm), \
1786 ((char)(imm)&0xF0) ? 1 : ((char)(imm)>0x1 ? 17 : 65) - (char)(imm), \
1787 ((char)(imm)&0xF0) ? 2 : ((char)(imm)>0x2 ? 18 : 66) - (char)(imm), \
1788 ((char)(imm)&0xF0) ? 3 : ((char)(imm)>0x3 ? 19 : 67) - (char)(imm), \
1789 ((char)(imm)&0xF0) ? 4 : ((char)(imm)>0x4 ? 20 : 68) - (char)(imm), \
1790 ((char)(imm)&0xF0) ? 5 : ((char)(imm)>0x5 ? 21 : 69) - (char)(imm), \
1791 ((char)(imm)&0xF0) ? 6 : ((char)(imm)>0x6 ? 22 : 70) - (char)(imm), \
1792 ((char)(imm)&0xF0) ? 7 : ((char)(imm)>0x7 ? 23 : 71) - (char)(imm), \
1793 ((char)(imm)&0xF0) ? 8 : ((char)(imm)>0x8 ? 24 : 72) - (char)(imm), \
1794 ((char)(imm)&0xF0) ? 9 : ((char)(imm)>0x9 ? 25 : 73) - (char)(imm), \
1795 ((char)(imm)&0xF0) ? 10 : ((char)(imm)>0xA ? 26 : 74) - (char)(imm), \
1796 ((char)(imm)&0xF0) ? 11 : ((char)(imm)>0xB ? 27 : 75) - (char)(imm), \
1797 ((char)(imm)&0xF0) ? 12 : ((char)(imm)>0xC ? 28 : 76) - (char)(imm), \
1798 ((char)(imm)&0xF0) ? 13 : ((char)(imm)>0xD ? 29 : 77) - (char)(imm), \
1799 ((char)(imm)&0xF0) ? 14 : ((char)(imm)>0xE ? 30 : 78) - (char)(imm), \
1800 ((char)(imm)&0xF0) ? 15 : ((char)(imm)>0xF ? 31 : 79) - (char)(imm), \
1801 ((char)(imm)&0xF0) ? 16 : ((char)(imm)>0x0 ? 32 : 80) - (char)(imm), \
1802 ((char)(imm)&0xF0) ? 17 : ((char)(imm)>0x1 ? 33 : 81) - (char)(imm), \
1803 ((char)(imm)&0xF0) ? 18 : ((char)(imm)>0x2 ? 34 : 82) - (char)(imm), \
1804 ((char)(imm)&0xF0) ? 19 : ((char)(imm)>0x3 ? 35 : 83) - (char)(imm), \
1805 ((char)(imm)&0xF0) ? 20 : ((char)(imm)>0x4 ? 36 : 84) - (char)(imm), \
1806 ((char)(imm)&0xF0) ? 21 : ((char)(imm)>0x5 ? 37 : 85) - (char)(imm), \
1807 ((char)(imm)&0xF0) ? 22 : ((char)(imm)>0x6 ? 38 : 86) - (char)(imm), \
1808 ((char)(imm)&0xF0) ? 23 : ((char)(imm)>0x7 ? 39 : 87) - (char)(imm), \
1809 ((char)(imm)&0xF0) ? 24 : ((char)(imm)>0x8 ? 40 : 88) - (char)(imm), \
1810 ((char)(imm)&0xF0) ? 25 : ((char)(imm)>0x9 ? 41 : 89) - (char)(imm), \
1811 ((char)(imm)&0xF0) ? 26 : ((char)(imm)>0xA ? 42 : 90) - (char)(imm), \
1812 ((char)(imm)&0xF0) ? 27 : ((char)(imm)>0xB ? 43 : 91) - (char)(imm), \
1813 ((char)(imm)&0xF0) ? 28 : ((char)(imm)>0xC ? 44 : 92) - (char)(imm), \
1814 ((char)(imm)&0xF0) ? 29 : ((char)(imm)>0xD ? 45 : 93) - (char)(imm), \
1815 ((char)(imm)&0xF0) ? 30 : ((char)(imm)>0xE ? 46 : 94) - (char)(imm), \
1816 ((char)(imm)&0xF0) ? 31 : ((char)(imm)>0xF ? 47 : 95) - (char)(imm), \
1817 ((char)(imm)&0xF0) ? 32 : ((char)(imm)>0x0 ? 48 : 96) - (char)(imm), \
1818 ((char)(imm)&0xF0) ? 33 : ((char)(imm)>0x1 ? 49 : 97) - (char)(imm), \
1819 ((char)(imm)&0xF0) ? 34 : ((char)(imm)>0x2 ? 50 : 98) - (char)(imm), \
1820 ((char)(imm)&0xF0) ? 35 : ((char)(imm)>0x3 ? 51 : 99) - (char)(imm), \
1821 ((char)(imm)&0xF0) ? 36 : ((char)(imm)>0x4 ? 52 : 100) - (char)(imm), \
1822 ((char)(imm)&0xF0) ? 37 : ((char)(imm)>0x5 ? 53 : 101) - (char)(imm), \
1823 ((char)(imm)&0xF0) ? 38 : ((char)(imm)>0x6 ? 54 : 102) - (char)(imm), \
1824 ((char)(imm)&0xF0) ? 39 : ((char)(imm)>0x7 ? 55 : 103) - (char)(imm), \
1825 ((char)(imm)&0xF0) ? 40 : ((char)(imm)>0x8 ? 56 : 104) - (char)(imm), \
1826 ((char)(imm)&0xF0) ? 41 : ((char)(imm)>0x9 ? 57 : 105) - (char)(imm), \
1827 ((char)(imm)&0xF0) ? 42 : ((char)(imm)>0xA ? 58 : 106) - (char)(imm), \
1828 ((char)(imm)&0xF0) ? 43 : ((char)(imm)>0xB ? 59 : 107) - (char)(imm), \
1829 ((char)(imm)&0xF0) ? 44 : ((char)(imm)>0xC ? 60 : 108) - (char)(imm), \
1830 ((char)(imm)&0xF0) ? 45 : ((char)(imm)>0xD ? 61 : 109) - (char)(imm), \
1831 ((char)(imm)&0xF0) ? 46 : ((char)(imm)>0xE ? 62 : 110) - (char)(imm), \
1832 ((char)(imm)&0xF0) ? 47 : ((char)(imm)>0xF ? 63 : 111) - (char)(imm), \
1833 ((char)(imm)&0xF0) ? 48 : ((char)(imm)>0x0 ? 64 : 112) - (char)(imm), \
1834 ((char)(imm)&0xF0) ? 49 : ((char)(imm)>0x1 ? 65 : 113) - (char)(imm), \
1835 ((char)(imm)&0xF0) ? 50 : ((char)(imm)>0x2 ? 66 : 114) - (char)(imm), \
1836 ((char)(imm)&0xF0) ? 51 : ((char)(imm)>0x3 ? 67 : 115) - (char)(imm), \
1837 ((char)(imm)&0xF0) ? 52 : ((char)(imm)>0x4 ? 68 : 116) - (char)(imm), \
1838 ((char)(imm)&0xF0) ? 53 : ((char)(imm)>0x5 ? 69 : 117) - (char)(imm), \
1839 ((char)(imm)&0xF0) ? 54 : ((char)(imm)>0x6 ? 70 : 118) - (char)(imm), \
1840 ((char)(imm)&0xF0) ? 55 : ((char)(imm)>0x7 ? 71 : 119) - (char)(imm), \
1841 ((char)(imm)&0xF0) ? 56 : ((char)(imm)>0x8 ? 72 : 120) - (char)(imm), \
1842 ((char)(imm)&0xF0) ? 57 : ((char)(imm)>0x9 ? 73 : 121) - (char)(imm), \
1843 ((char)(imm)&0xF0) ? 58 : ((char)(imm)>0xA ? 74 : 122) - (char)(imm), \
1844 ((char)(imm)&0xF0) ? 59 : ((char)(imm)>0xB ? 75 : 123) - (char)(imm), \
1845 ((char)(imm)&0xF0) ? 60 : ((char)(imm)>0xC ? 76 : 124) - (char)(imm), \
1846 ((char)(imm)&0xF0) ? 61 : ((char)(imm)>0xD ? 77 : 125) - (char)(imm), \
1847 ((char)(imm)&0xF0) ? 62 : ((char)(imm)>0xE ? 78 : 126) - (char)(imm), \
1848 ((char)(imm)&0xF0) ? 63 : ((char)(imm)>0xF ? 79 : 127) - (char)(imm)); })
1853 return (__m512i) __builtin_ia32_psrlv32hi_mask ((__v32hi) __A,
1864 return (__m512i) __builtin_ia32_psrlv32hi_mask ((__v32hi) __A,
1873 return (__m512i) __builtin_ia32_psrlv32hi_mask ((__v32hi) __A,
1883 return (__m512i) __builtin_ia32_psrav32hi_mask ((__v32hi) __A,
1894 return (__m512i) __builtin_ia32_psrav32hi_mask ((__v32hi) __A,
1903 return (__m512i) __builtin_ia32_psrav32hi_mask ((__v32hi) __A,
1913 return (__m512i) __builtin_ia32_psraw512_mask ((__v32hi) __A,
1924 return (__m512i) __builtin_ia32_psraw512_mask ((__v32hi) __A,
1933 return (__m512i) __builtin_ia32_psraw512_mask ((__v32hi) __A,
1940 #define _mm512_srai_epi16(A, B) __extension__ ({ \
1941 (__m512i)__builtin_ia32_psrawi512_mask((__v32hi)(__m512i)(A), (int)(B), \
1942 (__v32hi)_mm512_setzero_hi(), \
1945 #define _mm512_mask_srai_epi16(W, U, A, B) __extension__ ({ \
1946 (__m512i)__builtin_ia32_psrawi512_mask((__v32hi)(__m512i)(A), (int)(B), \
1947 (__v32hi)(__m512i)(W), \
1950 #define _mm512_maskz_srai_epi16(U, A, B) __extension__ ({ \
1951 (__m512i)__builtin_ia32_psrawi512_mask((__v32hi)(__m512i)(A), (int)(B), \
1952 (__v32hi)_mm512_setzero_hi(), \
1959 return (__m512i) __builtin_ia32_psrlw512_mask ((__v32hi) __A,
1970 return (__m512i) __builtin_ia32_psrlw512_mask ((__v32hi) __A,
1979 return (__m512i) __builtin_ia32_psrlw512_mask ((__v32hi) __A,
1986 #define _mm512_srli_epi16(A, imm) __extension__ ({ \
1987 (__m512i)__builtin_ia32_psrlwi512_mask((__v32hi)(__m512i)(A), (int)(imm), \
1988 (__v32hi)_mm512_setzero_hi(), \
1991 #define _mm512_mask_srli_epi16(W, U, A, imm) __extension__ ({ \
1992 (__m512i)__builtin_ia32_psrlwi512_mask((__v32hi)(__m512i)(A), (int)(imm), \
1993 (__v32hi)(__m512i)(W), \
1996 #define _mm512_maskz_srli_epi16(U, A, imm) __extension__ ({ \
1997 (__m512i)__builtin_ia32_psrlwi512_mask((__v32hi)(__m512i)(A), (int)(imm), \
1998 (__v32hi)_mm512_setzero_hi(), \
2001 #define _mm512_bsrli_epi128(a, imm) __extension__ ({ \
2002 (__m512i)__builtin_shufflevector( \
2003 (__v64qi)(__m512i)(a), \
2004 (__v64qi)_mm512_setzero_si512(), \
2005 ((char)(imm)&0xF0) ? 64 : (char)(imm) + ((char)(imm)>0xF ? 48 : 0), \
2006 ((char)(imm)&0xF0) ? 65 : (char)(imm) + ((char)(imm)>0xE ? 49 : 1), \
2007 ((char)(imm)&0xF0) ? 66 : (char)(imm) + ((char)(imm)>0xD ? 50 : 2), \
2008 ((char)(imm)&0xF0) ? 67 : (char)(imm) + ((char)(imm)>0xC ? 51 : 3), \
2009 ((char)(imm)&0xF0) ? 68 : (char)(imm) + ((char)(imm)>0xB ? 52 : 4), \
2010 ((char)(imm)&0xF0) ? 69 : (char)(imm) + ((char)(imm)>0xA ? 53 : 5), \
2011 ((char)(imm)&0xF0) ? 70 : (char)(imm) + ((char)(imm)>0x9 ? 54 : 6), \
2012 ((char)(imm)&0xF0) ? 71 : (char)(imm) + ((char)(imm)>0x8 ? 55 : 7), \
2013 ((char)(imm)&0xF0) ? 72 : (char)(imm) + ((char)(imm)>0x7 ? 56 : 8), \
2014 ((char)(imm)&0xF0) ? 73 : (char)(imm) + ((char)(imm)>0x6 ? 57 : 9), \
2015 ((char)(imm)&0xF0) ? 74 : (char)(imm) + ((char)(imm)>0x5 ? 58 : 10), \
2016 ((char)(imm)&0xF0) ? 75 : (char)(imm) + ((char)(imm)>0x4 ? 59 : 11), \
2017 ((char)(imm)&0xF0) ? 76 : (char)(imm) + ((char)(imm)>0x3 ? 60 : 12), \
2018 ((char)(imm)&0xF0) ? 77 : (char)(imm) + ((char)(imm)>0x2 ? 61 : 13), \
2019 ((char)(imm)&0xF0) ? 78 : (char)(imm) + ((char)(imm)>0x1 ? 62 : 14), \
2020 ((char)(imm)&0xF0) ? 79 : (char)(imm) + ((char)(imm)>0x0 ? 63 : 15), \
2021 ((char)(imm)&0xF0) ? 80 : (char)(imm) + ((char)(imm)>0xF ? 64 : 16), \
2022 ((char)(imm)&0xF0) ? 81 : (char)(imm) + ((char)(imm)>0xE ? 65 : 17), \
2023 ((char)(imm)&0xF0) ? 82 : (char)(imm) + ((char)(imm)>0xD ? 66 : 18), \
2024 ((char)(imm)&0xF0) ? 83 : (char)(imm) + ((char)(imm)>0xC ? 67 : 19), \
2025 ((char)(imm)&0xF0) ? 84 : (char)(imm) + ((char)(imm)>0xB ? 68 : 20), \
2026 ((char)(imm)&0xF0) ? 85 : (char)(imm) + ((char)(imm)>0xA ? 69 : 21), \
2027 ((char)(imm)&0xF0) ? 86 : (char)(imm) + ((char)(imm)>0x9 ? 70 : 22), \
2028 ((char)(imm)&0xF0) ? 87 : (char)(imm) + ((char)(imm)>0x8 ? 71 : 23), \
2029 ((char)(imm)&0xF0) ? 88 : (char)(imm) + ((char)(imm)>0x7 ? 72 : 24), \
2030 ((char)(imm)&0xF0) ? 89 : (char)(imm) + ((char)(imm)>0x6 ? 73 : 25), \
2031 ((char)(imm)&0xF0) ? 90 : (char)(imm) + ((char)(imm)>0x5 ? 74 : 26), \
2032 ((char)(imm)&0xF0) ? 91 : (char)(imm) + ((char)(imm)>0x4 ? 75 : 27), \
2033 ((char)(imm)&0xF0) ? 92 : (char)(imm) + ((char)(imm)>0x3 ? 76 : 28), \
2034 ((char)(imm)&0xF0) ? 93 : (char)(imm) + ((char)(imm)>0x2 ? 77 : 29), \
2035 ((char)(imm)&0xF0) ? 94 : (char)(imm) + ((char)(imm)>0x1 ? 78 : 30), \
2036 ((char)(imm)&0xF0) ? 95 : (char)(imm) + ((char)(imm)>0x0 ? 79 : 31), \
2037 ((char)(imm)&0xF0) ? 96 : (char)(imm) + ((char)(imm)>0xF ? 80 : 32), \
2038 ((char)(imm)&0xF0) ? 97 : (char)(imm) + ((char)(imm)>0xE ? 81 : 33), \
2039 ((char)(imm)&0xF0) ? 98 : (char)(imm) + ((char)(imm)>0xD ? 82 : 34), \
2040 ((char)(imm)&0xF0) ? 99 : (char)(imm) + ((char)(imm)>0xC ? 83 : 35), \
2041 ((char)(imm)&0xF0) ? 100 : (char)(imm) + ((char)(imm)>0xB ? 84 : 36), \
2042 ((char)(imm)&0xF0) ? 101 : (char)(imm) + ((char)(imm)>0xA ? 85 : 37), \
2043 ((char)(imm)&0xF0) ? 102 : (char)(imm) + ((char)(imm)>0x9 ? 86 : 38), \
2044 ((char)(imm)&0xF0) ? 103 : (char)(imm) + ((char)(imm)>0x8 ? 87 : 39), \
2045 ((char)(imm)&0xF0) ? 104 : (char)(imm) + ((char)(imm)>0x7 ? 88 : 40), \
2046 ((char)(imm)&0xF0) ? 105 : (char)(imm) + ((char)(imm)>0x6 ? 89 : 41), \
2047 ((char)(imm)&0xF0) ? 106 : (char)(imm) + ((char)(imm)>0x5 ? 90 : 42), \
2048 ((char)(imm)&0xF0) ? 107 : (char)(imm) + ((char)(imm)>0x4 ? 91 : 43), \
2049 ((char)(imm)&0xF0) ? 108 : (char)(imm) + ((char)(imm)>0x3 ? 92 : 44), \
2050 ((char)(imm)&0xF0) ? 109 : (char)(imm) + ((char)(imm)>0x2 ? 93 : 45), \
2051 ((char)(imm)&0xF0) ? 110 : (char)(imm) + ((char)(imm)>0x1 ? 94 : 46), \
2052 ((char)(imm)&0xF0) ? 111 : (char)(imm) + ((char)(imm)>0x0 ? 95 : 47), \
2053 ((char)(imm)&0xF0) ? 112 : (char)(imm) + ((char)(imm)>0xF ? 96 : 48), \
2054 ((char)(imm)&0xF0) ? 113 : (char)(imm) + ((char)(imm)>0xE ? 97 : 49), \
2055 ((char)(imm)&0xF0) ? 114 : (char)(imm) + ((char)(imm)>0xD ? 98 : 50), \
2056 ((char)(imm)&0xF0) ? 115 : (char)(imm) + ((char)(imm)>0xC ? 99 : 51), \
2057 ((char)(imm)&0xF0) ? 116 : (char)(imm) + ((char)(imm)>0xB ? 100 : 52), \
2058 ((char)(imm)&0xF0) ? 117 : (char)(imm) + ((char)(imm)>0xA ? 101 : 53), \
2059 ((char)(imm)&0xF0) ? 118 : (char)(imm) + ((char)(imm)>0x9 ? 102 : 54), \
2060 ((char)(imm)&0xF0) ? 119 : (char)(imm) + ((char)(imm)>0x8 ? 103 : 55), \
2061 ((char)(imm)&0xF0) ? 120 : (char)(imm) + ((char)(imm)>0x7 ? 104 : 56), \
2062 ((char)(imm)&0xF0) ? 121 : (char)(imm) + ((char)(imm)>0x6 ? 105 : 57), \
2063 ((char)(imm)&0xF0) ? 122 : (char)(imm) + ((char)(imm)>0x5 ? 106 : 58), \
2064 ((char)(imm)&0xF0) ? 123 : (char)(imm) + ((char)(imm)>0x4 ? 107 : 59), \
2065 ((char)(imm)&0xF0) ? 124 : (char)(imm) + ((char)(imm)>0x3 ? 108 : 60), \
2066 ((char)(imm)&0xF0) ? 125 : (char)(imm) + ((char)(imm)>0x2 ? 109 : 61), \
2067 ((char)(imm)&0xF0) ? 126 : (char)(imm) + ((char)(imm)>0x1 ? 110 : 62), \
2068 ((char)(imm)&0xF0) ? 127 : (char)(imm) + ((char)(imm)>0x0 ? 111 : 63)); })
2073 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
2081 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
2089 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
2097 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
2105 return (__m512i) __builtin_ia32_pbroadcastb512_gpr_mask (__A,
2113 return (__m512i) __builtin_ia32_pbroadcastb512_gpr_mask (__A,
2136 return (__m512i) __builtin_ia32_loaddquhi512_mask ((__v32hi *) __P,
2144 return (__m512i) __builtin_ia32_loaddquhi512_mask ((__v32hi *) __P,
2153 return (__m512i) __builtin_ia32_loaddquqi512_mask ((__v64qi *) __P,
2161 return (__m512i) __builtin_ia32_loaddquqi512_mask ((__v64qi *) __P,
2169 __builtin_ia32_storedquhi512_mask ((__v32hi *) __P,
2177 __builtin_ia32_storedquqi512_mask ((__v64qi *) __P,
2185 return (
__mmask64) __builtin_ia32_ptestmb512 ((__v64qi) __A,
2193 return (
__mmask64) __builtin_ia32_ptestmb512 ((__v64qi) __A,
2194 (__v64qi) __B, __U);
2200 return (
__mmask32) __builtin_ia32_ptestmw512 ((__v32hi) __A,
2208 return (
__mmask32) __builtin_ia32_ptestmw512 ((__v32hi) __A,
2209 (__v32hi) __B, __U);
2215 return (
__mmask64) __builtin_ia32_ptestnmb512 ((__v64qi) __A,
2223 return (
__mmask64) __builtin_ia32_ptestnmb512 ((__v64qi) __A,
2224 (__v64qi) __B, __U);
2230 return (
__mmask32) __builtin_ia32_ptestnmw512 ((__v32hi) __A,
2238 return (
__mmask32) __builtin_ia32_ptestnmw512 ((__v32hi) __A,
2239 (__v32hi) __B, __U);
2245 return (
__mmask64) __builtin_ia32_cvtb2mask512 ((__v64qi) __A);
2251 return (
__mmask32) __builtin_ia32_cvtw2mask512 ((__v32hi) __A);
2257 return (__m512i) __builtin_ia32_cvtmask2b512 (__A);
2263 return (__m512i) __builtin_ia32_cvtmask2w512 (__A);
2269 return (__m512i)__builtin_shufflevector((__v16qi) __A,
2271 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2272 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2273 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2274 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
2280 return (__m512i)__builtin_ia32_selectb_512(__M,
2288 return (__m512i)__builtin_ia32_selectb_512(__M,
2296 return (__m512i) __builtin_ia32_pbroadcastw512_gpr_mask (__A,
2304 return (__m512i) __builtin_ia32_pbroadcastw512_gpr_mask (__A,
2312 return (__m512i)__builtin_shufflevector((__v8hi) __A,
2314 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2315 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
2321 return (__m512i)__builtin_ia32_selectw_512(__M,
2329 return (__m512i)__builtin_ia32_selectw_512(__M,
2337 return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
2347 return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
2357 return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
2363 #define _mm512_alignr_epi8(A, B, N) __extension__ ({\
2364 (__m512i)__builtin_ia32_palignr512_mask((__v64qi)(__m512i)(A), \
2365 (__v64qi)(__m512i)(B), (int)(N), \
2366 (__v64qi)_mm512_undefined_pd(), \
2369 #define _mm512_mask_alignr_epi8(W, U, A, B, N) __extension__({\
2370 (__m512i)__builtin_ia32_palignr512_mask((__v64qi)(__m512i)(A), \
2371 (__v64qi)(__m512i)(B), (int)(N), \
2372 (__v64qi)(__m512i)(W), \
2375 #define _mm512_maskz_alignr_epi8(U, A, B, N) __extension__({\
2376 (__m512i)__builtin_ia32_palignr512_mask((__v64qi)(__m512i)(A), \
2377 (__v64qi)(__m512i)(B), (int)(N), \
2378 (__v64qi)_mm512_setzero_si512(), \
2381 #define _mm512_dbsad_epu8(A, B, imm) __extension__ ({\
2382 (__m512i)__builtin_ia32_dbpsadbw512_mask((__v64qi)(__m512i)(A), \
2383 (__v64qi)(__m512i)(B), (int)(imm), \
2384 (__v32hi)_mm512_undefined_epi32(), \
2387 #define _mm512_mask_dbsad_epu8(W, U, A, B, imm) ({\
2388 (__m512i)__builtin_ia32_dbpsadbw512_mask((__v64qi)(__m512i)(A), \
2389 (__v64qi)(__m512i)(B), (int)(imm), \
2390 (__v32hi)(__m512i)(W), \
2393 #define _mm512_maskz_dbsad_epu8(U, A, B, imm) ({\
2394 (__m512i)__builtin_ia32_dbpsadbw512_mask((__v64qi)(__m512i)(A), \
2395 (__v64qi)(__m512i)(B), (int)(imm), \
2396 (__v32hi)_mm512_setzero_hi(), \
2402 return (__m512i) __builtin_ia32_psadbw512 ((__v64qi) __A,
2408 #undef __DEFAULT_FN_ATTRS
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpacklo_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mov_epi16(__mmask32 __U, __m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmplt_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_permutexvar_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_setzero_qi(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sll_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi8(__mmask64 __M, char __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_loadu_epi16(__m512i __W, __mmask32 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_add_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtusepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhi_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srl_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sll_epi16(__m512i __A, __m128i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpneq_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packs_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpackhi_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_movepi16_mask(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpgt_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srl_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packus_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_shuffle_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_avg_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_movm_epi8(__mmask64 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sub_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_shuffle_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmple_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpacklo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mullo_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpacklo_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_abs_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packs_epi32(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmple_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mullo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sra_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpeq_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_madd_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_movm_epi16(__mmask32 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srav_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpneq_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpgt_epi8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpackhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_loadu_epi8(__m512i __W, __mmask64 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_cvtepu8_epi16(__m256i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmplt_epi8_mask(__m512i __a, __m512i __b)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtsepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_madd_epi16(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_add_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhrs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpackhi_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_add_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_broadcastb_epi8(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepi8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpgt_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_setzero_hi(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhi_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packus_epi32(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_testn_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srlv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_movepi8_mask(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epi8(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtusepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhi_epu16(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpneq_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_shuffle_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_cvtepi8_epi16(__m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sllv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmple_epi8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srlv_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_avg_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpge_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtsepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_maddubs_epi16(__m512i __W, __mmask32 __U, __m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sllv_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_broadcastw_epi16(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpge_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_avg_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmplt_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_cvtepu8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_avg_epu16(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpeq_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpackhi_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtsepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mov_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epu16(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_undefined_epi32(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpge_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpacklo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_test_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
#define __DEFAULT_FN_ATTRS
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_loadu_epi16(__mmask32 __U, void const *__P)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmple_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_abs_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_broadcastw_epi16(__m512i __O, __mmask32 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_abs_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpgt_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sub_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
unsigned long long __mmask64
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_avg_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epu16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_test_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpeq_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maddubs_epi16(__m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sra_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sad_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_madd_epi16(__mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packs_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_broadcastw_epi16(__mmask32 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packus_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_add_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpeq_epi8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packs_epi16(__m512i __A, __m512i __B)
static __inline__ vector float vector float __b
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packus_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_storeu_epi8(void *__P, __mmask64 __U, __m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_kunpackw(__mmask32 __A, __mmask32 __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_testn_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_kunpackd(__mmask64 __A, __mmask64 __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpge_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi16(__mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmplt_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_add_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_avg_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sub_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sra_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_maddubs_epi16(__mmask32 __U, __m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpacklo_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_test_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpgt_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sub_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtusepi16_epi8(__m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpeq_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mov_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpneq_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epu8(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpneq_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_test_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtsepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_abs_epi16(__mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sub_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmple_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_testn_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mov_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_loadu_epi8(__mmask64 __U, void const *__P)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmplt_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_blend_epi8(__mmask64 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mullo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srl_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sub_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpgt_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_cvtepi8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmple_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpneq_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhrs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_broadcastb_epi8(__mmask64 __M, __m128i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpgt_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_undefined_si128(void)
Generates a 128-bit vector of [4 x i32] with unspecified content.
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmplt_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_permutexvar_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmple_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sll_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_setzero_si512(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpneq_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpackhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srlv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sllv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epu16(__m512i __A, __m512i __B)
static __inline __m256i __DEFAULT_FN_ATTRS _mm256_setzero_si256(void)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_testn_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpgt_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_add_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepu8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpacklo_epi8(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_storeu_epi16(void *__P, __mmask32 __U, __m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpeq_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmplt_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_abs_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_permutexvar_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmplt_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpge_epi8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packus_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpge_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srav_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpneq_epi8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packus_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packs_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpackhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_abs_epi16(__m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpge_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpge_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srav_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packs_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_blend_epi16(__mmask32 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpeq_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpeq_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhrs_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmple_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_broadcastb_epi8(__m512i __O, __mmask64 __M, __m128i __A)