+2020-05-11  Kelvin Nilsen  <kelvin@gcc.gnu.org>
+           Bill Schmidt  <wschmidt@linux.ibm.com>
+
+       * config/rs6000/altivec.h (vec_gnb): New #define.
+       * config/rs6000/altivec.md (UNSPEC_VGNB): New constant.
+       (vgnb): New insn.
+       * config/rs6000/rs6000-builtin.def (BU_FUTURE_OVERLOAD_1): New
+       #define.
+       (BU_FUTURE_OVERLOAD_2): Likewise.
+       (BU_FUTURE_OVERLOAD_3): Likewise.
+       (__builtin_altivec_gnb): New built-in function.
+       (__buiiltin_vec_gnb): New overloaded built-in function.
+       * config/rs6000/rs6000-call.c (altivec_overloaded_builtins):
+       Define overloaded forms of __builtin_vec_gnb.
+       (rs6000_expand_binop_builtin): Add error checking for 2nd argument
+       of __builtin_vec_gnb.
+       (builtin_function_type): Mark return value and arguments unsigned
+       for FUTURE_BUILTIN_VGNB.
+       * doc/extend.texi (PowerPC AltiVec Built-in Functions Available
+       for a Future Architecture): Add description of vec_gnb built-in
+       function.
+
 2020-05-11  Kelvin Nilsen  <kelvin@gcc.gnu.org>
            Bill Schmidt  <wschmidt@linux.ibm.com>
 
 
 #define vec_pdep(a, b) __builtin_altivec_vpdepd (a, b)
 #define vec_pext(a, b) __builtin_altivec_vpextd (a, b)
 
+/* Overloaded built-in functions for future architecture.  */
+#define vec_gnb(a, b)  __builtin_vec_gnb (a, b)
 #endif
 
 #endif /* _ALTIVEC_H */
 
    UNSPEC_VRLNM
    UNSPEC_VCLZDM
    UNSPEC_VCTZDM
+   UNSPEC_VGNB
    UNSPEC_VPDEPD
    UNSPEC_VPEXTD
 ])
    "vpextd %0,%1,%2"
    [(set_attr "type" "vecsimple")])
 
+(define_insn "vgnb"
+  [(set (match_operand:DI 0 "register_operand" "=r")
+        (unspec:DI [(match_operand:V2DI 1 "altivec_register_operand" "v")
+                   (match_operand:QI 2 "u3bit_cint_operand" "n")]
+         UNSPEC_VGNB))]
+   "TARGET_FUTURE"
+   "vgnb %0,%1,%2"
+   [(set_attr "type" "vecsimple")])
+
 
 (define_expand "bcd<bcd_add_sub>_<code>"
   [(parallel [(set (reg:CCFP CR6_REGNO)
 
                     | RS6000_BTC_TERNARY),                             \
                    CODE_FOR_ ## ICODE)                 /* ICODE */
 
+#define BU_FUTURE_OVERLOAD_1(ENUM, NAME)                               \
+  RS6000_BUILTIN_1 (FUTURE_BUILTIN_VEC_ ## ENUM,       /* ENUM */      \
+                   "__builtin_vec_" NAME,              /* NAME */      \
+                   RS6000_BTM_FUTURE,                  /* MASK */      \
+                   (RS6000_BTC_OVERLOADED              /* ATTR */      \
+                    | RS6000_BTC_UNARY),                               \
+                   CODE_FOR_nothing)                   /* ICODE */
+
+#define BU_FUTURE_OVERLOAD_2(ENUM, NAME)                               \
+  RS6000_BUILTIN_2 (FUTURE_BUILTIN_VEC_ ## ENUM,       /* ENUM */      \
+                   "__builtin_vec_" NAME,              /* NAME */      \
+                   RS6000_BTM_FUTURE,                  /* MASK */      \
+                   (RS6000_BTC_OVERLOADED              /* ATTR */      \
+                    | RS6000_BTC_BINARY),                              \
+                   CODE_FOR_nothing)                   /* ICODE */
+
+#define BU_FUTURE_OVERLOAD_3(ENUM, NAME)                               \
+  RS6000_BUILTIN_3 (FUTURE_BUILTIN_VEC_ ## ENUM,       /* ENUM */      \
+                   "__builtin_vec_" NAME,              /* NAME */      \
+                   RS6000_BTM_FUTURE,                  /* MASK */      \
+                   (RS6000_BTC_OVERLOADED              /* ATTR */      \
+                    | RS6000_BTC_TERNARY),                             \
+                   CODE_FOR_nothing)                   /* ICODE */
+
 #endif
 
 \f
 BU_FUTURE_V_2 (VCTZDM, "vctzdm", CONST, vctzdm)
 BU_FUTURE_V_2 (VPDEPD, "vpdepd", CONST, vpdepd)
 BU_FUTURE_V_2 (VPEXTD, "vpextd", CONST, vpextd)
+BU_FUTURE_V_2 (VGNB, "vgnb", CONST, vgnb)
+
+/* Future architecture overloaded vector built-ins.  */
+BU_FUTURE_OVERLOAD_2 (GNB, "gnb")
+
 \f
 /* 1 argument crypto functions.  */
 BU_CRYPTO_1 (VSBOX,            "vsbox",          CONST, crypto_vsbox_v2di)
 
     RS6000_BTI_unsigned_V2DI, RS6000_BTI_unsigned_V2DI,
     RS6000_BTI_INTSI, RS6000_BTI_INTSI },
 
+  /* FUTURE overloaded builtin functions, */
+  { FUTURE_BUILTIN_VEC_GNB, FUTURE_BUILTIN_VGNB, RS6000_BTI_unsigned_long_long,
+    RS6000_BTI_unsigned_V16QI, RS6000_BTI_UINTQI, 0 },
+  { FUTURE_BUILTIN_VEC_GNB, FUTURE_BUILTIN_VGNB, RS6000_BTI_unsigned_long_long,
+    RS6000_BTI_unsigned_V8HI, RS6000_BTI_UINTQI, 0 },
+  { FUTURE_BUILTIN_VEC_GNB, FUTURE_BUILTIN_VGNB, RS6000_BTI_unsigned_long_long,
+    RS6000_BTI_unsigned_V4SI, RS6000_BTI_UINTQI, 0 },
+  { FUTURE_BUILTIN_VEC_GNB, FUTURE_BUILTIN_VGNB, RS6000_BTI_unsigned_long_long,
+    RS6000_BTI_unsigned_V2DI, RS6000_BTI_UINTQI, 0 },
+  { FUTURE_BUILTIN_VEC_GNB, FUTURE_BUILTIN_VGNB, RS6000_BTI_unsigned_long_long,
+    RS6000_BTI_unsigned_V1TI, RS6000_BTI_UINTQI, 0 },
   { RS6000_BUILTIN_NONE, RS6000_BUILTIN_NONE, 0, 0, 0, 0 }
 };
 \f
          return CONST0_RTX (tmode);
        }
     }
+  else if (icode == CODE_FOR_vgnb)
+    {
+      /* Only allow unsigned literals in range 2..7.  */
+      /* Note that arg1 is second operand.  */
+      STRIP_NOPS (arg1);
+      if (TREE_CODE (arg1) != INTEGER_CST
+         || (TREE_INT_CST_LOW (arg1) & ~7)
+         || !IN_RANGE (TREE_INT_CST_LOW (arg1), 2, 7))
+       {
+         error ("argument 2 must be unsigned literal between "
+                "2 and 7 inclusive");
+         return CONST0_RTX (tmode);
+       }
+    }
   else if (icode == CODE_FOR_altivec_vsplth)
     {
       /* Only allow 3-bit unsigned literals.  */
     case P8V_BUILTIN_ORC_V1TI_UNS:
     case FUTURE_BUILTIN_VCLZDM:
     case FUTURE_BUILTIN_VCTZDM:
+    case FUTURE_BUILTIN_VGNB:
     case FUTURE_BUILTIN_VPDEPD:
     case FUTURE_BUILTIN_VPEXTD:
       h.uns_p[0] = 1;
 
 implemented by the Future @code{vctzdm} instruction.
 @findex vec_ctzm
 
+@smallexample
+@exdent vector unsigned long long int
+@exdent vec_gnb (vector unsigned char, const unsigned char)
+@exdent vector unsigned long long int
+@exdent vec_gnb (vector unsigned short, const unsigned char)
+@exdent vector unsigned long long int
+@exdent vec_gnb (vector unsigned int, const unsigned char)
+@exdent vector unsigned long long int
+@exdent vec_gnb (vector unsigned long long int, const unsigned char)
+@exdent vector unsigned long long int
+@exdent vec_gnb (vector unsigned __int128, const unsigned char)
+@end smallexample
+Perform a 128-bit vector gather  operation, as if implemented by the Future
+@code{vgnb} instruction.  The second argument must be a literal
+integer value between 2 and 7 inclusive.
+@findex vec_gnb
+
 @smallexample
 @exdent vector unsigned long long int
 @exdent vec_pdep (vector unsigned long long int, vector unsigned long long int)
 v4hi __builtin_vis_fpmaxu16 (v4hi, v4hi);
 v2si __builtin_vis_fpmaxu32 (v2si, v2si);
 
-
 v8qi __builtin_vis_fpmin8 (v8qi, v8qi);
 v4hi __builtin_vis_fpmin16 (v4hi, v4hi);
 v2si __builtin_vis_fpmin32 (v2si, v2si);
 
+2020-05-11  Kelvin Nilsen  <kelvin@gcc.gnu.org>
+           Bill Schmidt  <wschmidt@linux.ibm.com>
+
+       * gcc.target/powerpc/vec-gnb-0.c: New test.
+       * gcc.target/powerpc/vec-gnb-1.c: New test.
+       * gcc.target/powerpc/vec-gnb-10.c: New test.
+       * gcc.target/powerpc/vec-gnb-2.c: New test.
+       * gcc.target/powerpc/vec-gnb-3.c: New test.
+       * gcc.target/powerpc/vec-gnb-4.c: New test.
+       * gcc.target/powerpc/vec-gnb-5.c: New test.
+       * gcc.target/powerpc/vec-gnb-6.c: New test.
+       * gcc.target/powerpc/vec-gnb-7.c: New test.
+       * gcc.target/powerpc/vec-gnb-8.c: New test.
+       * gcc.target/powerpc/vec-gnb-9.c: New test.
+
 2020-05-11  Kelvin Nilsen  <kelvin@gcc.gnu.org>
 
        * gcc.target/powerpc/vec-pdep-0.c: New.
 
--- /dev/null
+/* { dg-do compile } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+/* This test is replicated for every different vector type since
+   vec_gnb is polymorphic.  */
+unsigned long long int
+do_vec_gnb (vector unsigned char source, int stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 2);
+    case 3:
+      return vec_gnb (source, 3);
+    case 4:
+      return vec_gnb (source, 4);
+    case 5:
+      return vec_gnb (source, 5);
+    case 6:
+      return vec_gnb (source, 6);
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned char source_a = {
+    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0x88, 0x88, 0x88, 0x88 };
+  vector unsigned char source_b = {
+    0, 0, 0, 0, 0, 0, 0, 0, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80 };
+  vector unsigned char source_c = {
+    0, 0, 0, 0, 0, 0, 0, 0, 0x88, 0x88, 0x88, 0x88, 0x88, 0x88, 0x88, 0x88 };
+  vector unsigned char source_d = {
+    0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80,
+    0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80 };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}
+
+/* { dg-final { scan-assembler {\mvgnb\M} } } */
 
--- /dev/null
+/* { dg-do run } */
+/* { dg-require-effective-target powerpc_future_hw } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+/* This test is replicated for every different vector type since
+   vec_gnb is polymorphic.  */
+unsigned long long int
+do_vec_gnb (vector unsigned char source, int stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 2);
+    case 3:
+      return vec_gnb (source, 3);
+    case 4:
+      return vec_gnb (source, 4);
+    case 5:
+      return vec_gnb (source, 5);
+    case 6:
+      return vec_gnb (source, 6);
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned char source_a = {
+    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0x88, 0x88, 0x88, 0x88 };
+  vector unsigned char source_b = {
+    0, 0, 0, 0, 0, 0, 0, 0, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80 };
+  vector unsigned char source_c = {
+    0, 0, 0, 0, 0, 0, 0, 0, 0x88, 0x88, 0x88, 0x88, 0x88, 0x88, 0x88, 0x88 };
+  vector unsigned char source_d = {
+    0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80,
+    0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80 };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}
+
 
--- /dev/null
+/* { dg-do compile } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+unsigned long long int
+do_vec_gnb (vector unsigned char source, unsigned char stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 0);      /* { dg-error "between 2 and 7" } */
+    case 3:
+      return vec_gnb (source, -1);     /* { dg-error "between 2 and 7" } */
+    case 4:
+      return vec_gnb (source, 8);      /* { dg-error "between 2 and 7" } */
+    case 5:
+      return vec_gnb (source, 1);      /* { dg-error "between 2 and 7" } */
+    case 6:
+      return vec_gnb (source, stride); /* { dg-error "unsigned literal" } */
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned char source_a = {
+    0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0x88, 0x88, 0x88, 0x88 };
+  vector unsigned char source_b = {
+    0, 0, 0, 0, 0, 0, 0, 0, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80 };
+  vector unsigned char source_c = {
+    0, 0, 0, 0, 0, 0, 0, 0, 0x88, 0x88, 0x88, 0x88, 0x88, 0x88, 0x88, 0x88 };
+  vector unsigned char source_d = {
+    0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80,
+    0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80, 0x80 };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}
+
 
--- /dev/null
+/* { dg-do compile } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+/* This test is replicated for every different vector type since
+   vec_gnb is polymorphic.  */
+unsigned long long int
+do_vec_gnb (vector unsigned short int source, int stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 2);
+    case 3:
+      return vec_gnb (source, 3);
+    case 4:
+      return vec_gnb (source, 4);
+    case 5:
+      return vec_gnb (source, 5);
+    case 6:
+      return vec_gnb (source, 6);
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned short int source_a = { 0, 0, 0, 0, 0, 0, 0x8888, 0x8888 };
+  vector unsigned short int source_b = {
+    0, 0, 0, 0, 0x8080, 0x8080, 0x8080, 0x8080 };
+  vector unsigned short int source_c = {
+    0, 0, 0, 0, 0x8888, 0x8888, 0x8888, 0x8888 };
+  vector unsigned short int source_d = {
+    0x8080, 0x8080, 0x8080, 0x8080, 0x8080, 0x8080, 0x8080, 0x8080 };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}
+
+/* { dg-final { scan-assembler {\mvgnb\M} } } */
 
--- /dev/null
+/* { dg-do run } */
+/* { dg-require-effective-target powerpc_future_hw } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+/* This test is replicated for every different vector type since
+   vec_gnb is polymorphic.  */
+unsigned long long int
+do_vec_gnb (vector unsigned short int source, int stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 2);
+    case 3:
+      return vec_gnb (source, 3);
+    case 4:
+      return vec_gnb (source, 4);
+    case 5:
+      return vec_gnb (source, 5);
+    case 6:
+      return vec_gnb (source, 6);
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned short int source_a = { 0, 0, 0, 0, 0, 0, 0x8888, 0x8888 };
+  vector unsigned short int source_b = {
+    0, 0, 0, 0, 0x8080, 0x8080, 0x8080, 0x8080 };
+  vector unsigned short int source_c = {
+    0, 0, 0, 0, 0x8888, 0x8888, 0x8888, 0x8888 };
+  vector unsigned short int source_d = {
+    0x8080, 0x8080, 0x8080, 0x8080, 0x8080, 0x8080, 0x8080, 0x8080 };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}
 
--- /dev/null
+/* { dg-do compile } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+/* This test is replicated for every different vector type since
+   vec_gnb is polymorphic.  */
+unsigned long long int
+do_vec_gnb (vector unsigned int source, int stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 2);
+    case 3:
+      return vec_gnb (source, 3);
+    case 4:
+      return vec_gnb (source, 4);
+    case 5:
+      return vec_gnb (source, 5);
+    case 6:
+      return vec_gnb (source, 6);
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned int source_a = { 0, 0, 0, 0x88888888 };
+  vector unsigned int source_b = { 0, 0, 0x80808080, 0x80808080 };
+  vector unsigned int source_c = { 0, 0, 0x88888888, 0x88888888 };
+  vector unsigned int source_d =
+    { 0x80808080, 0x80808080, 0x80808080, 0x80808080 };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}
+
+/* { dg-final { scan-assembler {\mvgnb\M} } } */
 
--- /dev/null
+/* { dg-do run } */
+/* { dg-require-effective-target powerpc_future_hw } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+/* This test is replicated for every different vector type since
+   vec_gnb is polymorphic.  */
+unsigned long long int
+do_vec_gnb (vector unsigned int source, int stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 2);
+    case 3:
+      return vec_gnb (source, 3);
+    case 4:
+      return vec_gnb (source, 4);
+    case 5:
+      return vec_gnb (source, 5);
+    case 6:
+      return vec_gnb (source, 6);
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned int source_a = { 0, 0, 0, 0x88888888 };
+  vector unsigned int source_b = { 0, 0, 0x80808080, 0x80808080 };
+  vector unsigned int source_c = { 0, 0, 0x88888888, 0x88888888 };
+  vector unsigned int source_d =
+    { 0x80808080, 0x80808080, 0x80808080, 0x80808080 };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}
+
 
--- /dev/null
+/* { dg-do compile } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+/* This test is replicated for every different vector type since
+   vec_gnb is polymorphic.  */
+unsigned long long int
+do_vec_gnb (vector unsigned long long int source, int stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 2);
+    case 3:
+      return vec_gnb (source, 3);
+    case 4:
+      return vec_gnb (source, 4);
+    case 5:
+      return vec_gnb (source, 5);
+    case 6:
+      return vec_gnb (source, 6);
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned long long int source_a = { 0, 0x8888888800000000ull };
+  vector unsigned long long int source_b = { 0, 0x8080808080808080ull };
+  vector unsigned long long int source_c = { 0, 0x8888888888888888ull };
+  vector unsigned long long int source_d = { 0x8080808080808080ull,
+                                            0x8080808080808080ull };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}
+
+/* { dg-final { scan-assembler {\mvgnb\M} } } */
 
--- /dev/null
+/* { dg-do run } */
+/* { dg-require-effective-target powerpc_future_hw } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+/* This test is replicated for every different vector type since
+   vec_gnb is polymorphic.  */
+unsigned long long int
+do_vec_gnb (vector unsigned long long int source, int stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 2);
+    case 3:
+      return vec_gnb (source, 3);
+    case 4:
+      return vec_gnb (source, 4);
+    case 5:
+      return vec_gnb (source, 5);
+    case 6:
+      return vec_gnb (source, 6);
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned long long int source_a = { 0, 0x8888888800000000ull };
+  vector unsigned long long int source_b = { 0, 0x8080808080808080ull };
+  vector unsigned long long int source_c = { 0, 0x8888888888888888ull };
+  vector unsigned long long int source_d = { 0x8080808080808080ull,
+                                            0x8080808080808080ull };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}
+
 
--- /dev/null
+/* { dg-do compile } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+/* This test is replicated for every different vector type since
+   vec_gnb is polymorphic.  */
+unsigned long long int
+do_vec_gnb (vector unsigned __int128 source, int stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 2);
+    case 3:
+      return vec_gnb (source, 3);
+    case 4:
+      return vec_gnb (source, 4);
+    case 5:
+      return vec_gnb (source, 5);
+    case 6:
+      return vec_gnb (source, 6);
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned __int128 source_a =
+    { ((unsigned __int128) 0x8888888800000000ull) << 64 };
+  vector unsigned __int128 source_b =
+    { ((unsigned __int128) 0x8080808080808080ull) << 64 };
+  vector unsigned __int128 source_c =
+    { ((unsigned __int128) 0x8888888888888888ull) << 64 };
+  vector unsigned __int128 source_d =
+    { 0x8080808080808080ull |
+      ((unsigned __int128) 0x8080808080808080ull) << 64 };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}
+
+/* { dg-final { scan-assembler {\mvgnb\M} } } */
 
--- /dev/null
+/* { dg-do run } */
+/* { dg-require-effective-target powerpc_future_hw } */
+/* { dg-options "-mdejagnu-cpu=future" } */
+
+#include <altivec.h>
+
+extern void abort (void);
+
+/* This test is replicated for every different vector type since
+   vec_gnb is polymorphic.  */
+unsigned long long int
+do_vec_gnb (vector unsigned __int128 source, int stride)
+{
+  switch (stride)
+    {
+    case 2:
+      return vec_gnb (source, 2);
+    case 3:
+      return vec_gnb (source, 3);
+    case 4:
+      return vec_gnb (source, 4);
+    case 5:
+      return vec_gnb (source, 5);
+    case 6:
+      return vec_gnb (source, 6);
+    case 7:
+      return vec_gnb (source, 7);
+
+    default:
+      /* Illegal value of stride */
+      abort ();
+      return 0;
+    }
+}
+
+int
+main (int argc, char *argv [])
+{
+  /* For result = 0xaaaa_0000_0000_0000, use:
+      stride = 2: binary 1x0x_1x0x_1x0x_... = 0x8888_8888_0000_0000, 0
+      stride = 4: binary 1xxx_0xxx_1xxx_0xxxx = 0x8080_8080_8080_8080, 0
+
+     For result = 0xaaaa_aaaa_0000_0000, use:
+      stride = 2: source = 0x8888_8888_8888_8888, 0x0 }
+      stride = 4: source = { 0x8080_8080_8080_8080, 0x8080_8080_8080_8080 }
+  */
+
+  /* The last array element appears in the left-most (first) bit
+     positions of the vector register.  */
+  vector unsigned __int128 source_a =
+    { ((unsigned __int128) 0x8888888800000000ull) << 64 };
+  vector unsigned __int128 source_b =
+    { ((unsigned __int128) 0x8080808080808080ull) << 64 };
+  vector unsigned __int128 source_c =
+    { ((unsigned __int128) 0x8888888888888888ull) << 64 };
+  vector unsigned __int128 source_d =
+    { 0x8080808080808080ull |
+      ((unsigned __int128) 0x8080808080808080ull) << 64 };
+
+  unsigned long long int results [] =
+    { 0xaaaa000000000000ull, 0xaaaa000000000000ull,
+      0xaaaaaaaa00000000ull, 0xaaaaaaaa00000000ull };
+
+  if (do_vec_gnb (source_a, 2) != results [0])
+    abort ();
+  if (do_vec_gnb (source_b, 4) != results [1])
+    abort ();
+  if (do_vec_gnb (source_c, 2) != results [2])
+    abort ();
+  if (do_vec_gnb (source_d, 4) != results [3])
+    abort ();
+
+  return 0;
+}