spirv: Use a simpler and more correct implementaiton of tanh()

author Jason Ekstrand <jason.ekstrand@intel.com>

Fri, 9 Dec 2016 17:34:50 +0000 (09:34 -0800)

committer Jason Ekstrand <jason.ekstrand@intel.com>

Sat, 10 Dec 2016 02:38:21 +0000 (18:38 -0800)
author Jason Ekstrand <jason.ekstrand@intel.com>
Fri, 9 Dec 2016 17:34:50 +0000 (09:34 -0800)
committer Jason Ekstrand <jason.ekstrand@intel.com>
Sat, 10 Dec 2016 02:38:21 +0000 (18:38 -0800)
diff --git a/src/compiler/spirv/vtn_glsl450.c b/src/compiler/spirv/vtn_glsl450.c

index cb0570d385f4d1ccd82147ff997bc6421d0d3ad1..fbc7ce6fd84d0c2701c33ab76b3b8b5421914cfa 100644 (file)
--- a/src/compiler/spirv/vtn_glsl450.c
+++ b/src/compiler/spirv/vtn_glsl450.c
@@ -565,16 +565,21 @@ handle_glsl450_alu(struct vtn_builder *b, enum GLSLstd450 entrypoint,
                                     build_exp(nb, nir_fneg(nb, src[0]))));
        return;
  
-   case GLSLstd450Tanh:
-      /* (0.5 * (e^x - e^(-x))) / (0.5 * (e^x + e^(-x))) */
-      val->ssa->def =
-         nir_fdiv(nb, nir_fmul(nb, nir_imm_float(nb, 0.5f),
-                                   nir_fsub(nb, build_exp(nb, src[0]),
-                                                build_exp(nb, nir_fneg(nb, src[0])))),
-                      nir_fmul(nb, nir_imm_float(nb, 0.5f),
-                                   nir_fadd(nb, build_exp(nb, src[0]),
-                                                build_exp(nb, nir_fneg(nb, src[0])))));
+   case GLSLstd450Tanh: {
+      /* tanh(x) := (0.5 * (e^x - e^(-x))) / (0.5 * (e^x + e^(-x)))
+       *
+       * With a little algebra this reduces to (e^2x - 1) / (e^2x + 1)
+       *
+       * We clamp x to (-inf, +10] to avoid precision problems.  When x > 10,
+       * e^2x is so much larger than 1.0 that 1.0 gets flushed to zero in the
+       * computation e^2x +/- 1 so it can be ignored.
+       */
+      nir_ssa_def *x = nir_fmin(nb, src[0], nir_imm_float(nb, 10));
+      nir_ssa_def *exp2x = build_exp(nb, nir_fmul(nb, x, nir_imm_float(nb, 2)));
+      val->ssa->def = nir_fdiv(nb, nir_fsub(nb, exp2x, nir_imm_float(nb, 1)),
+                                   nir_fadd(nb, exp2x, nir_imm_float(nb, 1)));
        return;
+   }
  
     case GLSLstd450Asinh:
        val->ssa->def = nir_fmul(nb, nir_fsign(nb, src[0]),
author	Jason Ekstrand <jason.ekstrand@intel.com>
	Fri, 9 Dec 2016 17:34:50 +0000 (09:34 -0800)
committer	Jason Ekstrand <jason.ekstrand@intel.com>
	Sat, 10 Dec 2016 02:38:21 +0000 (18:38 -0800)