nv50/ir: take postFactor into account when doing peephole optimizations

author Ilia Mirkin <imirkin@alum.mit.edu>

Wed, 25 Mar 2015 22:00:00 +0000 (18:00 -0400)

committer Ilia Mirkin <imirkin@alum.mit.edu>

Fri, 27 Mar 2015 23:02:19 +0000 (19:02 -0400)
author Ilia Mirkin <imirkin@alum.mit.edu>
Wed, 25 Mar 2015 22:00:00 +0000 (18:00 -0400)
committer Ilia Mirkin <imirkin@alum.mit.edu>
Fri, 27 Mar 2015 23:02:19 +0000 (19:02 -0400)
diff --git a/src/gallium/drivers/nouveau/codegen/nv50_ir_peephole.cpp b/src/gallium/drivers/nouveau/codegen/nv50_ir_peephole.cpp

index 6a4ea4ed6e8a1d857a0ca9d741c3160675023292..dc048e605a50c46e468aeb77e11c667b5c573975 100644 (file)
--- a/src/gallium/drivers/nouveau/codegen/nv50_ir_peephole.cpp
+++ b/src/gallium/drivers/nouveau/codegen/nv50_ir_peephole.cpp
@@ -451,7 +451,9 @@ ConstantFolding::expr(Instruction *i,
              b->data.f32 = 0.0f;
        }
        switch (i->dType) {
-      case TYPE_F32: res.data.f32 = a->data.f32 * b->data.f32; break;
+      case TYPE_F32:
+         res.data.f32 = a->data.f32 * b->data.f32 * exp2f(i->postFactor);
+         break;
        case TYPE_F64: res.data.f64 = a->data.f64 * b->data.f64; break;
        case TYPE_S32:
           if (i->subOp == NV50_IR_SUBOP_MUL_HIGH) {
@@ -579,6 +581,7 @@ ConstantFolding::expr(Instruction *i,
  
     i->src(0).mod = Modifier(0);
     i->src(1).mod = Modifier(0);
+   i->postFactor = 0;
  
     i->setSrc(0, new_ImmediateValue(i->bb->getProgram(), res.data.u32));
     i->setSrc(1, NULL);
@@ -682,7 +685,7 @@ ConstantFolding::tryCollapseChainedMULs(Instruction *mul2,
     Instruction *insn;
     Instruction *mul1 = NULL; // mul1 before mul2
     int e = 0;
-   float f = imm2.reg.data.f32;
+   float f = imm2.reg.data.f32 * exp2f(mul2->postFactor);
     ImmediateValue imm1;
  
     assert(mul2->op == OP_MUL && mul2->dType == TYPE_F32);
@@ -782,9 +785,10 @@ ConstantFolding::opnd(Instruction *i, ImmediateValue &imm0, int s)
           i->op = OP_MOV;
           i->setSrc(0, new_ImmediateValue(prog, 0u));
           i->src(0).mod = Modifier(0);
+         i->postFactor = 0;
           i->setSrc(1, NULL);
        } else
-      if (imm0.isInteger(1) || imm0.isInteger(-1)) {
+      if (!i->postFactor && (imm0.isInteger(1) || imm0.isInteger(-1))) {
           if (imm0.isNegative())
              i->src(t).mod = i->src(t).mod ^ Modifier(NV50_IR_MOD_NEG);
           i->op = i->src(t).mod.getOp();
@@ -797,7 +801,7 @@ ConstantFolding::opnd(Instruction *i, ImmediateValue &imm0, int s)
              i->src(0).mod = 0;
           i->setSrc(1, NULL);
        } else
-      if (imm0.isInteger(2) || imm0.isInteger(-2)) {
+      if (!i->postFactor && (imm0.isInteger(2) || imm0.isInteger(-2))) {
           if (imm0.isNegative())
              i->src(t).mod = i->src(t).mod ^ Modifier(NV50_IR_MOD_NEG);
           i->op = OP_ADD;
author	Ilia Mirkin <imirkin@alum.mit.edu>
	Wed, 25 Mar 2015 22:00:00 +0000 (18:00 -0400)
committer	Ilia Mirkin <imirkin@alum.mit.edu>
	Fri, 27 Mar 2015 23:02:19 +0000 (19:02 -0400)