Fix matmul performance on gcc 4.9
[riscv-tests.git] / benchmarks / mm / gen.scala
index 2d3dc34a2978a5b6583e7a86f95b5f1c060afe34..38d9e6badb9ab478234febc6796dd004d49feb9c 100644 (file)
@@ -39,7 +39,7 @@ object MMGen {
         s += init("t*", r("a", i), "&"+ar("a", "lda*"+i))
       for (k <- 0 until p)
         s += init("t*", r("b", k), "&"+ar("b", "ldb*"+k))
-      for (i <- 0 until m; j <- 0 until n; k <- 0 until p)
+      for (k <- 0 until p; i <- 0 until m; j <- 0 until n)
         s += assign(r("c", i, j), "fma(" + ar(r("a", i), k) + ", " + ar(r("b", k), j) + ", " + r("c", i, j) + ")")
     }