swap the indices rather than the data in DCT top half: bizarrely this works!

author Luke Kenneth Casson Leighton <lkcl@lkcl.net>

Mon, 19 Jul 2021 13:41:04 +0000 (14:41 +0100)

committer Luke Kenneth Casson Leighton <lkcl@lkcl.net>

Mon, 19 Jul 2021 13:41:04 +0000 (14:41 +0100)
author Luke Kenneth Casson Leighton <lkcl@lkcl.net>
Mon, 19 Jul 2021 13:41:04 +0000 (14:41 +0100)
committer Luke Kenneth Casson Leighton <lkcl@lkcl.net>
Mon, 19 Jul 2021 13:41:04 +0000 (14:41 +0100)
diff --git a/src/openpower/decoder/isa/fastdctlee.py b/src/openpower/decoder/isa/fastdctlee.py

index 903749c8d7876c7ff7db895ee9a04e17a73a8f30..1462d64832ff49f6f1be0d62c7afd07262fd7469 100644 (file)
--- a/src/openpower/decoder/isa/fastdctlee.py
+++ b/src/openpower/decoder/isa/fastdctlee.py
@@ -199,15 +199,19 @@ def transform2(vec, reverse=True):
                  k += tablestep
              # instead of using jl+halfsize, perform a swap here.
              # use half of j/jr because actually jl+halfsize = reverse(j)
+            # actually: swap the *indices*... not the actual data.
+            # incredibly... bizarrely... this works *without* having
+            # to do anything else.
              if len(j) > 1:
                  hz2 = halfsize // 2
                  for ci, (jl, jh) in enumerate(zip(j[:hz2], jr[:hz2])):
-                    tmp = vec[ri[jl+halfsize]]
-                    vec[ri[jl+halfsize]] = vec[ri[jh]]
-                    vec[ri[jh]] = tmp
-                    #print ("     swap", size, i, ri[jl+halfsize], ri[jh])
+                    tmp = ri[jl+halfsize]
+                    ri[jl+halfsize] = ri[jh]
+                    ri[jh] = tmp
+                    print ("     swap", size, i, ri[jl+halfsize], ri[jh])
          size //= 2
  
+    print("post-swapped", ri)
      print("transform2 pre-itersum", vec)
  
      n = len(vec)
author	Luke Kenneth Casson Leighton <lkcl@lkcl.net>
	Mon, 19 Jul 2021 13:41:04 +0000 (14:41 +0100)
committer	Luke Kenneth Casson Leighton <lkcl@lkcl.net>
	Mon, 19 Jul 2021 13:41:04 +0000 (14:41 +0100)