Allow more test cases to be run with CXXSim

[soc.git] / src / soc / experiment / dcache.py
diff --git a/src/soc/experiment/dcache.py b/src/soc/experiment/dcache.py

index bc2f3d375c10fc145f64b85b3f59ad5baa515edc..e1f82b77dc337467c1f9eeff306adc2ade4a7120 100644 (file)
--- a/src/soc/experiment/dcache.py
+++ b/src/soc/experiment/dcache.py
@@ -7,17 +7,12 @@ based on Anton Blanchard microwatt dcache.vhdl
  from enum import Enum, unique
  
  from nmigen import Module, Signal, Elaboratable, Cat, Repl, Array, Const
  from enum import Enum, unique
  
  from nmigen import Module, Signal, Elaboratable, Cat, Repl, Array, Const
-try:
-    from nmigen.hdl.ast import Display
-except ImportError:
-    def Display(*args):
-        return []
+from nmutil.util import Display
  
  from random import randint
  
  from nmigen.cli import main
  from nmutil.iocontrol import RecordObject
  
  from random import randint
  
  from nmigen.cli import main
  from nmutil.iocontrol import RecordObject
-from nmutil.util import wrap
  from nmigen.utils import log2_int
  from soc.experiment.mem_types import (LoadStore1ToDCacheType,
                                       DCacheToLoadStore1Type,
  from nmigen.utils import log2_int
  from soc.experiment.mem_types import (LoadStore1ToDCacheType,
                                       DCacheToLoadStore1Type,
@@ -31,16 +26,19 @@ from soc.experiment.wb_types import (WB_ADDR_BITS, WB_DATA_BITS, WB_SEL_BITS,
                                  WBIOMasterOut, WBIOSlaveOut)
  
  from soc.experiment.cache_ram import CacheRam
                                  WBIOMasterOut, WBIOSlaveOut)
  
  from soc.experiment.cache_ram import CacheRam
-from soc.experiment.plru import PLRU
+#from soc.experiment.plru import PLRU
+from nmutil.plru import PLRU
  
  # for test
  from nmigen_soc.wishbone.sram import SRAM
  from nmigen import Memory
  from nmigen.cli import rtlil
  
  # for test
  from nmigen_soc.wishbone.sram import SRAM
  from nmigen import Memory
  from nmigen.cli import rtlil
-if True:
-    from nmigen.back.pysim import Simulator, Delay, Settle
-else:
-    from nmigen.sim.cxxsim import Simulator, Delay, Settle
+
+# NOTE: to use cxxsim, export NMIGEN_SIM_MODE=cxxsim from the shell
+# Also, check out the cxxsim nmigen branch, and latest yosys from git
+from nmutil.sim_tmp_alternative import Simulator
+
+from nmutil.util import wrap
  
  
  # TODO: make these parameters of DCache at some point
  
  
  # TODO: make these parameters of DCache at some point
@@ -48,7 +46,7 @@ LINE_SIZE = 64    # Line size in bytes
  NUM_LINES = 16    # Number of lines in a set
  NUM_WAYS = 4      # Number of ways
  TLB_SET_SIZE = 64 # L1 DTLB entries per set
  NUM_LINES = 16    # Number of lines in a set
  NUM_WAYS = 4      # Number of ways
  TLB_SET_SIZE = 64 # L1 DTLB entries per set
-TLB_NUM_WAYS = 2  # L1 DTLB number of sets
+TLB_NUM_WAYS = 4  # L1 DTLB number of sets
  TLB_LG_PGSZ = 12  # L1 DTLB log_2(page_size)
  LOG_LENGTH = 0    # Non-zero to enable log data collection
  
  TLB_LG_PGSZ = 12  # L1 DTLB log_2(page_size)
  LOG_LENGTH = 0    # Non-zero to enable log data collection
  
@@ -124,7 +122,7 @@ layout = """\
    .. --------|              | TAG_BITS      (45)
  """
  print (layout)
    .. --------|              | TAG_BITS      (45)
  """
  print (layout)
-print ("Dcache TAG %d IDX %d ROW %d ROFF %d LOFF %d RLB %d" % \
+print ("Dcache TAG %d IDX %d ROW_BITS %d ROFF %d LOFF %d RLB %d" % \
              (TAG_BITS, INDEX_BITS, ROW_BITS,
               ROW_OFF_BITS, LINE_OFF_BITS, ROW_LINE_BITS))
  print ("index @: %d-%d" % (LINE_OFF_BITS, SET_SIZE_BITS))
              (TAG_BITS, INDEX_BITS, ROW_BITS,
               ROW_OFF_BITS, LINE_OFF_BITS, ROW_LINE_BITS))
  print ("index @: %d-%d" % (LINE_OFF_BITS, SET_SIZE_BITS))
@@ -133,6 +131,8 @@ print ("tag @: %d-%d width %d" % (SET_SIZE_BITS, REAL_ADDR_BITS, TAG_WIDTH))
  
  TAG_RAM_WIDTH = TAG_WIDTH * NUM_WAYS
  
  
  TAG_RAM_WIDTH = TAG_WIDTH * NUM_WAYS
  
+print ("TAG_RAM_WIDTH", TAG_RAM_WIDTH)
+
  def CacheTagArray():
      return Array(Signal(TAG_RAM_WIDTH, name="cachetag_%d" % x) \
                          for x in range(NUM_LINES))
  def CacheTagArray():
      return Array(Signal(TAG_RAM_WIDTH, name="cachetag_%d" % x) \
                          for x in range(NUM_LINES))
@@ -172,16 +172,20 @@ assert SET_SIZE_BITS <= TLB_LG_PGSZ, "Set indexed by virtual address"
  
  
  def TLBValidBitsArray():
  
  
  def TLBValidBitsArray():
-    return Array(Signal(TLB_NUM_WAYS) for x in range(TLB_SET_SIZE))
+    return Array(Signal(TLB_NUM_WAYS, name="tlbvalid%d" % x) \
+                for x in range(TLB_SET_SIZE))
  
  def TLBTagEAArray():
  
  def TLBTagEAArray():
-    return Array(Signal(TLB_EA_TAG_BITS) for x in range (TLB_NUM_WAYS))
+    return Array(Signal(TLB_EA_TAG_BITS, name="tlbtagea%d" % x) \
+                for x in range (TLB_NUM_WAYS))
  
  def TLBTagsArray():
  
  def TLBTagsArray():
-    return Array(Signal(TLB_TAG_WAY_BITS) for x in range (TLB_SET_SIZE))
+    return Array(Signal(TLB_TAG_WAY_BITS, name="tlbtags%d" % x) \
+                for x in range (TLB_SET_SIZE))
  
  def TLBPtesArray():
  
  def TLBPtesArray():
-    return Array(Signal(TLB_PTE_WAY_BITS) for x in range(TLB_SET_SIZE))
+    return Array(Signal(TLB_PTE_WAY_BITS, name="tlbptes%d" % x) \
+                for x in range(TLB_SET_SIZE))
  
  def HitWaySet():
      return Array(Signal(WAY_BITS, name="hitway_%d" % x) \
  
  def HitWaySet():
      return Array(Signal(WAY_BITS, name="hitway_%d" % x) \
@@ -194,11 +198,13 @@ def CacheRamOut():
  
  # PLRU output interface
  def PLRUOut():
  
  # PLRU output interface
  def PLRUOut():
-    return Array(Signal(WAY_BITS) for x in range(NUM_LINES))
+    return Array(Signal(WAY_BITS, name="plru_out%d" % x) \
+                for x in range(NUM_LINES))
  
  # TLB PLRU output interface
  def TLBPLRUOut():
  
  # TLB PLRU output interface
  def TLBPLRUOut():
-    return Array(Signal(TLB_WAY_BITS) for x in range(TLB_SET_SIZE))
+    return Array(Signal(TLB_WAY_BITS, name="tlbplru_out%d" % x) \
+                for x in range(TLB_SET_SIZE))
  
  # Helper functions to decode incoming requests
  #
  
  # Helper functions to decode incoming requests
  #
@@ -268,12 +274,6 @@ class PermAttr(RecordObject):
  
  def extract_perm_attr(pte):
      pa = PermAttr()
  
  def extract_perm_attr(pte):
      pa = PermAttr()
-    pa.reference = pte[8]
-    pa.changed   = pte[7]
-    pa.nocache   = pte[5]
-    pa.priv      = pte[3]
-    pa.rd_perm   = pte[2]
-    pa.wr_perm   = pte[1]
      return pa;
  
  
      return pa;
  
  
@@ -377,6 +377,7 @@ class RegStage1(RecordObject):
          self.write_bram       = Signal()
          self.write_tag        = Signal()
          self.slow_valid       = Signal()
          self.write_bram       = Signal()
          self.write_tag        = Signal()
          self.slow_valid       = Signal()
+        self.real_adr         = Signal(REAL_ADDR_BITS)
          self.wb               = WBMasterOut("wb")
          self.reload_tag       = Signal(TAG_BITS)
          self.store_way        = Signal(WAY_BITS)
          self.wb               = WBMasterOut("wb")
          self.reload_tag       = Signal(TAG_BITS)
          self.store_way        = Signal(WAY_BITS)
@@ -604,7 +605,7 @@ class DCache(Elaboratable):
              sync += r.req.dcbz.eq(0)
              sync += r.req.nc.eq(0)
              sync += r.req.reserve.eq(0)
              sync += r.req.dcbz.eq(0)
              sync += r.req.nc.eq(0)
              sync += r.req.reserve.eq(0)
-            sync += r.req.virt_mode.eq(1)
+            sync += r.req.virt_mode.eq(0)
              sync += r.req.priv_mode.eq(1)
              sync += r.req.addr.eq(m_in.addr)
              sync += r.req.data.eq(m_in.pte)
              sync += r.req.priv_mode.eq(1)
              sync += r.req.addr.eq(m_in.addr)
              sync += r.req.data.eq(m_in.pte)
@@ -663,13 +664,13 @@ class DCache(Elaboratable):
              return
          for i in range(TLB_SET_SIZE):
              # TLB PLRU interface
              return
          for i in range(TLB_SET_SIZE):
              # TLB PLRU interface
-            tlb_plru        = PLRU(WAY_BITS)
+            tlb_plru        = PLRU(TLB_WAY_BITS)
              setattr(m.submodules, "maybe_plru_%d" % i, tlb_plru)
              tlb_plru_acc_en = Signal()
  
              comb += tlb_plru_acc_en.eq(r1.tlb_hit & (r1.tlb_hit_index == i))
              comb += tlb_plru.acc_en.eq(tlb_plru_acc_en)
              setattr(m.submodules, "maybe_plru_%d" % i, tlb_plru)
              tlb_plru_acc_en = Signal()
  
              comb += tlb_plru_acc_en.eq(r1.tlb_hit & (r1.tlb_hit_index == i))
              comb += tlb_plru.acc_en.eq(tlb_plru_acc_en)
-            comb += tlb_plru.acc.eq(r1.tlb_hit_way)
+            comb += tlb_plru.acc_i.eq(r1.tlb_hit_way)
              comb += tlb_plru_victim[i].eq(tlb_plru.lru_o)
  
      def tlb_search(self, m, tlb_req_index, r0, r0_valid,
              comb += tlb_plru_victim[i].eq(tlb_plru.lru_o)
  
      def tlb_search(self, m, tlb_req_index, r0, r0_valid,
@@ -690,7 +691,7 @@ class DCache(Elaboratable):
          for i in range(TLB_NUM_WAYS):
              is_tag_hit = Signal()
              comb += is_tag_hit.eq(tlb_valid_way[i]
          for i in range(TLB_NUM_WAYS):
              is_tag_hit = Signal()
              comb += is_tag_hit.eq(tlb_valid_way[i]
-                                  & read_tlb_tag(i, tlb_tag_way) == eatag)
+                                  & (read_tlb_tag(i, tlb_tag_way) == eatag))
              with m.If(is_tag_hit):
                  comb += hitway.eq(i)
                  comb += hit.eq(1)
              with m.If(is_tag_hit):
                  comb += hitway.eq(i)
                  comb += hit.eq(1)
@@ -707,7 +708,12 @@ class DCache(Elaboratable):
              comb += ra.eq(Cat(Const(0, ROW_OFF_BITS),
                                r0.req.addr[ROW_OFF_BITS:TLB_LG_PGSZ],
                                pte[TLB_LG_PGSZ:REAL_ADDR_BITS]))
              comb += ra.eq(Cat(Const(0, ROW_OFF_BITS),
                                r0.req.addr[ROW_OFF_BITS:TLB_LG_PGSZ],
                                pte[TLB_LG_PGSZ:REAL_ADDR_BITS]))
-            comb += perm_attr.eq(extract_perm_attr(pte))
+            comb += perm_attr.reference.eq(pte[8])
+            comb += perm_attr.changed.eq(pte[7])
+            comb += perm_attr.nocache.eq(pte[5])
+            comb += perm_attr.priv.eq(pte[3])
+            comb += perm_attr.rd_perm.eq(pte[2])
+            comb += perm_attr.wr_perm.eq(pte[1])
          with m.Else():
              comb += ra.eq(Cat(Const(0, ROW_OFF_BITS),
                                r0.req.addr[ROW_OFF_BITS:REAL_ADDR_BITS]))
          with m.Else():
              comb += ra.eq(Cat(Const(0, ROW_OFF_BITS),
                                r0.req.addr[ROW_OFF_BITS:REAL_ADDR_BITS]))
@@ -778,7 +784,7 @@ class DCache(Elaboratable):
  
              comb += plru_acc_en.eq(r1.cache_hit & (r1.hit_index == i))
              comb += plru.acc_en.eq(plru_acc_en)
  
              comb += plru_acc_en.eq(r1.cache_hit & (r1.hit_index == i))
              comb += plru.acc_en.eq(plru_acc_en)
-            comb += plru.acc.eq(r1.hit_way)
+            comb += plru.acc_i.eq(r1.hit_way)
              comb += plru_victim[i].eq(plru.lru_o)
  
      def cache_tag_read(self, m, r0_stall, req_index, cache_tag_set, cache_tags):
              comb += plru_victim[i].eq(plru.lru_o)
  
      def cache_tag_read(self, m, r0_stall, req_index, cache_tag_set, cache_tags):
@@ -856,7 +862,9 @@ class DCache(Elaboratable):
              # For a store, consider this a hit even if the row isn't
              # valid since it will be by the time we perform the store.
              # For a load, check the appropriate row valid bit.
              # For a store, consider this a hit even if the row isn't
              # valid since it will be by the time we perform the store.
              # For a load, check the appropriate row valid bit.
-            valid = r1.rows_valid[req_row[:ROW_LINE_BITS]]
+            rrow = Signal(ROW_LINE_BITS)
+            comb += rrow.eq(req_row)
+            valid = r1.rows_valid[rrow]
              comb += is_hit.eq(~r0.req.load | valid)
              comb += hit_way.eq(replace_way)
  
              comb += is_hit.eq(~r0.req.load | valid)
              comb += hit_way.eq(replace_way)
  
@@ -959,7 +967,7 @@ class DCache(Elaboratable):
                  sync += reservation.valid.eq(1)
                  sync += reservation.addr.eq(r0.req.addr[LINE_OFF_BITS:64])
  
                  sync += reservation.valid.eq(1)
                  sync += reservation.addr.eq(r0.req.addr[LINE_OFF_BITS:64])
  
-    def writeback_control(self, m, r1, cache_out):
+    def writeback_control(self, m, r1, cache_out_row):
          """Return data for loads & completion control logic
          """
          comb = m.d.comb
          """Return data for loads & completion control logic
          """
          comb = m.d.comb
@@ -978,7 +986,7 @@ class DCache(Elaboratable):
          with m.Else():
              comb += data_fwd.eq(r1.forward_data2)
  
          with m.Else():
              comb += data_fwd.eq(r1.forward_data2)
  
-        comb += data_out.eq(cache_out[r1.hit_way])
+        comb += data_out.eq(cache_out_row)
  
          for i in range(8):
              with m.If(r1.forward_sel[i]):
  
          for i in range(8):
              with m.If(r1.forward_sel[i]):
@@ -1044,7 +1052,7 @@ class DCache(Elaboratable):
                  sync += Display("completing MMU load miss, data=%x",
                                  m_out.data)
  
                  sync += Display("completing MMU load miss, data=%x",
                                  m_out.data)
  
-    def rams(self, m, r1, early_req_row, cache_out, replace_way):
+    def rams(self, m, r1, early_req_row, cache_out_row, replace_way):
          """rams
          Generate a cache RAM for each way. This handles the normal
          reads, writes from reloads and the special store-hit update
          """rams
          Generate a cache RAM for each way. This handles the normal
          reads, writes from reloads and the special store-hit update
@@ -1068,7 +1076,7 @@ class DCache(Elaboratable):
              wr_sel_m = Signal(ROW_SIZE)
              _d_out   = Signal(WB_DATA_BITS, name="dout_%d" % i)
  
              wr_sel_m = Signal(ROW_SIZE)
              _d_out   = Signal(WB_DATA_BITS, name="dout_%d" % i)
  
-            way = CacheRam(ROW_BITS, WB_DATA_BITS, True)
+            way = CacheRam(ROW_BITS, WB_DATA_BITS, ADD_BUF=True)
              setattr(m.submodules, "cacheram_%d" % i, way)
  
              comb += way.rd_en.eq(do_read)
              setattr(m.submodules, "cacheram_%d" % i, way)
  
              comb += way.rd_en.eq(do_read)
@@ -1081,7 +1089,8 @@ class DCache(Elaboratable):
              # Cache hit reads
              comb += do_read.eq(1)
              comb += rd_addr.eq(early_req_row[:ROW_BITS])
              # Cache hit reads
              comb += do_read.eq(1)
              comb += rd_addr.eq(early_req_row[:ROW_BITS])
-            comb += cache_out[i].eq(_d_out)
+            with m.If(r1.hit_way == i):
+                comb += cache_out_row.eq(_d_out)
  
              # Write mux:
              #
  
              # Write mux:
              #
@@ -1292,7 +1301,7 @@ class DCache(Elaboratable):
          with m.Switch(r1.state):
  
              with m.Case(State.IDLE):
          with m.Switch(r1.state):
  
              with m.Case(State.IDLE):
-                sync += r1.wb.adr.eq(req.real_addr)
+                sync += r1.real_adr.eq(req.real_addr)
                  sync += r1.wb.sel.eq(req.byte_sel)
                  sync += r1.wb.dat.eq(req.data)
                  sync += r1.dcbz.eq(req.dcbz)
                  sync += r1.wb.sel.eq(req.byte_sel)
                  sync += r1.wb.dat.eq(req.data)
                  sync += r1.dcbz.eq(req.dcbz)
@@ -1388,19 +1397,21 @@ class DCache(Elaboratable):
                      # Clear stb and set ld_stbs_done
                      # so we can handle an eventual
                      # last ack on the same cycle.
                      # Clear stb and set ld_stbs_done
                      # so we can handle an eventual
                      # last ack on the same cycle.
-                    with m.If(is_last_row_addr(r1.wb.adr, r1.end_row_ix)):
+                    with m.If(is_last_row_addr(r1.real_adr, r1.end_row_ix)):
                          sync += r1.wb.stb.eq(0)
                          comb += ld_stbs_done.eq(1)
  
                      # Calculate the next row address in the current cache line
                          sync += r1.wb.stb.eq(0)
                          comb += ld_stbs_done.eq(1)
  
                      # Calculate the next row address in the current cache line
-                    rarange = Signal(LINE_OFF_BITS-ROW_OFF_BITS)
-                    comb += rarange.eq(r1.wb.adr[ROW_OFF_BITS:LINE_OFF_BITS]+1)
-                    sync += r1.wb.adr[ROW_OFF_BITS:LINE_OFF_BITS].eq(rarange)
+                    row = Signal(LINE_OFF_BITS-ROW_OFF_BITS)
+                    comb += row.eq(r1.real_adr[ROW_OFF_BITS:])
+                    sync += r1.real_adr[ROW_OFF_BITS:LINE_OFF_BITS].eq(row+1)
  
                  # Incoming acks processing
                  sync += r1.forward_valid1.eq(wb_in.ack)
                  with m.If(wb_in.ack):
  
                  # Incoming acks processing
                  sync += r1.forward_valid1.eq(wb_in.ack)
                  with m.If(wb_in.ack):
-                    sync += r1.rows_valid[r1.store_row[:ROW_LINE_BITS]].eq(1)
+                    srow = Signal(ROW_LINE_BITS)
+                    comb += srow.eq(r1.store_row)
+                    sync += r1.rows_valid[srow].eq(1)
  
                      # If this is the data we were looking for,
                      # we can complete the request next cycle.
  
                      # If this is the data we were looking for,
                      # we can complete the request next cycle.
@@ -1457,7 +1468,7 @@ class DCache(Elaboratable):
                      # to be done which is in the same real page.
                      with m.If(req.valid):
                          ra = req.real_addr[0:SET_SIZE_BITS]
                      # to be done which is in the same real page.
                      with m.If(req.valid):
                          ra = req.real_addr[0:SET_SIZE_BITS]
-                        sync += r1.wb.adr[0:SET_SIZE_BITS].eq(ra)
+                        sync += r1.real_adr[0:SET_SIZE_BITS].eq(ra)
                          sync += r1.wb.dat.eq(req.data)
                          sync += r1.wb.sel.eq(req.byte_sel)
  
                          sync += r1.wb.dat.eq(req.data)
                          sync += r1.wb.sel.eq(req.byte_sel)
  
@@ -1517,7 +1528,7 @@ class DCache(Elaboratable):
          sync += log_out.eq(Cat(r1.state[:3], valid_ra, tlb_hit_way[:3],
                                 stall_out, req_op[:3], d_out.valid, d_out.error,
                                 r1.wb.cyc, r1.wb.stb, wb_in.ack, wb_in.stall,
          sync += log_out.eq(Cat(r1.state[:3], valid_ra, tlb_hit_way[:3],
                                 stall_out, req_op[:3], d_out.valid, d_out.error,
                                 r1.wb.cyc, r1.wb.stb, wb_in.ack, wb_in.stall,
-                               r1.wb.adr[3:6]))
+                               r1.real_adr[3:6]))
  
      def elaborate(self, platform):
  
  
      def elaborate(self, platform):
  
@@ -1572,7 +1583,7 @@ class DCache(Elaboratable):
          use_forward1_next = Signal()
          use_forward2_next = Signal()
  
          use_forward1_next = Signal()
          use_forward2_next = Signal()
  
-        cache_out         = CacheRamOut()
+        cache_out_row     = Signal(WB_DATA_BITS)
  
          plru_victim       = PLRUOut()
          replace_way       = Signal(WAY_BITS)
  
          plru_victim       = PLRUOut()
          replace_way       = Signal(WAY_BITS)
@@ -1607,6 +1618,7 @@ class DCache(Elaboratable):
          comb += self.stall_out.eq(r0_stall)
  
          # Wire up wishbone request latch out of stage 1
          comb += self.stall_out.eq(r0_stall)
  
          # Wire up wishbone request latch out of stage 1
+        comb += r1.wb.adr.eq(r1.real_adr[ROW_OFF_BITS:]) # truncate LSBs
          comb += self.wb_out.eq(r1.wb)
  
          # call sub-functions putting everything together, using shared
          comb += self.wb_out.eq(r1.wb)
  
          # call sub-functions putting everything together, using shared
@@ -1636,8 +1648,8 @@ class DCache(Elaboratable):
                             r0_valid, r0, reservation)
          self.reservation_reg(m, r0_valid, access_ok, set_rsrv, clear_rsrv,
                             reservation, r0)
                             r0_valid, r0, reservation)
          self.reservation_reg(m, r0_valid, access_ok, set_rsrv, clear_rsrv,
                             reservation, r0)
-        self.writeback_control(m, r1, cache_out)
-        self.rams(m, r1, early_req_row, cache_out, replace_way)
+        self.writeback_control(m, r1, cache_out_row)
+        self.rams(m, r1, early_req_row, cache_out_row, replace_way)
          self.dcache_fast_hit(m, req_op, r0_valid, r0, r1,
                          req_hit_way, req_index, req_tag, access_ok,
                          tlb_hit, tlb_hit_way, tlb_req_index)
          self.dcache_fast_hit(m, req_op, r0_valid, r0, r1,
                          req_hit_way, req_index, req_tag, access_ok,
                          tlb_hit, tlb_hit_way, tlb_req_index)
@@ -1812,7 +1824,7 @@ def test_dcache(mem, test_fn, test_name):
      m.d.comb += sram.bus.stb.eq(dut.wb_out.stb)
      m.d.comb += sram.bus.we.eq(dut.wb_out.we)
      m.d.comb += sram.bus.sel.eq(dut.wb_out.sel)
      m.d.comb += sram.bus.stb.eq(dut.wb_out.stb)
      m.d.comb += sram.bus.we.eq(dut.wb_out.we)
      m.d.comb += sram.bus.sel.eq(dut.wb_out.sel)
-    m.d.comb += sram.bus.adr.eq(dut.wb_out.adr[3:])
+    m.d.comb += sram.bus.adr.eq(dut.wb_out.adr)
      m.d.comb += sram.bus.dat_w.eq(dut.wb_out.dat)
  
      m.d.comb += dut.wb_in.ack.eq(sram.bus.ack)
      m.d.comb += sram.bus.dat_w.eq(dut.wb_out.dat)
  
      m.d.comb += dut.wb_in.ack.eq(sram.bus.ack)