write-release moves out of "ALU valid" due to using alu_pulse
[soc.git] / src / soc / regfile / virtual_port.py
index 4f025887328699279e0faf96b5138deab1ef5568..322efe8e73588a7d6dd4f2761572957086781111 100644 (file)
@@ -24,99 +24,182 @@ class VirtualRegPort(RegFileArray):
         self.regwidth = regwidth = bitwidth // n_regs
         super().__init__(self.regwidth, n_regs)
 
-        # create suite of 8 write and 8 read ports for external use
-        self.wr_ports = []
-        self.rd_ports = []
-        for i in range(n_regs):
-            self.wr_ports.append(RecordObject([("wen", n_regs),
-                                              ("data_i", regwidth)],
-                                             name="w%d" % i))
-            self.rd_ports.append(RecordObject([("ren", n_regs),
-                                              ("data_o", regwidth)],
-                                             name="r%d" % i))
-        # and append the "full" depth variant to the "external" ports
-        self.wr_ports.append(RecordObject([("wen", n_regs),
-                                          ("data_i", bitwidth)], # *full* wid
-                                         name="full_wr"))
-        self.rd_ports.append(RecordObject([("ren", n_regs),
-                                          ("data_o", bitwidth)], # *full* wid
-                                         name="full_rd"))
-        # now for internal use
-        self._wr_regs = self.write_reg_port(f"intw")
-        self._rd_regs = self.read_reg_port(f"intr")
-
+        # "full" depth variant of the "external" port
+        self.full_wr = RecordObject([("wen", n_regs),
+                                     ("data_i", bitwidth)], # *full* wid
+                                    name="full_wr")
+        self.full_rd = RecordObject([("ren", n_regs),
+                                     ("data_o", bitwidth)], # *full* wid
+                                    name="full_rd")
     def elaborate(self, platform):
         m = super().elaborate(platform)
-        comb, sync = m.d.comb, m.d.sync
-
-        # connect up: detect if read is requested on large (full) port
-        # nothing fancy needed because reads are same-cycle
-        rlast = self.rd_ports[-1]
-        ren_sig = Signal(reset_less=True)
-        comb += ren_sig.eq(rlast.ren.bool())
-        print (rlast)
-        with m.If(ren_sig):
-            # wire up the enable signals and chain-accumulate the data
-            print (self._rd_regs)
-            l = map(lambda port: port.data_o, self._rd_regs) # get port data(s)
-            le = map(lambda port: port.ren, self._rd_regs) # get port ren(s)
-            comb += rlast.data_o.eq(Cat(*l)) # we like Cat on lists
-            comb += Cat(*le).eq(rlast.ren)
-        with m.Else():
-            # allow request through the corresponding lower indexed ports
-            # TODO: make data_o and ren fields "directional" then simply
-            # use record "connect"
-            for i, port in enumerate(self._rd_regs):
-                comb += port.ren.eq(self.rd_ports[i].ren)
-                comb += self.rd_ports[i].data_o.eq(port.data_o)
-
-        # connect up: detect if write is requested on large (full) port
-        # however due to the delay (1 clock) on write, we also need to
-        # delay the test.  enable is not-delayed, but data is.
-        en_sig = Signal(reset_less=True)   # combinatorial
-        data_sig = Signal(reset_less=True) # sync (one clock delay)
-
-        wlast = self.wr_ports[-1]
-        comb += en_sig.eq(wlast.wen.bool())
-        sync += data_sig.eq(en_sig)
-
-        with m.If(en_sig):
-            # wire up the enable signals from the large (full) port
-            le = map(lambda port: port.wen, self._wr_regs) # get port wen(s)
-            comb += Cat(*le).eq(wlast.wen)
-        with m.Else():
-            # allow request through the corresponding lower indexed ports
-            for i, port in enumerate(self._wr_regs):
-                comb += port.wen.eq(self.wr_ports[i].wen)
-
-        # and (sigh) data is on one clock-delay, connect that too
-        with m.If(data_sig):
-            # get list of all data_i (and wens) and assign to them via Cat
-            l = map(lambda port: port.data_i, self._wr_regs)
-            comb += Cat(*l).eq(wlast.data_i)
-        with m.Else():
-            # allow data through the corresponding lower indexed ports
-            for i, port in enumerate(self._wr_regs):
-                comb += port.data_i.eq(self.wr_ports[i].data_i)
+        comb = m.d.comb
+
+        # for internal use only.
+        wr_regs = self.write_reg_port(f"w")
+        rd_regs = self.read_reg_port(f"r")
+
+        # connect up full read port
+        rfull = self.full_rd
+
+        # wire up the enable signals and chain-accumulate the data
+        l = map(lambda port: port.data_o, rd_regs) # get port data(s)
+        le = map(lambda port: port.ren, rd_regs) # get port ren(s)
+
+        comb += rfull.data_o.eq(Cat(*l)) # we like Cat on lists
+        comb += Cat(*le).eq(rfull.ren)
+
+        # connect up full write port
+        wfull = self.full_wr
+
+        # wire up the enable signals from the large (full) port
+        l = map(lambda port: port.data_i, wr_regs)
+        le = map(lambda port: port.wen, wr_regs) # get port wen(s)
+
+        # get list of all data_i (and wens) and assign to them via Cat
+        comb += Cat(*l).eq(wfull.data_i)
+        comb += Cat(*le).eq(wfull.wen)
 
         return m
 
     def __iter__(self):
         yield from super().__iter__()
-        for p in self.wr_ports:
-            yield from p
-        for p in self.rd_ports:
-            yield from p
+        yield from self.full_wr
+        yield from self.full_rd
+
+
+def regfile_array_sim(dut, rp1, rp2, rp3, wp):
+    # part-port write
+    yield wp.data_i.eq(2)
+    yield wp.wen.eq(1<<1)
+    yield
+    yield wp.wen.eq(0)
+    # part-port read
+    yield rp1.ren.eq(1<<1)
+    yield
+    data = yield rp1.data_o
+    print (data)
+    assert data == 2
+
+    # simultaneous read/write - should be pass-thru
+    yield rp1.ren.eq(1<<5)
+    yield rp2.ren.eq(1<<1)
+    yield wp.wen.eq(1<<5)
+    yield wp.data_i.eq(6)
+    yield
+    yield wp.wen.eq(0)
+    yield rp1.ren.eq(0)
+    yield rp2.ren.eq(0)
+    data1 = yield rp1.data_o
+    print (data1)
+    assert data1 == 6, data1
+    data2 = yield rp2.data_o
+    print (data2)
+    assert data2 == 2, data2
+    yield
+    data = yield rp1.data_o
+    print (data)
+
+    # full port read (whole reg)
+    yield dut.full_rd.ren.eq(0xff)
+    yield
+    yield dut.full_rd.ren.eq(0)
+    data = yield dut.full_rd.data_o
+    print (hex(data))
+
+    # full port read (part reg)
+    yield dut.full_rd.ren.eq(0x1<<5)
+    yield
+    yield dut.full_rd.ren.eq(0)
+    data = yield dut.full_rd.data_o
+    print (hex(data))
+
+    # full port part-write (part masked reg)
+    yield dut.full_wr.wen.eq(0x1<<1)
+    yield dut.full_wr.data_i.eq(0xe0)
+    yield
+    yield dut.full_wr.wen.eq(0x0)
+
+    # full port read (whole reg)
+    yield dut.full_rd.ren.eq(0xff)
+    yield
+    yield dut.full_rd.ren.eq(0)
+    data = yield dut.full_rd.data_o
+    print (hex(data))
+
+    # full port write
+    yield dut.full_wr.wen.eq(0xff)
+    yield dut.full_wr.data_i.eq(0xcafeface)
+    yield
+    yield dut.full_wr.wen.eq(0x0)
+
+    # full port read (whole reg)
+    yield dut.full_rd.ren.eq(0xff)
+    yield
+    yield dut.full_rd.ren.eq(0)
+    data = yield dut.full_rd.data_o
+    print (hex(data))
+
+    # part write
+    yield wp.data_i.eq(2)
+    yield wp.wen.eq(1<<1)
+    yield
+    yield wp.wen.eq(0)
+    yield rp1.ren.eq(1<<1)
+    yield
+    data = yield rp1.data_o
+    print (hex(data))
+    assert data == 2
+
+    # full port read (whole reg)
+    yield dut.full_rd.ren.eq(0xff)
+    yield
+    yield dut.full_rd.ren.eq(0)
+    data = yield dut.full_rd.data_o
+    print (hex(data))
+
+    # simultaneous read/write: full-write, part-write, 3x part-read
+    yield rp1.ren.eq(1<<5)
+    yield rp2.ren.eq(1<<1)
+    yield rp3.ren.eq(1<<3)
+    yield wp.wen.eq(1<<3)
+    yield wp.data_i.eq(6)
+    yield dut.full_wr.wen.eq((1<<1) | (1<<5))
+    yield dut.full_wr.data_i.eq((0xa<<(1*4)) | (0x3<<(5*4)))
+    yield
+    yield dut.full_wr.wen.eq(0)
+    yield wp.wen.eq(0)
+    yield rp1.ren.eq(0)
+    yield rp2.ren.eq(0)
+    yield rp3.ren.eq(0)
+    data1 = yield rp1.data_o
+    print (hex(data1))
+    assert data1 == 0x3
+    data2 = yield rp2.data_o
+    print (hex(data2))
+    assert data2 == 0xa
+    data3 = yield rp3.data_o
+    print (hex(data3))
+    assert data3 == 0x6
 
 
 def test_regfile():
     dut = VirtualRegPort(32, 8)
+    rp1 = dut.read_port("read1")
+    rp2 = dut.read_port("read2")
+    rp3 = dut.read_port("read3")
+    wp = dut.write_port("write")
+
     ports=dut.ports()
     print ("ports", ports)
     vl = rtlil.convert(dut, ports=ports)
     with open("test_virtualregfile.il", "w") as f:
         f.write(vl)
 
+    run_simulation(dut, regfile_array_sim(dut, rp1, rp2, rp3, wp),
+                   vcd_name='test_regfile_array.vcd')
+
 if __name__ == '__main__':
     test_regfile()
 
+