truncate effective addresses in rv32
[riscv-isa-sim.git] / riscv / processor.cc
index 360b7553689607d4ac7788e3e410469f35453088..9f87f75c0300779d52390d120a41e2285e3cff3f 100644 (file)
 #include "processor.h"
-#include <bfd.h>
-#include <dis-asm.h>
-#include <cmath>
-#include <cstdlib>
-#include <iostream>
 #include "common.h"
 #include "config.h"
 #include "sim.h"
-#include "softfloat.h"
-#include "platform.h" // softfloat isNaNF32UI, etc.
-#include "internals.h" // ditto
+#include "disasm.h"
+#include <inttypes.h>
+#include <cmath>
+#include <cstdlib>
+#include <iostream>
+#include <assert.h>
 
-processor_t::processor_t(sim_t* _sim, char* _mem, size_t _memsz)
-  : sim(_sim), mmu(_mem,_memsz)
+processor_t::processor_t(sim_t* _sim, mmu_t* _mmu, uint32_t _id)
+  : sim(*_sim), mmu(*_mmu), id(_id), utidx(0)
 {
-  memset(XPR,0,sizeof(XPR));
-  memset(FPR,0,sizeof(FPR));
-  pc = 0;
+  reset(true);
+
+  // create microthreads
+  for (int i=0; i<MAX_UTS; i++)
+    uts[i] = new processor_t(&sim, &mmu, id, i);
+}
+
+processor_t::processor_t(sim_t* _sim, mmu_t* _mmu, uint32_t _id,
+                         uint32_t _utidx)
+  : sim(*_sim), mmu(*_mmu), id(_id)
+{
+  reset(true);
+  set_pcr(PCR_SR, SR_U64 | SR_EF | SR_EV);
+  utidx = _utidx;
+
+  // microthreads don't possess their own microthreads
+  for (int i=0; i<MAX_UTS; i++)
+    uts[i] = NULL;
+}
+
+processor_t::~processor_t()
+{
+}
+
+void processor_t::reset(bool value)
+{
+  if (run == !value)
+    return;
+  run = !value;
+
+  // the ISA guarantees on boot that the PC is 0x2000 and the the processor
+  // is in supervisor mode, and in 64-bit mode, if supported, with traps
+  // and virtual memory disabled.
+  set_pcr(PCR_SR, SR_S | SR_S64 | SR_IM);
+  pc = 0x2000;
+
+  // the following state is undefined upon boot-up,
+  // but we zero it for determinism
+  XPR.reset();
+  FPR.reset();
+
   evec = 0;
   epc = 0;
   badvaddr = 0;
   cause = 0;
   pcr_k0 = 0;
   pcr_k1 = 0;
-  tohost = 0;
-  fromhost = 0;
   count = 0;
   compare = 0;
-  set_sr(SR_S | SR_SX);  // SX ignored if 64b mode not supported
+  cycle = 0;
   set_fsr(0);
 
-  memset(counters,0,sizeof(counters));
-
   // vector stuff
+  vecbanks = 0xff;
+  vecbanks_count = 8;
   utidx = -1;
-  vlmax = 8;
+  vlmax = 32;
   vl = 0;
-  nxpr_all = 256;
-  nfpr_all = 256;
-  nxpr_use = 0;
-  nfpr_use = 0;
-  for (int i=0; i<MAX_UTS; i++)
-    uts[i] = NULL;
-
-  // a few assumptions about endianness, including freg_t union
-  static_assert(BYTE_ORDER == LITTLE_ENDIAN);
-  static_assert(sizeof(freg_t) == 8);
-  static_assert(sizeof(reg_t) == 8);
-
-  static_assert(sizeof(insn_t) == 4);
-  static_assert(sizeof(uint128_t) == 16 && sizeof(int128_t) == 16);
-}
-
-void processor_t::init(uint32_t _id, char* _mem, size_t _memsz)
-{
-  id = _id;
-
-  for (int i=0; i<MAX_UTS; i++)
-  {
-    uts[i] = new processor_t(sim, _mem, _memsz);
-    uts[i]->set_sr(uts[i]->sr | SR_EF);
-    uts[i]->set_sr(uts[i]->sr | SR_EV);
-    uts[i]->utidx = i;
-  }
-}
-
-void processor_t::set_sr(uint32_t val)
-{
-  sr = val & ~SR_ZERO;
-#ifndef RISCV_ENABLE_64BIT
-  sr &= ~(SR_SX | SR_UX);
-#endif
-#ifndef RISCV_ENABLE_FPU
-  sr &= ~SR_EF;
-#endif
-#ifndef RISCV_ENABLE_RVC
-  sr &= ~SR_EC;
-#endif
-#ifndef RISCV_ENABLE_VEC
-  sr &= ~SR_EV;
-#endif
-
-  xprlen = ((sr & SR_S) ? (sr & SR_SX) : (sr & SR_UX)) ? 64 : 32;
+  nxfpr_bank = 256;
+  nxpr_use = 32;
+  nfpr_use = 32;
 }
 
 void processor_t::set_fsr(uint32_t val)
 {
-  fsr = val & ~FSR_ZERO;
+  fsr = val & ~FSR_ZERO; // clear FSR bits that read as zero
 }
 
 void processor_t::vcfg()
 {
-  if (nxpr_use == 0 && nfpr_use == 0)
-    vlmax = 8;
-  else if (nfpr_use == 0)
-    vlmax = (nxpr_all-1) / (nxpr_use-1);
-  else if (nxpr_use == 0)
-    vlmax = (nfpr_all-1) / (nfpr_use-1);
+  if (nxpr_use + nfpr_use < 2)
+    vlmax = nxfpr_bank * vecbanks_count;
   else
-    vlmax = std::min((nxpr_all-1) / (nxpr_use-1), (nfpr_all-1) / (nfpr_use-1));
+    vlmax = (nxfpr_bank / (nxpr_use + nfpr_use - 1)) * vecbanks_count;
 
   vlmax = std::min(vlmax, MAX_UTS);
 }
@@ -108,82 +95,223 @@ void processor_t::setvl(int vlapp)
   vl = std::min(vlmax, vlapp);
 }
 
+void processor_t::take_interrupt()
+{
+  uint32_t interrupts = (sr & SR_IP) >> SR_IP_SHIFT;
+  interrupts &= (sr & SR_IM) >> SR_IM_SHIFT;
+
+  if(interrupts && (sr & SR_ET))
+    for(int i = 0; ; i++, interrupts >>= 1)
+      if(interrupts & 1)
+        throw interrupt_t(i);
+}
+
 void processor_t::step(size_t n, bool noisy)
 {
+  if(!run)
+    return;
+
   size_t i = 0;
-  while(1) try
+  try
   {
-    for( ; i < n; i++)
-    {
-      uint32_t interrupts = (cause & CAUSE_IP) >> CAUSE_IP_SHIFT;
-      interrupts &= (sr & SR_IM) >> SR_IM_SHIFT;
-      if(interrupts && (sr & SR_ET))
-        take_trap(trap_interrupt,noisy);
-
-      insn_t insn = mmu.load_insn(pc, sr & SR_EC);
-  
-      reg_t npc = pc + insn_length(insn);
+    take_interrupt();
 
-      if(noisy)
-        disasm(insn,pc);
+    mmu_t& _mmu = mmu;
+    reg_t npc = pc;
 
-      #include "execute.h"
-  
-      pc = npc;
-      XPR[0] = 0;
+    // execute_insn fetches and executes one instruction
+    #define execute_insn(noisy) \
+      do { \
+        mmu_t::insn_fetch_t fetch = _mmu.load_insn(npc, sr & SR_EC); \
+        if(noisy) disasm(fetch.insn, npc); \
+        npc = fetch.func(this, fetch.insn, npc); \
+        pc = npc; \
+      } while(0)
 
-      if(count++ == compare)
-        cause |= 1 << (TIMER_IRQ+CAUSE_IP_SHIFT);
+    if(noisy) for( ; i < n; i++) // print out instructions as we go
+      execute_insn(true);
+    else 
+    {
+      // unrolled for speed
+      for( ; n > 3 && i < n-3; i+=4)
+      {
+        execute_insn(false);
+        execute_insn(false);
+        execute_insn(false);
+        execute_insn(false);
+      }
+      for( ; i < n; i++)
+        execute_insn(false);
     }
-    return;
   }
   catch(trap_t t)
   {
-    i++;
+    // an exception occurred in the target processor
     take_trap(t,noisy);
   }
+  catch(interrupt_t t)
+  {
+    take_trap((1ULL << (8*sizeof(reg_t)-1)) + t.i, noisy);
+  }
   catch(vt_command_t cmd)
   {
-    if (cmd == vt_command_stop)
-      return;
+    // this microthread has finished
+    assert(cmd == vt_command_stop);
   }
+
+  cycle += i;
+
+  // update timer and possibly register a timer interrupt
+  uint32_t old_count = count;
+  count += i;
+  if(old_count < compare && uint64_t(old_count) + i >= compare)
+    set_interrupt(IRQ_TIMER, true);
 }
 
-void processor_t::take_trap(trap_t t, bool noisy)
+void processor_t::take_trap(reg_t t, bool noisy)
 {
-  demand(t < NUM_TRAPS, "internal error: bad trap number %d", int(t));
-  demand(sr & SR_ET, "error mode on core %d!\ntrap %s, pc 0x%016llx",
-         id, trap_name(t), (unsigned long long)pc);
   if(noisy)
-    printf("core %3d: trap %s, pc 0x%016llx\n",
-           id, trap_name(t), (unsigned long long)pc);
+  {
+    if ((sreg_t)t < 0)
+      printf("core %3d: interrupt %lld, pc 0x%016llx\n",
+             id, (long long)(t << 1 >> 1), (unsigned long long)pc);
+    else
+      printf("core %3d: trap %s, pc 0x%016llx\n",
+             id, trap_name(trap_t(t)), (unsigned long long)pc);
+  }
 
-  set_sr((((sr & ~SR_ET) | SR_S) & ~SR_PS) | ((sr & SR_S) ? SR_PS : 0));
-  cause = (cause & ~CAUSE_EXCCODE) | (t << CAUSE_EXCCODE_SHIFT);
+  // switch to supervisor, set previous supervisor bit, disable traps
+  set_pcr(PCR_SR, (((sr & ~SR_ET) | SR_S) & ~SR_PS) | ((sr & SR_S) ? SR_PS : 0));
+  cause = t;
   epc = pc;
   pc = evec;
   badvaddr = mmu.get_badvaddr();
 }
 
+void processor_t::deliver_ipi()
+{
+  if (run)
+    set_pcr(PCR_CLR_IPI, 1);
+}
+
 void processor_t::disasm(insn_t insn, reg_t pc)
 {
-  printf("core %3d: 0x%016llx (0x%08x) ",id,(unsigned long long)pc,insn.bits);
-
-  #ifdef RISCV_HAVE_LIBOPCODES
-  disassemble_info info;
-  INIT_DISASSEMBLE_INFO(info, stdout, fprintf);
-  info.flavour = bfd_target_unknown_flavour;
-  info.arch = bfd_arch_mips;
-  info.mach = 101; // XXX bfd_mach_mips_riscv requires modified bfd.h
-  info.endian = BFD_ENDIAN_LITTLE;
-  info.buffer = (bfd_byte*)&insn;
-  info.buffer_length = sizeof(insn);
-  info.buffer_vma = pc;
-
-  int ret = print_insn_little_mips(pc, &info);
-  demand(ret == (INSN_IS_RVC(insn.bits) ? 2 : 4), "disasm bug!");
-  #else
-  printf("unknown");
-  #endif
-  printf("\n");
+  // the disassembler is stateless, so we share it
+  static disassembler disasm;
+  printf("core %3d: 0x%016llx (0x%08x) %s\n", id, (unsigned long long)pc,
+         insn.bits, disasm.disassemble(insn).c_str());
+}
+
+void processor_t::set_pcr(int which, reg_t val)
+{
+  switch (which)
+  {
+    case PCR_SR:
+      sr = val & ~SR_ZERO; // clear SR bits that read as zero
+#ifndef RISCV_ENABLE_64BIT
+      sr &= ~(SR_S64 | SR_U64);
+#endif
+#ifndef RISCV_ENABLE_FPU
+      sr &= ~SR_EF;
+#endif
+#ifndef RISCV_ENABLE_RVC
+      sr &= ~SR_EC;
+#endif
+#ifndef RISCV_ENABLE_VEC
+      sr &= ~SR_EV;
+#endif
+      // update MMU state and flush TLB
+      mmu.set_sr(sr);
+      mmu.flush_tlb();
+      // set the fixed-point register length
+      xprlen = ((sr & SR_S) ? (sr & SR_S64) : (sr & SR_U64)) ? 64 : 32;
+      break;
+    case PCR_EPC:
+      epc = val;
+      break;
+    case PCR_EVEC: 
+      evec = val;
+      break;
+    case PCR_COUNT:
+      count = val;
+      break;
+    case PCR_COMPARE:
+      set_interrupt(IRQ_TIMER, false);
+      compare = val;
+      break;
+    case PCR_PTBR:
+      mmu.set_ptbr(val);
+      break;
+    case PCR_SEND_IPI:
+      sim.send_ipi(val);
+      break;
+    case PCR_CLR_IPI:
+      set_interrupt(IRQ_IPI, val & 1);
+      break;
+    case PCR_K0:
+      pcr_k0 = val;
+      break;
+    case PCR_K1:
+      pcr_k1 = val;
+      break;
+    case PCR_VECBANK:
+      vecbanks = val & 0xff;
+      vecbanks_count = __builtin_popcountll(vecbanks);
+      break;
+    case PCR_TOHOST:
+      if (tohost == 0)
+        tohost = val;
+      break;
+    case PCR_FROMHOST:
+      set_interrupt(IRQ_HOST, val != 0);
+      fromhost = val;
+      break;
+  }
+}
+
+reg_t processor_t::get_pcr(int which)
+{
+  switch (which)
+  {
+    case PCR_SR:
+      return sr;
+    case PCR_EPC:
+      return epc;
+    case PCR_BADVADDR:
+      return badvaddr;
+    case PCR_EVEC:
+      return evec;
+    case PCR_COUNT:
+      return count;
+    case PCR_COMPARE:
+      return compare;
+    case PCR_CAUSE:
+      return cause;
+    case PCR_PTBR:
+      return mmu.get_ptbr();
+    case PCR_COREID:
+      return id;
+    case PCR_IMPL:
+      return 1;
+    case PCR_K0:
+      return pcr_k0;
+    case PCR_K1:
+      return pcr_k1;
+    case PCR_VECBANK:
+      return vecbanks;
+    case PCR_TOHOST:
+      return tohost;
+    case PCR_FROMHOST:
+      return fromhost;
+  }
+  return -1;
+}
+
+void processor_t::set_interrupt(int which, bool on)
+{
+  uint32_t mask = (1 << (which + SR_IP_SHIFT)) & SR_IP;
+  if (on)
+    sr |= mask;
+  else
+    sr &= ~mask;
 }