Minor refactoring
[riscv-isa-sim.git] / riscv / processor.cc
index 2bd215566cebfd5bd5da31a872b860ed59415842..284f281ef0996aabde72aef5ecf0435afe2ea9b9 100644 (file)
@@ -5,27 +5,34 @@
 #include "common.h"
 #include "config.h"
 #include "sim.h"
+#include "htif.h"
 #include "disasm.h"
+#include "icache.h"
 #include <cinttypes>
 #include <cmath>
 #include <cstdlib>
 #include <iostream>
 #include <assert.h>
 #include <limits.h>
+#include <stdexcept>
+#include <algorithm>
 
 processor_t::processor_t(sim_t* _sim, mmu_t* _mmu, uint32_t _id)
-  : sim(_sim), mmu(_mmu), ext(NULL), id(_id), opcode_bits(0)
+  : sim(_sim), mmu(_mmu), ext(NULL), disassembler(new disassembler_t),
+    id(_id), run(false), debug(false)
 {
   reset(true);
   mmu->set_processor(this);
 
   #define DECLARE_INSN(name, match, mask) REGISTER_INSN(this, name, match, mask)
-  #include "opcodes.h"
+  #include "encoding.h"
   #undef DECLARE_INSN
+  build_opcode_map();
 }
 
 processor_t::~processor_t()
 {
+  delete disassembler;
 }
 
 void state_t::reset()
@@ -33,10 +40,7 @@ void state_t::reset()
   // the ISA guarantees on boot that the PC is 0x2000 and the the processor
   // is in supervisor mode, and in 64-bit mode, if supported, with traps
   // and virtual memory disabled.
-  sr = SR_S;
-#ifdef RISCV_ENABLE_64BIT
-  sr |= SR_S64;
-#endif
+  sr = SR_S | SR_S64 | SR_U64;
   pc = 0x2000;
 
   // the following state is undefined upon boot-up,
@@ -44,34 +48,41 @@ void state_t::reset()
   XPR.reset();
   FPR.reset();
 
-  evec = 0;
   epc = 0;
   badvaddr = 0;
-  cause = 0;
+  evec = 0;
+  ptbr = 0;
   pcr_k0 = 0;
   pcr_k1 = 0;
+  cause = 0;
+  tohost = 0;
+  fromhost = 0;
   count = 0;
   compare = 0;
-  cycle = 0;
-  fsr = 0;
+  fflags = 0;
+  frm = 0;
 
   load_reservation = -1;
 }
 
+void processor_t::set_debug(bool value)
+{
+  debug = value;
+  if (ext)
+    ext->set_debug(value);
+}
+
 void processor_t::reset(bool value)
 {
   if (run == !value)
     return;
   run = !value;
 
-  state.reset();
-}
+  state.reset(); // reset the core
+  set_pcr(CSR_STATUS, state.sr);
 
-uint32_t processor_t::set_fsr(uint32_t val)
-{
-  uint32_t old_fsr = state.fsr;
-  state.fsr = val & ~FSR_ZERO; // clear FSR bits that read as zero
-  return old_fsr;
+  if (ext)
+    ext->reset(); // reset the extension
 }
 
 void processor_t::take_interrupt()
@@ -85,73 +96,102 @@ void processor_t::take_interrupt()
         throw trap_t((1ULL << ((state.sr & SR_S64) ? 63 : 31)) + i);
 }
 
-void processor_t::step(size_t n, bool noisy)
+static void commit_log(state_t* state, insn_t insn)
+{
+#ifdef RISCV_ENABLE_COMMITLOG
+  if (state->sr & SR_EI) {
+    if (state->log_reg_write.addr) {
+      fprintf(stderr, "0x%016" PRIx64 " (0x%08" PRIx32 ") %c%2u 0x%016" PRIx64 "\n",
+              state->pc, insn.bits(),
+              state->log_reg_write.addr & 1 ? 'f' : 'x',
+              state->log_reg_write.addr >> 1, state->log_reg_write.data);
+    }
+    else {
+      fprintf(stderr, "0x%016" PRIx64 " (0x%08" PRIx32 ")\n",
+              state->pc, insn.bits());
+    }
+  }
+  state->log_reg_write.addr = 0;
+#endif
+}
+
+static inline void execute_insn(processor_t* p, state_t* st, insn_fetch_t fetch)
+{
+  reg_t npc = fetch.func(p, fetch.insn.insn, st->pc);
+  commit_log(st, fetch.insn.insn);
+  st->pc = npc;
+}
+
+void processor_t::step(size_t n0)
 {
   if(!run)
     return;
 
-  size_t i = 0;
-  reg_t npc = state.pc;
   mmu_t* _mmu = mmu;
+  auto count32 = decltype(state.compare)(state.count);
+  bool count_le_compare = count32 <= state.compare;
+  ssize_t n = std::min(ssize_t(n0), ssize_t((state.compare - count32) | 1));
 
   try
   {
     take_interrupt();
 
-    // execute_insn fetches and executes one instruction
-    #define execute_insn(noisy) \
-      do { \
-        mmu_t::insn_fetch_t fetch = _mmu->load_insn(npc); \
-        if(noisy) disasm(fetch.insn.insn, npc); \
-        npc = fetch.func(this, fetch.insn.insn, npc); \
-      } while(0)
-
-    if(noisy) for( ; i < n; i++) // print out instructions as we go
-      execute_insn(true);
-    else 
+    if (debug) // print out instructions as we go
     {
-      // unrolled for speed
-      for( ; n > 3 && i < n-3; i+=4)
+      for (ssize_t i = 0; i < n; state.count++, i++)
       {
-        execute_insn(false);
-        execute_insn(false);
-        execute_insn(false);
-        execute_insn(false);
+        insn_fetch_t fetch = mmu->load_insn(state.pc);
+        disasm(fetch.insn.insn);
+        execute_insn(this, &state, fetch);
       }
-      for( ; i < n; i++)
-        execute_insn(false);
     }
+    else while (n > 0)
+    {
+      size_t idx = (state.pc / sizeof(insn_t)) % ICACHE_SIZE;
+      auto ic_entry = _mmu->access_icache(state.pc), ic_entry_init = ic_entry;
+
+      #define ICACHE_ACCESS(idx) { \
+        insn_fetch_t fetch = ic_entry->data; \
+        ic_entry++; \
+        execute_insn(this, &state, fetch); \
+        if (idx < ICACHE_SIZE-1 && unlikely(ic_entry->tag != state.pc)) break; \
+      }
 
-    state.pc = npc;
+      switch (idx)
+      {
+        ICACHE_SWITCH; // auto-generated into icache.h
+      }
+
+      size_t i = ic_entry - ic_entry_init;
+      state.count += i;
+      n -= i;
+    }
   }
   catch(trap_t& t)
   {
-    take_trap(npc, t, noisy);
+    take_trap(t);
   }
 
-  state.cycle += i;
-
-  // update timer and possibly register a timer interrupt
-  uint32_t old_count = state.count;
-  state.count += i;
-  if(old_count < state.compare && uint64_t(old_count) + i >= state.compare)
+  bool count_ge_compare =
+    uint64_t(n) + decltype(state.compare)(state.count) >= state.compare;
+  if (count_le_compare && count_ge_compare)
     set_interrupt(IRQ_TIMER, true);
 }
 
-void processor_t::take_trap(reg_t pc, trap_t& t, bool noisy)
+void processor_t::take_trap(trap_t& t)
 {
-  if (noisy)
+  if (debug)
     fprintf(stderr, "core %3d: exception %s, epc 0x%016" PRIx64 "\n",
-            id, t.name(), pc);
+            id, t.name(), state.pc);
 
   // switch to supervisor, set previous supervisor bit, disable interrupts
-  set_pcr(PCR_SR, (((state.sr & ~SR_EI) | SR_S) & ~SR_PS & ~SR_PEI) |
-                  ((state.sr & SR_S) ? SR_PS : 0) |
-                  ((state.sr & SR_EI) ? SR_PEI : 0));
+  set_pcr(CSR_STATUS, (((state.sr & ~SR_EI) | SR_S) & ~SR_PS & ~SR_PEI) |
+                      ((state.sr & SR_S) ? SR_PS : 0) |
+                      ((state.sr & SR_EI) ? SR_PEI : 0));
 
   yield_load_reservation();
   state.cause = t.cause();
-  state.epc = pc;
+  state.epc = state.pc;
   state.pc = state.evec;
 
   t.side_effects(&state); // might set badvaddr etc.
@@ -160,15 +200,14 @@ void processor_t::take_trap(reg_t pc, trap_t& t, bool noisy)
 void processor_t::deliver_ipi()
 {
   if (run)
-    set_pcr(PCR_CLR_IPI, 1);
+    set_pcr(CSR_CLEAR_IPI, 1);
 }
 
-void processor_t::disasm(insn_t insn, reg_t pc)
+void processor_t::disasm(insn_t insn)
 {
   // the disassembler is stateless, so we share it
-  static disassembler disasm;
   fprintf(stderr, "core %3d: 0x%016" PRIx64 " (0x%08" PRIx32 ") %s\n",
-          id, state.pc, insn.bits(), disasm.disassemble(insn).c_str());
+          id, state.pc, insn.bits(), disassembler->disassemble(insn).c_str());
 }
 
 reg_t processor_t::set_pcr(int which, reg_t val)
@@ -177,7 +216,17 @@ reg_t processor_t::set_pcr(int which, reg_t val)
 
   switch (which)
   {
-    case PCR_SR:
+    case CSR_FFLAGS:
+      state.fflags = val & (FSR_AEXC >> FSR_AEXC_SHIFT);
+      break;
+    case CSR_FRM:
+      state.frm = val & (FSR_RD >> FSR_RD_SHIFT);
+      break;
+    case CSR_FCSR:
+      state.fflags = (val & FSR_AEXC) >> FSR_AEXC_SHIFT;
+      state.frm = (val & FSR_RD) >> FSR_RD_SHIFT;
+      break;
+    case CSR_STATUS:
       state.sr = (val & ~SR_IP) | (state.sr & SR_IP);
 #ifndef RISCV_ENABLE_64BIT
       state.sr &= ~(SR_S64 | SR_U64);
@@ -185,92 +234,121 @@ reg_t processor_t::set_pcr(int which, reg_t val)
 #ifndef RISCV_ENABLE_FPU
       state.sr &= ~SR_EF;
 #endif
-#ifndef RISCV_ENABLE_VEC
-      state.sr &= ~SR_EV;
-#endif
+      if (!ext)
+        state.sr &= ~SR_EA;
       state.sr &= ~SR_ZERO;
+      rv64 = (state.sr & SR_S) ? (state.sr & SR_S64) : (state.sr & SR_U64);
       mmu->flush_tlb();
       break;
-    case PCR_EPC:
+    case CSR_EPC:
       state.epc = val;
       break;
-    case PCR_EVEC: 
-      state.evec = val;
+    case CSR_EVEC:
+      state.evec = val & ~3;
       break;
-    case PCR_COUNT:
+    case CSR_COUNT:
       state.count = val;
       break;
-    case PCR_COMPARE:
+    case CSR_COUNTH:
+      state.count = (val << 32) | (uint32_t)state.count;
+      break;
+    case CSR_COMPARE:
       set_interrupt(IRQ_TIMER, false);
       state.compare = val;
       break;
-    case PCR_PTBR:
+    case CSR_PTBR:
       state.ptbr = val & ~(PGSIZE-1);
       break;
-    case PCR_SEND_IPI:
+    case CSR_SEND_IPI:
       sim->send_ipi(val);
       break;
-    case PCR_CLR_IPI:
+    case CSR_CLEAR_IPI:
       set_interrupt(IRQ_IPI, val & 1);
       break;
-    case PCR_SUP0:
+    case CSR_SUP0:
       state.pcr_k0 = val;
       break;
-    case PCR_SUP1:
+    case CSR_SUP1:
       state.pcr_k1 = val;
       break;
-    case PCR_TOHOST:
+    case CSR_TOHOST:
       if (state.tohost == 0)
         state.tohost = val;
       break;
-    case PCR_FROMHOST:
-      set_interrupt(IRQ_HOST, val != 0);
-      state.fromhost = val;
+    case CSR_FROMHOST:
+      set_fromhost(val);
       break;
   }
 
   return old_pcr;
 }
 
+void processor_t::set_fromhost(reg_t val)
+{
+  set_interrupt(IRQ_HOST, val != 0);
+  state.fromhost = val;
+}
+
 reg_t processor_t::get_pcr(int which)
 {
   switch (which)
   {
-    case PCR_SR:
+    case CSR_FFLAGS:
+      return state.fflags;
+    case CSR_FRM:
+      return state.frm;
+    case CSR_FCSR:
+      return (state.fflags << FSR_AEXC_SHIFT) | (state.frm << FSR_RD_SHIFT);
+    case CSR_STATUS:
       return state.sr;
-    case PCR_EPC:
+    case CSR_EPC:
       return state.epc;
-    case PCR_BADVADDR:
+    case CSR_BADVADDR:
       return state.badvaddr;
-    case PCR_EVEC:
+    case CSR_EVEC:
       return state.evec;
-    case PCR_COUNT:
+    case CSR_CYCLE:
+    case CSR_TIME:
+    case CSR_INSTRET:
+    case CSR_COUNT:
       return state.count;
-    case PCR_COMPARE:
+    case CSR_CYCLEH:
+    case CSR_TIMEH:
+    case CSR_INSTRETH:
+    case CSR_COUNTH:
+      if (rv64)
+        break;
+      return state.count >> 32;
+    case CSR_COMPARE:
       return state.compare;
-    case PCR_CAUSE:
+    case CSR_CAUSE:
       return state.cause;
-    case PCR_PTBR:
+    case CSR_PTBR:
       return state.ptbr;
-    case PCR_ASID:
+    case CSR_SEND_IPI:
+    case CSR_CLEAR_IPI:
+      return 0;
+    case CSR_ASID:
       return 0;
-    case PCR_FATC:
+    case CSR_FATC:
       mmu->flush_tlb();
       return 0;
-    case PCR_HARTID:
+    case CSR_HARTID:
       return id;
-    case PCR_IMPL:
+    case CSR_IMPL:
       return 1;
-    case PCR_SUP0:
+    case CSR_SUP0:
       return state.pcr_k0;
-    case PCR_SUP1:
+    case CSR_SUP1:
       return state.pcr_k1;
-    case PCR_TOHOST:
+    case CSR_TOHOST:
+      sim->get_htif()->tick(); // not necessary, but faster
       return state.tohost;
-    case PCR_FROMHOST:
+    case CSR_FROMHOST:
+      sim->get_htif()->tick(); // not necessary, but faster
       return state.fromhost;
   }
-  return -1;
+  throw trap_illegal_instruction();
 }
 
 void processor_t::set_interrupt(int which, bool on)
@@ -289,40 +367,64 @@ reg_t illegal_instruction(processor_t* p, insn_t insn, reg_t pc)
 
 insn_func_t processor_t::decode_insn(insn_t insn)
 {
-  bool rv64 = (state.sr & SR_S) ? (state.sr & SR_S64) : (state.sr & SR_U64);
+  size_t mask = opcode_map.size()-1;
+  insn_desc_t* desc = opcode_map[insn.bits() & mask]; 
 
-  auto key = insn.bits() & ((1L << opcode_bits)-1);
-  for (auto it = opcode_map.find(key); it != opcode_map.end() && it->first == key; ++it)
-    if ((insn.bits() & it->second.mask) == it->second.match)
-      return rv64 ? it->second.rv64 : it->second.rv32;
+  while ((insn.bits() & desc->mask) != desc->match)
+    desc++;
 
-  return &illegal_instruction;
+  return rv64 ? desc->rv64 : desc->rv32;
 }
 
 void processor_t::register_insn(insn_desc_t desc)
 {
   assert(desc.mask & 1);
-  if (opcode_bits == 0 || (desc.mask & ((1L << opcode_bits)-1)) != ((1L << opcode_bits)-1))
+  instructions.push_back(desc);
+}
+
+void processor_t::build_opcode_map()
+{
+  size_t buckets = -1;
+  for (auto& inst : instructions)
+    while ((inst.mask & buckets) != buckets)
+      buckets /= 2;
+  buckets++;
+
+  struct cmp {
+    decltype(insn_desc_t::match) mask;
+    cmp(decltype(mask) mask) : mask(mask) {}
+    bool operator()(const insn_desc_t& lhs, const insn_desc_t& rhs) {
+      if ((lhs.match & mask) != (rhs.match & mask))
+        return (lhs.match & mask) < (rhs.match & mask);
+      return lhs.match < rhs.match;
+    }
+  };
+  std::sort(instructions.begin(), instructions.end(), cmp(buckets-1));
+
+  opcode_map.resize(buckets);
+  opcode_store.resize(instructions.size() + 1);
+
+  size_t j = 0;
+  for (size_t b = 0, i = 0; b < buckets; b++)
   {
-    unsigned x = 0;
-    while ((desc.mask & ((1L << (x+1))-1)) == ((1L << (x+1))-1) &&
-           (opcode_bits == 0 || x <= opcode_bits))
-      x++;
-    opcode_bits = x;
-
-    decltype(opcode_map) new_map;
-    for (auto it = opcode_map.begin(); it != opcode_map.end(); ++it)
-      new_map.insert(std::make_pair(it->second.match & ((1L<<x)-1), it->second));
-    opcode_map = new_map;
+    opcode_map[b] = &opcode_store[j];
+    while (i < instructions.size() && b == (instructions[i].match & (buckets-1)))
+      opcode_store[j++] = instructions[i++];
   }
 
-  opcode_map.insert(std::make_pair(desc.match & ((1L<<opcode_bits)-1), desc));
+  assert(j == opcode_store.size()-1);
+  opcode_store[j].match = opcode_store[j].mask = 0;
+  opcode_store[j].rv32 = &illegal_instruction;
+  opcode_store[j].rv64 = &illegal_instruction;
 }
 
 void processor_t::register_extension(extension_t* x)
 {
   for (auto insn : x->get_instructions())
     register_insn(insn);
+  build_opcode_map();
+  for (auto disasm_insn : x->get_disasms())
+    disassembler->add_insn(disasm_insn);
   if (ext != NULL)
     throw std::logic_error("only one extension may be registered");
   ext = x;