Daily bump.
[gcc.git] / gcc / ira-costs.c
index 46c14ef916140f76662471622d8bd69a57bc0234..122815b80ffe6253d1e176ef6a4c4c954c70c57c 100644 (file)
@@ -28,6 +28,15 @@ along with GCC; see the file COPYING3.  If not see
 #include "expr.h"
 #include "tm_p.h"
 #include "flags.h"
+#include "predict.h"
+#include "vec.h"
+#include "hashtab.h"
+#include "hash-set.h"
+#include "machmode.h"
+#include "input.h"
+#include "function.h"
+#include "dominance.h"
+#include "cfg.h"
 #include "basic-block.h"
 #include "regs.h"
 #include "addresses.h"
@@ -118,7 +127,7 @@ struct cost_classes
   /* Container of the cost classes.  */
   enum reg_class classes[N_REG_CLASSES];
   /* Map reg class -> index of the reg class in the previous array.
-     -1 if it is not a cost classe.  */
+     -1 if it is not a cost class.  */
   int index[N_REG_CLASSES];
   /* Map hard regno index of first class in array CLASSES containing
      the hard regno, -1 otherwise.  */
@@ -167,7 +176,7 @@ cost_classes_hasher::remove (value_type *v)
 }
 
 /* Hash table of unique cost classes.  */
-static hash_table <cost_classes_hasher> cost_classes_htab;
+static hash_table<cost_classes_hasher> *cost_classes_htab;
 
 /* Map allocno class -> cost classes for pseudo of given allocno
    class.  */
@@ -176,6 +185,31 @@ static cost_classes_t cost_classes_aclass_cache[N_REG_CLASSES];
 /* Map mode -> cost classes for pseudo of give mode.  */
 static cost_classes_t cost_classes_mode_cache[MAX_MACHINE_MODE];
 
+/* Cost classes that include all classes in ira_important_classes.  */
+static cost_classes all_cost_classes;
+
+/* Use the array of classes in CLASSES_PTR to fill out the rest of
+   the structure.  */
+static void
+complete_cost_classes (cost_classes_t classes_ptr)
+{
+  for (int i = 0; i < N_REG_CLASSES; i++)
+    classes_ptr->index[i] = -1;
+  for (int i = 0; i < FIRST_PSEUDO_REGISTER; i++)
+    classes_ptr->hard_regno_index[i] = -1;
+  for (int i = 0; i < classes_ptr->num; i++)
+    {
+      enum reg_class cl = classes_ptr->classes[i];
+      classes_ptr->index[cl] = i;
+      for (int j = ira_class_hard_regs_num[cl] - 1; j >= 0; j--)
+       {
+         unsigned int hard_regno = ira_class_hard_regs[cl][j];
+         if (classes_ptr->hard_regno_index[hard_regno] < 0)
+           classes_ptr->hard_regno_index[hard_regno] = i;
+       }
+    }
+}
+
 /* Initialize info about the cost classes for each pseudo.  */
 static void
 initiate_regno_cost_classes (void)
@@ -188,7 +222,11 @@ initiate_regno_cost_classes (void)
          sizeof (cost_classes_t) * N_REG_CLASSES);
   memset (cost_classes_mode_cache, 0,
          sizeof (cost_classes_t) * MAX_MACHINE_MODE);
-  cost_classes_htab.create (200);
+  cost_classes_htab = new hash_table<cost_classes_hasher> (200);
+  all_cost_classes.num = ira_important_classes_num;
+  for (int i = 0; i < ira_important_classes_num; i++)
+    all_cost_classes.classes[i] = ira_important_classes[i];
+  complete_cost_classes (&all_cost_classes);
 }
 
 /* Create new cost classes from cost classes FROM and set up members
@@ -200,27 +238,105 @@ static cost_classes_t
 setup_cost_classes (cost_classes_t from)
 {
   cost_classes_t classes_ptr;
-  enum reg_class cl;
-  int i, j, hard_regno;
 
   classes_ptr = (cost_classes_t) ira_allocate (sizeof (struct cost_classes));
   classes_ptr->num = from->num;
-  for (i = 0; i < N_REG_CLASSES; i++)
-    classes_ptr->index[i] = -1;
-  for (i = 0; i < FIRST_PSEUDO_REGISTER; i++)
-    classes_ptr->hard_regno_index[i] = -1;
-  for (i = 0; i < from->num; i++)
+  for (int i = 0; i < from->num; i++)
+    classes_ptr->classes[i] = from->classes[i];
+  complete_cost_classes (classes_ptr);
+  return classes_ptr;
+}
+
+/* Return a version of FULL that only considers registers in REGS that are
+   valid for mode MODE.  Both FULL and the returned class are globally
+   allocated.  */
+static cost_classes_t
+restrict_cost_classes (cost_classes_t full, machine_mode mode,
+                      const HARD_REG_SET &regs)
+{
+  static struct cost_classes narrow;
+  int map[N_REG_CLASSES];
+  narrow.num = 0;
+  for (int i = 0; i < full->num; i++)
     {
-      cl = classes_ptr->classes[i] = from->classes[i];
-      classes_ptr->index[cl] = i;
-      for (j = ira_class_hard_regs_num[cl] - 1; j >= 0; j--)
+      /* Assume that we'll drop the class.  */
+      map[i] = -1;
+
+      /* Ignore classes that are too small for the mode.  */
+      enum reg_class cl = full->classes[i];
+      if (!contains_reg_of_mode[cl][mode])
+       continue;
+
+      /* Calculate the set of registers in CL that belong to REGS and
+        are valid for MODE.  */
+      HARD_REG_SET valid_for_cl;
+      COPY_HARD_REG_SET (valid_for_cl, reg_class_contents[cl]);
+      AND_HARD_REG_SET (valid_for_cl, regs);
+      AND_COMPL_HARD_REG_SET (valid_for_cl,
+                             ira_prohibited_class_mode_regs[cl][mode]);
+      AND_COMPL_HARD_REG_SET (valid_for_cl, ira_no_alloc_regs);
+      if (hard_reg_set_empty_p (valid_for_cl))
+       continue;
+
+      /* Don't use this class if the set of valid registers is a subset
+        of an existing class.  For example, suppose we have two classes
+        GR_REGS and FR_REGS and a union class GR_AND_FR_REGS.  Suppose
+        that the mode changes allowed by FR_REGS are not as general as
+        the mode changes allowed by GR_REGS.
+
+        In this situation, the mode changes for GR_AND_FR_REGS could
+        either be seen as the union or the intersection of the mode
+        changes allowed by the two subclasses.  The justification for
+        the union-based definition would be that, if you want a mode
+        change that's only allowed by GR_REGS, you can pick a register
+        from the GR_REGS subclass.  The justification for the
+        intersection-based definition would be that every register
+        from the class would allow the mode change.
+
+        However, if we have a register that needs to be in GR_REGS,
+        using GR_AND_FR_REGS with the intersection-based definition
+        would be too pessimistic, since it would bring in restrictions
+        that only apply to FR_REGS.  Conversely, if we have a register
+        that needs to be in FR_REGS, using GR_AND_FR_REGS with the
+        union-based definition would lose the extra restrictions
+        placed on FR_REGS.  GR_AND_FR_REGS is therefore only useful
+        for cases where GR_REGS and FP_REGS are both valid.  */
+      int pos;
+      for (pos = 0; pos < narrow.num; ++pos)
        {
-         hard_regno = ira_class_hard_regs[cl][j];
-         if (classes_ptr->hard_regno_index[hard_regno] < 0)
-           classes_ptr->hard_regno_index[hard_regno] = i;
+         enum reg_class cl2 = narrow.classes[pos];
+         if (hard_reg_set_subset_p (valid_for_cl, reg_class_contents[cl2]))
+           break;
+       }
+      map[i] = pos;
+      if (pos == narrow.num)
+       {
+         /* If several classes are equivalent, prefer to use the one
+            that was chosen as the allocno class.  */
+         enum reg_class cl2 = ira_allocno_class_translate[cl];
+         if (ira_class_hard_regs_num[cl] == ira_class_hard_regs_num[cl2])
+           cl = cl2;
+         narrow.classes[narrow.num++] = cl;
        }
     }
-  return classes_ptr;
+  if (narrow.num == full->num)
+    return full;
+
+  cost_classes **slot = cost_classes_htab->find_slot (&narrow, INSERT);
+  if (*slot == NULL)
+    {
+      cost_classes_t classes = setup_cost_classes (&narrow);
+      /* Map equivalent classes to the representative that we chose above.  */
+      for (int i = 0; i < ira_important_classes_num; i++)
+       {
+         enum reg_class cl = ira_important_classes[i];
+         int index = full->index[cl];
+         if (index >= 0)
+           classes->index[cl] = map[index];
+       }
+      *slot = classes;
+    }
+  return *slot;
 }
 
 /* Setup cost classes for pseudo REGNO whose allocno class is ACLASS.
@@ -262,7 +378,7 @@ setup_regno_cost_classes_by_aclass (int regno, enum reg_class aclass)
            }
          classes.classes[classes.num++] = cl;
        }
-      slot = cost_classes_htab.find_slot (&classes, INSERT);
+      slot = cost_classes_htab->find_slot (&classes, INSERT);
       if (*slot == NULL)
        {
          classes_ptr = setup_cost_classes (&classes);
@@ -270,6 +386,19 @@ setup_regno_cost_classes_by_aclass (int regno, enum reg_class aclass)
        }
       classes_ptr = cost_classes_aclass_cache[aclass] = (cost_classes_t) *slot;
     }
+  if (regno_reg_rtx[regno] != NULL_RTX)
+    {
+      /* Restrict the classes to those that are valid for REGNO's mode
+        (which might for example exclude singleton classes if the mode
+        requires two registers).  Also restrict the classes to those that
+        are valid for subregs of REGNO.  */
+      const HARD_REG_SET *valid_regs = valid_mode_changes_for_regno (regno);
+      if (!valid_regs)
+       valid_regs = &reg_class_contents[ALL_REGS];
+      classes_ptr = restrict_cost_classes (classes_ptr,
+                                          PSEUDO_REGNO_MODE (regno),
+                                          *valid_regs);
+    }
   regno_cost_classes[regno] = classes_ptr;
 }
 
@@ -277,49 +406,31 @@ setup_regno_cost_classes_by_aclass (int regno, enum reg_class aclass)
    decrease number of cost classes for the pseudo, if hard registers
    of some important classes can not hold a value of MODE.  So the
    pseudo can not get hard register of some important classes and cost
-   calculation for such important classes is only waisting CPU
+   calculation for such important classes is only wasting CPU
    time.  */
 static void
-setup_regno_cost_classes_by_mode (int regno, enum machine_mode mode)
+setup_regno_cost_classes_by_mode (int regno, machine_mode mode)
 {
-  static struct cost_classes classes;
-  cost_classes_t classes_ptr;
-  enum reg_class cl;
-  int i;
-  cost_classes **slot;
-  HARD_REG_SET temp;
-
-  if ((classes_ptr = cost_classes_mode_cache[mode]) == NULL)
+  if (const HARD_REG_SET *valid_regs = valid_mode_changes_for_regno (regno))
+    regno_cost_classes[regno] = restrict_cost_classes (&all_cost_classes,
+                                                      mode, *valid_regs);
+  else
     {
-      classes.num = 0;
-      for (i = 0; i < ira_important_classes_num; i++)
-       {
-         cl = ira_important_classes[i];
-         COPY_HARD_REG_SET (temp, ira_prohibited_class_mode_regs[cl][mode]);
-         IOR_HARD_REG_SET (temp, ira_no_alloc_regs);
-         if (hard_reg_set_subset_p (reg_class_contents[cl], temp))
-           continue;
-         classes.classes[classes.num++] = cl;
-       }
-      slot = cost_classes_htab.find_slot (&classes, INSERT);
-      if (*slot == NULL)
-       {
-         classes_ptr = setup_cost_classes (&classes);
-         *slot = classes_ptr;
-       }
-      else
-       classes_ptr = (cost_classes_t) *slot;
-      cost_classes_mode_cache[mode] = (cost_classes_t) *slot;
+      if (cost_classes_mode_cache[mode] == NULL)
+       cost_classes_mode_cache[mode]
+         = restrict_cost_classes (&all_cost_classes, mode,
+                                  reg_class_contents[ALL_REGS]);
+      regno_cost_classes[regno] = cost_classes_mode_cache[mode];
     }
-  regno_cost_classes[regno] = classes_ptr;
 }
 
-/* Finilize info about the cost classes for each pseudo.  */
+/* Finalize info about the cost classes for each pseudo.  */
 static void
 finish_regno_cost_classes (void)
 {
   ira_free (regno_cost_classes);
-  cost_classes_htab.dispose ();
+  delete cost_classes_htab;
+  cost_classes_htab = NULL;
 }
 
 \f
@@ -328,7 +439,7 @@ finish_regno_cost_classes (void)
    TO_P is FALSE) a register of class RCLASS in mode MODE.  X must not
    be a pseudo register.  */
 static int
-copy_cost (rtx x, enum machine_mode mode, reg_class_t rclass, bool to_p,
+copy_cost (rtx x, machine_mode mode, reg_class_t rclass, bool to_p,
           secondary_reload_info *prev_sri)
 {
   secondary_reload_info sri;
@@ -401,8 +512,8 @@ copy_cost (rtx x, enum machine_mode mode, reg_class_t rclass, bool to_p,
    the alternatives.  */
 static void
 record_reg_classes (int n_alts, int n_ops, rtx *ops,
-                   enum machine_mode *modes, const char **constraints,
-                   rtx insn, enum reg_class *pref)
+                   machine_mode *modes, const char **constraints,
+                   rtx_insn *insn, enum reg_class *pref)
 {
   int alt;
   int i, j, k;
@@ -415,6 +526,7 @@ record_reg_classes (int n_alts, int n_ops, rtx *ops,
 
   /* Process each alternative, each time minimizing an operand's cost
      with the cost for each operand in that alternative.  */
+  alternative_mask preferred = get_preferred_alternatives (insn);
   for (alt = 0; alt < n_alts; alt++)
     {
       enum reg_class classes[MAX_RECOG_OPERANDS];
@@ -423,7 +535,7 @@ record_reg_classes (int n_alts, int n_ops, rtx *ops,
       int alt_fail = 0;
       int alt_cost = 0, op_cost_add;
 
-      if (!TEST_BIT (recog_data.enabled_alternatives, alt))
+      if (!TEST_BIT (preferred, alt))
        {
          for (i = 0; i < recog_data.n_operands; i++)
            constraints[i] = skip_alternative (constraints[i]);
@@ -436,7 +548,7 @@ record_reg_classes (int n_alts, int n_ops, rtx *ops,
          unsigned char c;
          const char *p = constraints[i];
          rtx op = ops[i];
-         enum machine_mode mode = modes[i];
+         machine_mode mode = modes[i];
          int allows_addr = 0;
          int win = 0;
 
@@ -645,8 +757,6 @@ record_reg_classes (int n_alts, int n_ops, rtx *ops,
            {
              switch (c)
                {
-               case ',':
-                 break;
                case '*':
                  /* Ignore the next letter for this pass.  */
                  c = *++p;
@@ -654,92 +764,6 @@ record_reg_classes (int n_alts, int n_ops, rtx *ops,
 
                case '?':
                  alt_cost += 2;
-               case '!':  case '#':  case '&':
-               case '0':  case '1':  case '2':  case '3':  case '4':
-               case '5':  case '6':  case '7':  case '8':  case '9':
-                 break;
-
-               case 'p':
-                 allows_addr = 1;
-                 win = address_operand (op, GET_MODE (op));
-                 /* We know this operand is an address, so we want it
-                    to be allocated to a register that can be the
-                    base of an address, i.e. BASE_REG_CLASS.  */
-                 classes[i]
-                   = ira_reg_class_subunion[classes[i]]
-                     [base_reg_class (VOIDmode, ADDR_SPACE_GENERIC,
-                                      ADDRESS, SCRATCH)];
-                 break;
-
-               case 'm':  case 'o':  case 'V':
-                 /* It doesn't seem worth distinguishing between
-                    offsettable and non-offsettable addresses
-                    here.  */
-                 insn_allows_mem[i] = allows_mem[i] = 1;
-                 if (MEM_P (op))
-                   win = 1;
-                 break;
-
-               case '<':
-                 if (MEM_P (op)
-                     && (GET_CODE (XEXP (op, 0)) == PRE_DEC
-                         || GET_CODE (XEXP (op, 0)) == POST_DEC))
-                   win = 1;
-                 break;
-
-               case '>':
-                 if (MEM_P (op)
-                     && (GET_CODE (XEXP (op, 0)) == PRE_INC
-                         || GET_CODE (XEXP (op, 0)) == POST_INC))
-                   win = 1;
-                 break;
-
-               case 'E':
-               case 'F':
-                 if (CONST_DOUBLE_AS_FLOAT_P (op) 
-                     || (GET_CODE (op) == CONST_VECTOR
-                         && (GET_MODE_CLASS (GET_MODE (op))
-                             == MODE_VECTOR_FLOAT)))
-                   win = 1;
-                 break;
-
-               case 'G':
-               case 'H':
-                 if (CONST_DOUBLE_AS_FLOAT_P (op) 
-                     && CONST_DOUBLE_OK_FOR_CONSTRAINT_P (op, c, p))
-                   win = 1;
-                 break;
-
-               case 's':
-                 if (CONST_SCALAR_INT_P (op)) 
-                   break;
-
-               case 'i':
-                 if (CONSTANT_P (op)
-                     && (! flag_pic || LEGITIMATE_PIC_OPERAND_P (op)))
-                   win = 1;
-                 break;
-
-               case 'n':
-                 if (CONST_SCALAR_INT_P (op)) 
-                   win = 1;
-                 break;
-
-               case 'I':
-               case 'J':
-               case 'K':
-               case 'L':
-               case 'M':
-               case 'N':
-               case 'O':
-               case 'P':
-                 if (CONST_INT_P (op)
-                     && CONST_OK_FOR_CONSTRAINT_P (INTVAL (op), c, p))
-                   win = 1;
-                 break;
-
-               case 'X':
-                 win = 1;
                  break;
 
                case 'g':
@@ -748,30 +772,38 @@ record_reg_classes (int n_alts, int n_ops, rtx *ops,
                          && (! flag_pic || LEGITIMATE_PIC_OPERAND_P (op))))
                    win = 1;
                  insn_allows_mem[i] = allows_mem[i] = 1;
-               case 'r':
                  classes[i] = ira_reg_class_subunion[classes[i]][GENERAL_REGS];
                  break;
 
                default:
-                 if (REG_CLASS_FROM_CONSTRAINT (c, p) != NO_REGS)
-                   classes[i] = ira_reg_class_subunion[classes[i]]
-                                [REG_CLASS_FROM_CONSTRAINT (c, p)];
-#ifdef EXTRA_CONSTRAINT_STR
-                 else if (EXTRA_CONSTRAINT_STR (op, c, p))
-                   win = 1;
-
-                 if (EXTRA_MEMORY_CONSTRAINT (c, p))
+                 enum constraint_num cn = lookup_constraint (p);
+                 enum reg_class cl;
+                 switch (get_constraint_type (cn))
                    {
+                   case CT_REGISTER:
+                     cl = reg_class_for_constraint (cn);
+                     if (cl != NO_REGS)
+                       classes[i] = ira_reg_class_subunion[classes[i]][cl];
+                     break;
+
+                   case CT_CONST_INT:
+                     if (CONST_INT_P (op)
+                         && insn_const_int_ok_for_constraint (INTVAL (op), cn))
+                       win = 1;
+                     break;
+
+                   case CT_MEMORY:
                      /* Every MEM can be reloaded to fit.  */
                      insn_allows_mem[i] = allows_mem[i] = 1;
                      if (MEM_P (op))
                        win = 1;
-                   }
-                 if (EXTRA_ADDRESS_CONSTRAINT (c, p))
-                   {
+                     break;
+
+                   case CT_ADDRESS:
                      /* Every address can be reloaded to fit.  */
                      allows_addr = 1;
-                     if (address_operand (op, GET_MODE (op)))
+                     if (address_operand (op, GET_MODE (op))
+                         || constraint_satisfied_p (op, cn))
                        win = 1;
                      /* We know this operand is an address, so we
                         want it to be allocated to a hard register
@@ -781,8 +813,13 @@ record_reg_classes (int n_alts, int n_ops, rtx *ops,
                        = ira_reg_class_subunion[classes[i]]
                          [base_reg_class (VOIDmode, ADDR_SPACE_GENERIC,
                                           ADDRESS, SCRATCH)];
+                     break;
+
+                   case CT_FIXED_FORM:
+                     if (constraint_satisfied_p (op, cn))
+                       win = 1;
+                     break;
                    }
-#endif
                  break;
                }
              p += CONSTRAINT_LEN (c, p);
@@ -1027,7 +1064,7 @@ ok_for_index_p_nonstrict (rtx reg)
    pseudo-registers should count as OK.  Arguments as for
    regno_ok_for_base_p.  */
 static inline bool
-ok_for_base_p_nonstrict (rtx reg, enum machine_mode mode, addr_space_t as,
+ok_for_base_p_nonstrict (rtx reg, machine_mode mode, addr_space_t as,
                         enum rtx_code outer_code, enum rtx_code index_code)
 {
   unsigned regno = REGNO (reg);
@@ -1050,7 +1087,7 @@ ok_for_base_p_nonstrict (rtx reg, enum machine_mode mode, addr_space_t as,
    SCALE is twice the amount to multiply the cost by (it is twice so
    we can represent half-cost adjustments).  */
 static void
-record_address_regs (enum machine_mode mode, addr_space_t as, rtx x,
+record_address_regs (machine_mode mode, addr_space_t as, rtx x,
                     int context, enum rtx_code outer_code,
                     enum rtx_code index_code, int scale)
 {
@@ -1242,10 +1279,10 @@ record_address_regs (enum machine_mode mode, addr_space_t as, rtx x,
 
 /* Calculate the costs of insn operands.  */
 static void
-record_operand_costs (rtx insn, enum reg_class *pref)
+record_operand_costs (rtx_insn *insn, enum reg_class *pref)
 {
   const char *constraints[MAX_RECOG_OPERANDS];
-  enum machine_mode modes[MAX_RECOG_OPERANDS];
+  machine_mode modes[MAX_RECOG_OPERANDS];
   rtx ops[MAX_RECOG_OPERANDS];
   rtx set;
   int i;
@@ -1275,8 +1312,8 @@ record_operand_costs (rtx insn, enum reg_class *pref)
                             XEXP (recog_data.operand[i], 0),
                             0, MEM, SCRATCH, frequency * 2);
       else if (constraints[i][0] == 'p'
-              || EXTRA_ADDRESS_CONSTRAINT (constraints[i][0],
-                                           constraints[i]))
+              || (insn_extra_address_constraint
+                  (lookup_constraint (constraints[i]))))
        record_address_regs (VOIDmode, ADDR_SPACE_GENERIC,
                             recog_data.operand[i], 0, ADDRESS, SCRATCH,
                             frequency * 2);
@@ -1312,7 +1349,7 @@ record_operand_costs (rtx insn, enum reg_class *pref)
      then we may want to adjust the cost of that register class to -1.
 
      Avoid the adjustment if the source does not die to avoid
-     stressing of register allocator by preferrencing two colliding
+     stressing of register allocator by preferencing two colliding
      registers into single class.
 
      Also avoid the adjustment if a copy between hard registers of the
@@ -1347,7 +1384,7 @@ record_operand_costs (rtx insn, enum reg_class *pref)
              || ((regno = REGNO (dest)) >= FIRST_PSEUDO_REGISTER
                  && (other_regno = REGNO (src)) < FIRST_PSEUDO_REGISTER)))
        {
-         enum machine_mode mode = GET_MODE (src);
+         machine_mode mode = GET_MODE (src);
          cost_classes_t cost_classes_ptr = regno_cost_classes[regno];
          enum reg_class *cost_classes = cost_classes_ptr->classes;
          reg_class_t rclass;
@@ -1386,8 +1423,8 @@ record_operand_costs (rtx insn, enum reg_class *pref)
 /* Process one insn INSN.  Scan it and record each time it would save
    code to put a certain allocnos in a certain class.  Return the last
    insn processed, so that the scan can be continued from there.  */
-static rtx
-scan_one_insn (rtx insn)
+static rtx_insn *
+scan_one_insn (rtx_insn *insn)
 {
   enum rtx_code pat_code;
   rtx set, note;
@@ -1511,18 +1548,11 @@ print_allocno_costs (FILE *f)
       for (k = 0; k < cost_classes_ptr->num; k++)
        {
          rclass = cost_classes[k];
-         if (contains_reg_of_mode[rclass][PSEUDO_REGNO_MODE (regno)]
-#ifdef CANNOT_CHANGE_MODE_CLASS
-             && ! invalid_mode_change_p (regno, (enum reg_class) rclass)
-#endif
-             )
-           {
-             fprintf (f, " %s:%d", reg_class_names[rclass],
-                      COSTS (costs, i)->cost[k]);
-             if (flag_ira_region == IRA_REGION_ALL
-                 || flag_ira_region == IRA_REGION_MIXED)
-               fprintf (f, ",%d", COSTS (total_allocno_costs, i)->cost[k]);
-           }
+         fprintf (f, " %s:%d", reg_class_names[rclass],
+                  COSTS (costs, i)->cost[k]);
+         if (flag_ira_region == IRA_REGION_ALL
+             || flag_ira_region == IRA_REGION_MIXED)
+           fprintf (f, ",%d", COSTS (total_allocno_costs, i)->cost[k]);
        }
       fprintf (f, " MEM:%i", COSTS (costs, i)->mem_cost);
       if (flag_ira_region == IRA_REGION_ALL
@@ -1553,13 +1583,8 @@ print_pseudo_costs (FILE *f)
       for (k = 0; k < cost_classes_ptr->num; k++)
        {
          rclass = cost_classes[k];
-         if (contains_reg_of_mode[rclass][PSEUDO_REGNO_MODE (regno)]
-#ifdef CANNOT_CHANGE_MODE_CLASS
-             && ! invalid_mode_change_p (regno, (enum reg_class) rclass)
-#endif
-             )
-           fprintf (f, " %s:%d", reg_class_names[rclass],
-                    COSTS (costs, regno)->cost[k]);
+         fprintf (f, " %s:%d", reg_class_names[rclass],
+                  COSTS (costs, regno)->cost[k]);
        }
       fprintf (f, " MEM:%i\n", COSTS (costs, regno)->mem_cost);
     }
@@ -1570,7 +1595,7 @@ print_pseudo_costs (FILE *f)
 static void
 process_bb_for_costs (basic_block bb)
 {
-  rtx insn;
+  rtx_insn *insn;
 
   frequency = REG_FREQ_FROM_BB (bb);
   if (frequency == 0)
@@ -1796,14 +1821,6 @@ find_costs_and_classes (FILE *dump_file)
          for (k = 0; k < cost_classes_ptr->num; k++)
            {
              rclass = cost_classes[k];
-             /* Ignore classes that are too small or invalid for this
-                operand.  */
-             if (! contains_reg_of_mode[rclass][PSEUDO_REGNO_MODE (i)]
-#ifdef CANNOT_CHANGE_MODE_CLASS
-                 || invalid_mode_change_p (i, (enum reg_class) rclass)
-#endif
-                 )
-               continue;
              if (i_costs[k] < best_cost)
                {
                  best_cost = i_costs[k];
@@ -1827,6 +1844,20 @@ find_costs_and_classes (FILE *dump_file)
          alt_class = ira_allocno_class_translate[alt_class];
          if (best_cost > i_mem_cost)
            regno_aclass[i] = NO_REGS;
+         else if (!optimize && !targetm.class_likely_spilled_p (best))
+           /* Registers in the alternative class are likely to need
+              longer or slower sequences than registers in the best class.
+              When optimizing we make some effort to use the best class
+              over the alternative class where possible, but at -O0 we
+              effectively give the alternative class equal weight.
+              We then run the risk of using slower alternative registers
+              when plenty of registers from the best class are still free.
+              This is especially true because live ranges tend to be very
+              short in -O0 code and so register pressure tends to be low.
+
+              Avoid that by ignoring the alternative class if the best
+              class has plenty of registers.  */
+           regno_aclass[i] = best;
          else
            {
              /* Make the common class the biggest class of best and
@@ -1879,15 +1910,7 @@ find_costs_and_classes (FILE *dump_file)
                      rclass = cost_classes[k];
                      if (! ira_class_subset_p[rclass][aclass])
                        continue;
-                     /* Ignore classes that are too small or invalid
-                        for this operand.  */
-                     if (! contains_reg_of_mode[rclass][PSEUDO_REGNO_MODE (i)]
-#ifdef CANNOT_CHANGE_MODE_CLASS
-                         || invalid_mode_change_p (i, (enum reg_class) rclass)
-#endif
-                         )
-                       ;
-                     else if (total_a_costs[k] < best_cost)
+                     if (total_a_costs[k] < best_cost)
                        {
                          best_cost = total_a_costs[k];
                          allocno_cost = a_costs[k];
@@ -1963,7 +1986,8 @@ process_bb_node_for_hard_reg_moves (ira_loop_tree_node_t loop_tree_node)
   ira_loop_tree_node_t curr_loop_tree_node;
   enum reg_class rclass;
   basic_block bb;
-  rtx insn, set, src, dst;
+  rtx_insn *insn;
+  rtx set, src, dst;
 
   bb = loop_tree_node->bb;
   if (bb == NULL)
@@ -2015,7 +2039,7 @@ process_bb_node_for_hard_reg_moves (ira_loop_tree_node_t loop_tree_node)
       {
        int cost;
        enum reg_class hard_reg_class;
-       enum machine_mode mode;
+       machine_mode mode;
        
        mode = ALLOCNO_MODE (a);
        hard_reg_class = REGNO_REG_CLASS (hard_regno);
@@ -2106,21 +2130,21 @@ ira_init_costs_once (void)
 }
 
 /* Free allocated temporary cost vectors.  */
-static void
-free_ira_costs (void)
+void
+target_ira_int::free_ira_costs ()
 {
   int i;
 
-  free (init_cost);
-  init_cost = NULL;
+  free (x_init_cost);
+  x_init_cost = NULL;
   for (i = 0; i < MAX_RECOG_OPERANDS; i++)
     {
-      free (op_costs[i]);
-      free (this_op_costs[i]);
-      op_costs[i] = this_op_costs[i] = NULL;
+      free (x_op_costs[i]);
+      free (x_this_op_costs[i]);
+      x_op_costs[i] = x_this_op_costs[i] = NULL;
     }
-  free (temp_costs);
-  temp_costs = NULL;
+  free (x_temp_costs);
+  x_temp_costs = NULL;
 }
 
 /* This is called each time register related information is
@@ -2130,7 +2154,7 @@ ira_init_costs (void)
 {
   int i;
 
-  free_ira_costs ();
+  this_target_ira_int->free_ira_costs ();
   max_struct_costs_size
     = sizeof (struct costs) + sizeof (int) * (ira_important_classes_num - 1);
   /* Don't use ira_allocate because vectors live through several IRA
@@ -2147,13 +2171,6 @@ ira_init_costs (void)
   temp_costs = (struct costs *) xmalloc (max_struct_costs_size);
 }
 
-/* Function called once at the end of compiler work.  */
-void
-ira_finish_costs_once (void)
-{
-  free_ira_costs ();
-}
-
 \f
 
 /* Common initialization function for ira_costs and
@@ -2232,12 +2249,13 @@ ira_tune_allocno_costs (void)
   int j, n, regno;
   int cost, min_cost, *reg_costs;
   enum reg_class aclass, rclass;
-  enum machine_mode mode;
+  machine_mode mode;
   ira_allocno_t a;
   ira_allocno_iterator ai;
   ira_allocno_object_iterator oi;
   ira_object_t obj;
   bool skip_p;
+  HARD_REG_SET *crossed_calls_clobber_regs;
 
   FOR_EACH_ALLOCNO (a, ai)
     {
@@ -2272,8 +2290,13 @@ ira_tune_allocno_costs (void)
                continue;
              rclass = REGNO_REG_CLASS (regno);
              cost = 0;
-             if (ira_hard_reg_set_intersection_p (regno, mode, call_used_reg_set)
-                 || HARD_REGNO_CALL_PART_CLOBBERED (regno, mode))
+             crossed_calls_clobber_regs
+               = &(ALLOCNO_CROSSED_CALLS_CLOBBERED_REGS (a));
+             if (ira_hard_reg_set_intersection_p (regno, mode,
+                                                  *crossed_calls_clobber_regs)
+                 && (ira_hard_reg_set_intersection_p (regno, mode,
+                                                      call_used_reg_set)
+                     || HARD_REGNO_CALL_PART_CLOBBERED (regno, mode)))
                cost += (ALLOCNO_CALL_FREQ (a)
                         * (ira_memory_move_cost[mode][rclass][0]
                            + ira_memory_move_cost[mode][rclass][1]));