ipa-cp: Avoid unwanted multiple propagations (PR 97816)
authorMartin Jambor <mjambor@suse.cz>
Mon, 7 Dec 2020 08:35:09 +0000 (09:35 +0100)
committerMartin Jambor <mjambor@suse.cz>
Mon, 7 Dec 2020 08:35:09 +0000 (09:35 +0100)
When looking at the testcase of PR 97816 I realized that the reason
why we were hitting overflows in size growth estimates in IPA-CP is
not because the chains of how lattices feed values to each other are
so long but mainly because we add estimates in callee lattices to
caller lattices for each value source, which roughly corresponds to a
call graph edge, and therefore if there are multiple calls between two
functions passing the same value in a parameter we end up doing it
more than once, sometimes actually quite many times.

This patch avoids it by using a has_set to remember the source values
we have already updated and not increasing their size again.
Furhtermore, to improve estimation of times we scale the propagated
time benefits with edge frequencies as we accumulate them.

This should make any overflows very unlikely but not impossible, so I
still included checks for overflows but decided to restructure the
code to only need it in the propagate_effects function and modified it
so that it does not need to perform the check before each sum.

This is because I decided to add local estimates to propagated
estimates already in propagate_effects and not at the evaluation time.
The function can then do the sums in a wide type and discard them in
the unlikely case of an overflow.  I also decided to use the
opportunity to make propagated effect stats now include stats from
other values in the same SCCs.  In the dumps I have seen this tended
to increase size cost a tiny bit more than the estimated time benefit
but both increases were small.

Martin

gcc/ChangeLog:

2020-11-20  Martin Jambor  <mjambor@suse.cz>

PR ipa/97816
* ipa-cp.c (safe_add): Removed.
(good_cloning_opportunity_p): Remove special handling of INT_MAX.
(value_topo_info<valtype>::propagate_effects): Take care not to
propagate from size one value to another through more sources.  Scale
propagated times with edge frequencies.  Include local time and size
in propagates ones here.  Take care not to overflow size.
(decide_about_value): Do not add local and propagated effects when
passing them to good_cloning_opportunity_p.

gcc/ipa-cp.c

index a06b4d151dd7d0bcaa7caa7be10ef3d4c252251f..ac9bc239270c3dd0ec85d4884aa5f5f62b4d4733 100644 (file)
@@ -3272,13 +3272,6 @@ good_cloning_opportunity_p (struct cgraph_node *node, sreal time_benefit,
     return false;
 
   gcc_assert (size_cost > 0);
-  if (size_cost == INT_MAX)
-    {
-      if (dump_file && (dump_flags & TDF_DETAILS))
-       fprintf (dump_file, "     good_cloning_opportunity_p returning "
-                "false because of size overflow.\n");
-      return false;
-    }
 
   class ipa_node_params *info = IPA_NODE_REF (node);
   int eval_threshold = opt_for_fn (node->decl, param_ipa_cp_eval_threshold);
@@ -3848,20 +3841,6 @@ propagate_constants_topo (class ipa_topo_info *topo)
     }
 }
 
-
-/* Return the sum of A and B if none of them is bigger than INT_MAX/2, return
-   INT_MAX.  */
-
-static int
-safe_add (int a, int b)
-{
-  if (a > INT_MAX/2 || b > INT_MAX/2)
-    return INT_MAX;
-  else
-    return a + b;
-}
-
-
 /* Propagate the estimated effects of individual values along the topological
    from the dependent values to those they depend on.  */
 
@@ -3870,30 +3849,51 @@ void
 value_topo_info<valtype>::propagate_effects ()
 {
   ipcp_value<valtype> *base;
+  hash_set<ipcp_value<valtype> *> processed_srcvals;
 
   for (base = values_topo; base; base = base->topo_next)
     {
       ipcp_value_source<valtype> *src;
       ipcp_value<valtype> *val;
       sreal time = 0;
-      int size = 0;
+      HOST_WIDE_INT size = 0;
 
       for (val = base; val; val = val->scc_next)
        {
          time = time + val->local_time_benefit + val->prop_time_benefit;
-         size = safe_add (size, safe_add (val->local_size_cost,
-                                          val->prop_size_cost));
+         size = size + val->local_size_cost + val->prop_size_cost;
        }
 
       for (val = base; val; val = val->scc_next)
-       for (src = val->sources; src; src = src->next)
-         if (src->val
-             && src->cs->maybe_hot_p ())
+       {
+         processed_srcvals.empty ();
+         for (src = val->sources; src; src = src->next)
+           if (src->val
+               && src->cs->maybe_hot_p ())
+             {
+               if (!processed_srcvals.add (src->val))
+                 {
+                   HOST_WIDE_INT prop_size = size + src->val->prop_size_cost;
+                   if (prop_size < INT_MAX)
+                     src->val->prop_size_cost = prop_size;
+                   else
+                     continue;
+                 }
+               src->val->prop_time_benefit
+                 += time * src->cs->sreal_frequency ();
+             }
+
+         if (size < INT_MAX)
            {
-             src->val->prop_time_benefit = time + src->val->prop_time_benefit;
-             src->val->prop_size_cost = safe_add (size,
-                                                  src->val->prop_size_cost);
+             val->prop_time_benefit = time;
+             val->prop_size_cost = size;
            }
+         else
+           {
+             val->prop_time_benefit = 0;
+             val->prop_size_cost = 0;
+           }
+       }
     }
 }
 
@@ -5508,12 +5508,8 @@ decide_about_value (struct cgraph_node *node, int index, HOST_WIDE_INT offset,
   if (!good_cloning_opportunity_p (node, val->local_time_benefit,
                                   freq_sum, count_sum,
                                   val->local_size_cost)
-      && !good_cloning_opportunity_p (node,
-                                     val->local_time_benefit
-                                     + val->prop_time_benefit,
-                                     freq_sum, count_sum,
-                                     safe_add (val->local_size_cost,
-                                               val->prop_size_cost)))
+      && !good_cloning_opportunity_p (node, val->prop_time_benefit,
+                                     freq_sum, count_sum, val->prop_size_cost))
     return false;
 
   if (dump_file)