fold undefined pointer offsetting
authorRichard Biener <rguenther@suse.de>
Wed, 11 Mar 2020 14:34:47 +0000 (15:34 +0100)
committerRichard Biener <rguenther@suse.de>
Wed, 11 Mar 2020 14:35:51 +0000 (15:35 +0100)
This avoids breaking the old broken pointer offsetting via
(T)(ptr - ((T)0)->x) which should have used offsetof.  Breakage
was exposed by the introduction of POINTER_DIFF_EXPR and making
PTA not considering that producing a pointer.  The mitigation
for simple cases is to canonicalize

  _2 = _1 - 8B;
  o_9 = (struct obj *) _2;

to

  o_9 = &MEM[_1 + -8B];

eliding one statement and the offending pointer subtraction.

2020-03-11  Richard Biener  <rguenther@suse.de>

* match.pd ((T *)(ptr - ptr-cst) -> &MEM[ptr + -ptr-cst]):
New pattern.

* gcc.dg/torture/20200311-1.c: New testcase.

gcc/ChangeLog
gcc/match.pd
gcc/testsuite/ChangeLog
gcc/testsuite/gcc.dg/torture/20200311-1.c [new file with mode: 0644]

index 0a79692a53f822b09923da7dafc5f8351252d7b1..73339dc2c2cffa9e40ff8ed64b71b2decd9d13e0 100644 (file)
@@ -1,3 +1,8 @@
+2020-03-11  Richard Biener  <rguenther@suse.de>
+
+       * match.pd ((T *)(ptr - ptr-cst) -> &MEM[ptr + -ptr-cst]):
+       New pattern.
+
 2020-03-11  Eric Botcazou  <ebotcazou@adacore.com>
 
        PR middle-end/93961
index 19df0c404a47242b6b5af332fc4d6528722f0fe8..9cb37740f1e3427a0bca0bb1a037947c5fd1cbf7 100644 (file)
@@ -1864,6 +1864,15 @@ DEFINE_INT_AND_FLOAT_ROUND_FN (RINT)
    (if (ptr_difference_const (@0, @1, &diff))
     { build_int_cst_type (type, diff); }))))
 
+/* Canonicalize (T *)(ptr - ptr-cst) to &MEM[ptr + -ptr-cst].  */
+(simplify
+ (convert (pointer_diff @0 INTEGER_CST@1))
+ (if (POINTER_TYPE_P (type))
+  { build_fold_addr_expr_with_type
+      (build2 (MEM_REF, char_type_node, @0,
+              wide_int_to_tree (ptr_type_node, wi::neg (wi::to_wide (@1)))),
+              type); }))
+
 /* If arg0 is derived from the address of an object or function, we may
    be able to fold this expression using the object or function's
    alignment.  */
index 0e8d77ab9ddf01545ddf1fc9cfdb66b5bd9df43a..11061adaf18ab74da41cb95230c835520aad8905 100644 (file)
@@ -1,3 +1,7 @@
+2020-03-11  Richard Biener  <rguenther@suse.de>
+
+       * gcc.dg/torture/20200311-1.c: New testcase.
+
 2020-03-11  Matthew Malcomson  <matthew.malcomson@arm.com>
 
        * lib/scanasm.exp (parse_function_bodies): Lines starting with '@' also
diff --git a/gcc/testsuite/gcc.dg/torture/20200311-1.c b/gcc/testsuite/gcc.dg/torture/20200311-1.c
new file mode 100644 (file)
index 0000000..ac82b6b
--- /dev/null
@@ -0,0 +1,26 @@
+/* { dg-do run } */
+
+struct list { struct list *n; };
+
+struct obj {
+    int n;
+    struct list l;
+} _o;
+
+struct list _l = { .n = &_o.l };
+
+int main(int argc, char *argv[])
+{
+  struct obj *o = &_o;
+  _o.l.n = &_l;
+  while (&o->l != &_l)
+    /* Note the following is invoking undefined behavior but in
+       this kind of "obvious" cases we don't want to break things
+       unnecessarily and thus we avoid analyzing o as pointing
+       to nothing via the undefined pointer subtraction.  Instead
+       we canonicalize the pointer subtraction followed by the
+       pointer conversion to pointer offsetting.  */
+    o = ((struct obj *)((const char *)(o->l.n)
+                       - (const char *)&((struct obj *)0)->l));
+  return 0;
+}