Better heuristic for str.code/re.range (#3220)
authorAndres Noetzli <andres.noetzli@gmail.com>
Fri, 30 Aug 2019 04:15:33 +0000 (21:15 -0700)
committerGitHub <noreply@github.com>
Fri, 30 Aug 2019 04:15:33 +0000 (21:15 -0700)
commitd45b5e1ae2b0d4812e41673bba16de0114070fc1
treeba111f037eaf2164d2903762072dfde434099fd0
parent974fc1d23c2b6091c26cf316964c4c16c5e2733f
Better heuristic for str.code/re.range (#3220)

To make sure that our `str.code` function is injectve (except for -1 in
the codomain), we send the inference that `str.code(x) == -1 v
str.code(x) != str.code(y) v x == y` for each pair of `str.code` terms.
Because of the order of disjuncts, `str.code(x) != str.code(y)` was
usually assigned true. This in turn lead to a difficult problem for the
arithmetic engine if there were more `str.code` applications than the
size of the domain. E.g. if we had `0 <= str.code(xi) < 10` for 0 <= i
<= 10, then the arithmetic engine had a difficult time finding a
conflict. This PR improves the heuristic by setting the phase of
`str.code(x) != str.code(y)` to false, so we prefer to keep the
`str.code` values equal instead of trying to make them different.

This change is also reflected in the models produced for inputs
involving `str.code`: Previously, we were producing models with
different values for the `str.code` whereas now the models are much more
uniform.

The PR adds two regressions, one testing `str.code` performance directly
and one testing it for `str.code` terms generated by `re.range`.

Signed-off-by: Andres Noetzli <anoetzli@amazon.com>
src/theory/strings/inference_manager.cpp
src/theory/strings/theory_strings.cpp
test/regress/CMakeLists.txt
test/regress/regress0/strings/code-perf.smt2 [new file with mode: 0644]
test/regress/regress2/strings/range-perf.smt2 [new file with mode: 0644]