and isl_pw_aff_tdiv_q and isl_pw_aff_tdiv_r
[platform/upstream/isl.git] / isl_aff.c
index 85e4953..675801f 100644 (file)
--- a/isl_aff.c
+++ b/isl_aff.c
@@ -3,7 +3,7 @@
  * Copyright 2011      Sven Verdoolaege
  * Copyright 2012      Ecole Normale Superieure
  *
- * Use of this software is governed by the GNU LGPLv2.1 license
+ * Use of this software is governed by the MIT license
  *
  * Written by Sven Verdoolaege, INRIA Saclay - Ile-de-France,
  * Parc Club Orsay Universite, ZAC des vignes, 4 rue Jacques Monod,
@@ -648,6 +648,182 @@ __isl_give isl_aff *isl_aff_remove_unused_divs( __isl_take isl_aff *aff)
        return aff;
 }
 
+/* Given two affine expressions "p" of length p_len (including the
+ * denominator and the constant term) and "subs" of length subs_len,
+ * plug in "subs" for the variable at position "pos".
+ * The variables of "subs" and "p" are assumed to match up to subs_len,
+ * but "p" may have additional variables.
+ * "v" is an initialized isl_int that can be used internally.
+ *
+ * In particular, if "p" represents the expression
+ *
+ *     (a i + g)/m
+ *
+ * with i the variable at position "pos" and "subs" represents the expression
+ *
+ *     f/d
+ *
+ * then the result represents the expression
+ *
+ *     (a f + d g)/(m d)
+ *
+ */
+void isl_seq_substitute(isl_int *p, int pos, isl_int *subs,
+       int p_len, int subs_len, isl_int v)
+{
+       isl_int_set(v, p[1 + pos]);
+       isl_int_set_si(p[1 + pos], 0);
+       isl_seq_combine(p + 1, subs[0], p + 1, v, subs + 1, subs_len - 1);
+       isl_seq_scale(p + subs_len, p + subs_len, subs[0], p_len - subs_len);
+       isl_int_mul(p[0], p[0], subs[0]);
+}
+
+/* Look for any divs in the aff->ls with a denominator equal to one
+ * and plug them into the affine expression and any subsequent divs
+ * that may reference the div.
+ */
+static __isl_give isl_aff *plug_in_integral_divs(__isl_take isl_aff *aff)
+{
+       int i, n;
+       int len;
+       isl_int v;
+       isl_vec *vec;
+       isl_local_space *ls;
+       unsigned pos;
+
+       if (!aff)
+               return NULL;
+
+       n = isl_local_space_dim(aff->ls, isl_dim_div);
+       len = aff->v->size;
+       for (i = 0; i < n; ++i) {
+               if (!isl_int_is_one(aff->ls->div->row[i][0]))
+                       continue;
+               ls = isl_local_space_copy(aff->ls);
+               ls = isl_local_space_substitute_seq(ls, isl_dim_div, i,
+                                           aff->ls->div->row[i], len, i + 1);
+               vec = isl_vec_copy(aff->v);
+               vec = isl_vec_cow(vec);
+               if (!ls || !vec)
+                       goto error;
+
+               isl_int_init(v);
+
+               pos = isl_local_space_offset(aff->ls, isl_dim_div) + i;
+               isl_seq_substitute(vec->el, pos, aff->ls->div->row[i],
+                                       len, len, v);
+
+               isl_int_clear(v);
+
+               isl_vec_free(aff->v);
+               aff->v = vec;
+               isl_local_space_free(aff->ls);
+               aff->ls = ls;
+       }
+
+       return aff;
+error:
+       isl_vec_free(vec);
+       isl_local_space_free(ls);
+       return isl_aff_free(aff);
+}
+
+/* Swap divs "a" and "b" in "aff", which is assumed to be non-NULL.
+ *
+ * Even though this function is only called on isl_affs with a single
+ * reference, we are careful to only change aff->v and aff->ls together.
+ */
+static __isl_give isl_aff *swap_div(__isl_take isl_aff *aff, int a, int b)
+{
+       unsigned off = isl_local_space_offset(aff->ls, isl_dim_div);
+       isl_local_space *ls;
+       isl_vec *v;
+
+       ls = isl_local_space_copy(aff->ls);
+       ls = isl_local_space_swap_div(ls, a, b);
+       v = isl_vec_copy(aff->v);
+       v = isl_vec_cow(v);
+       if (!ls || !v)
+               goto error;
+
+       isl_int_swap(v->el[1 + off + a], v->el[1 + off + b]);
+       isl_vec_free(aff->v);
+       aff->v = v;
+       isl_local_space_free(aff->ls);
+       aff->ls = ls;
+
+       return aff;
+error:
+       isl_vec_free(v);
+       isl_local_space_free(ls);
+       return isl_aff_free(aff);
+}
+
+/* Merge divs "a" and "b" in "aff", which is assumed to be non-NULL.
+ *
+ * We currently do not actually remove div "b", but simply add its
+ * coefficient to that of "a" and then zero it out.
+ */
+static __isl_give isl_aff *merge_divs(__isl_take isl_aff *aff, int a, int b)
+{
+       unsigned off = isl_local_space_offset(aff->ls, isl_dim_div);
+
+       if (isl_int_is_zero(aff->v->el[1 + off + b]))
+               return aff;
+
+       aff->v = isl_vec_cow(aff->v);
+       if (!aff->v)
+               return isl_aff_free(aff);
+
+       isl_int_add(aff->v->el[1 + off + a],
+                   aff->v->el[1 + off + a], aff->v->el[1 + off + b]);
+       isl_int_set_si(aff->v->el[1 + off + b], 0);
+
+       return aff;
+}
+
+/* Sort the divs in the local space of "aff" according to
+ * the comparison function "cmp_row" in isl_local_space.c,
+ * combining the coefficients of identical divs.
+ *
+ * Reordering divs does not change the semantics of "aff",
+ * so there is no need to call isl_aff_cow.
+ * Moreover, this function is currently only called on isl_affs
+ * with a single reference.
+ */
+static __isl_give isl_aff *sort_divs(__isl_take isl_aff *aff)
+{
+       int i, j, n;
+       unsigned off;
+
+       if (!aff)
+               return NULL;
+
+       off = isl_local_space_offset(aff->ls, isl_dim_div);
+       n = isl_aff_dim(aff, isl_dim_div);
+       for (i = 1; i < n; ++i) {
+               for (j = i - 1; j >= 0; --j) {
+                       int cmp = isl_mat_cmp_div(aff->ls->div, j, j + 1);
+                       if (cmp < 0)
+                               break;
+                       if (cmp == 0)
+                               aff = merge_divs(aff, j, j + 1);
+                       else
+                               aff = swap_div(aff, j, j + 1);
+                       if (!aff)
+                               return NULL;
+               }
+       }
+
+       return aff;
+}
+
+/* Normalize the representation of "aff".
+ *
+ * This function should only be called of "new" isl_affs, i.e.,
+ * with only a single reference.  We therefore do not need to
+ * worry about affecting other instances.
+ */
 __isl_give isl_aff *isl_aff_normalize(__isl_take isl_aff *aff)
 {
        if (!aff)
@@ -655,6 +831,8 @@ __isl_give isl_aff *isl_aff_normalize(__isl_take isl_aff *aff)
        aff->v = isl_vec_normalize(aff->v);
        if (!aff->v)
                return isl_aff_free(aff);
+       aff = plug_in_integral_divs(aff);
+       aff = sort_divs(aff);
        aff = isl_aff_remove_unused_divs(aff);
        return aff;
 }
@@ -939,6 +1117,11 @@ __isl_give isl_aff *isl_aff_scale_down(__isl_take isl_aff *aff, isl_int f)
        aff = isl_aff_cow(aff);
        if (!aff)
                return NULL;
+
+       if (isl_int_is_zero(f))
+               isl_die(isl_aff_get_ctx(aff), isl_error_invalid,
+                       "cannot scale down by zero", return isl_aff_free(aff));
+
        aff->v = isl_vec_cow(aff->v);
        if (!aff->v)
                return isl_aff_free(aff);
@@ -2020,6 +2203,46 @@ error:
        return NULL;
 }
 
+/* Divide "aff1" by "aff2", assuming "aff2" is a piecewise constant.
+ */
+__isl_give isl_aff *isl_aff_div(__isl_take isl_aff *aff1,
+       __isl_take isl_aff *aff2)
+{
+       int is_cst;
+       int neg;
+
+       is_cst = isl_aff_is_cst(aff2);
+       if (is_cst < 0)
+               goto error;
+       if (!is_cst)
+               isl_die(isl_aff_get_ctx(aff2), isl_error_invalid,
+                       "second argument should be a constant", goto error);
+
+       if (!aff2)
+               goto error;
+
+       neg = isl_int_is_neg(aff2->v->el[1]);
+       if (neg) {
+               isl_int_neg(aff2->v->el[0], aff2->v->el[0]);
+               isl_int_neg(aff2->v->el[1], aff2->v->el[1]);
+       }
+
+       aff1 = isl_aff_scale(aff1, aff2->v->el[0]);
+       aff1 = isl_aff_scale_down(aff1, aff2->v->el[1]);
+
+       if (neg) {
+               isl_int_neg(aff2->v->el[0], aff2->v->el[0]);
+               isl_int_neg(aff2->v->el[1], aff2->v->el[1]);
+       }
+
+       isl_aff_free(aff2);
+       return aff1;
+error:
+       isl_aff_free(aff1);
+       isl_aff_free(aff2);
+       return NULL;
+}
+
 static __isl_give isl_pw_aff *pw_aff_add(__isl_take isl_pw_aff *pwaff1,
        __isl_take isl_pw_aff *pwaff2)
 {
@@ -2050,6 +2273,101 @@ __isl_give isl_pw_aff *isl_pw_aff_mul(__isl_take isl_pw_aff *pwaff1,
        return isl_pw_aff_align_params_pw_pw_and(pwaff1, pwaff2, &pw_aff_mul);
 }
 
+static __isl_give isl_pw_aff *pw_aff_div(__isl_take isl_pw_aff *pa1,
+       __isl_take isl_pw_aff *pa2)
+{
+       return isl_pw_aff_on_shared_domain(pa1, pa2, &isl_aff_div);
+}
+
+/* Divide "pa1" by "pa2", assuming "pa2" is a piecewise constant.
+ */
+__isl_give isl_pw_aff *isl_pw_aff_div(__isl_take isl_pw_aff *pa1,
+       __isl_take isl_pw_aff *pa2)
+{
+       int is_cst;
+
+       is_cst = isl_pw_aff_is_cst(pa2);
+       if (is_cst < 0)
+               goto error;
+       if (!is_cst)
+               isl_die(isl_pw_aff_get_ctx(pa2), isl_error_invalid,
+                       "second argument should be a piecewise constant",
+                       goto error);
+       return isl_pw_aff_align_params_pw_pw_and(pa1, pa2, &pw_aff_div);
+error:
+       isl_pw_aff_free(pa1);
+       isl_pw_aff_free(pa2);
+       return NULL;
+}
+
+/* Compute the quotient of the integer division of "pa1" by "pa2"
+ * with rounding towards zero.
+ * "pa2" is assumed to be a piecewise constant.
+ *
+ * In particular, return
+ *
+ *     pa1 >= 0 ? floor(pa1/pa2) : ceil(pa1/pa2)
+ *
+ */
+__isl_give isl_pw_aff *isl_pw_aff_tdiv_q(__isl_take isl_pw_aff *pa1,
+       __isl_take isl_pw_aff *pa2)
+{
+       int is_cst;
+       isl_set *cond;
+       isl_pw_aff *f, *c;
+
+       is_cst = isl_pw_aff_is_cst(pa2);
+       if (is_cst < 0)
+               goto error;
+       if (!is_cst)
+               isl_die(isl_pw_aff_get_ctx(pa2), isl_error_invalid,
+                       "second argument should be a piecewise constant",
+                       goto error);
+
+       pa1 = isl_pw_aff_div(pa1, pa2);
+
+       cond = isl_pw_aff_nonneg_set(isl_pw_aff_copy(pa1));
+       f = isl_pw_aff_floor(isl_pw_aff_copy(pa1));
+       c = isl_pw_aff_ceil(pa1);
+       return isl_pw_aff_cond(isl_set_indicator_function(cond), f, c);
+error:
+       isl_pw_aff_free(pa1);
+       isl_pw_aff_free(pa2);
+       return NULL;
+}
+
+/* Compute the remainder of the integer division of "pa1" by "pa2"
+ * with rounding towards zero.
+ * "pa2" is assumed to be a piecewise constant.
+ *
+ * In particular, return
+ *
+ *     pa1 - pa2 * (pa1 >= 0 ? floor(pa1/pa2) : ceil(pa1/pa2))
+ *
+ */
+__isl_give isl_pw_aff *isl_pw_aff_tdiv_r(__isl_take isl_pw_aff *pa1,
+       __isl_take isl_pw_aff *pa2)
+{
+       int is_cst;
+       isl_pw_aff *res;
+
+       is_cst = isl_pw_aff_is_cst(pa2);
+       if (is_cst < 0)
+               goto error;
+       if (!is_cst)
+               isl_die(isl_pw_aff_get_ctx(pa2), isl_error_invalid,
+                       "second argument should be a piecewise constant",
+                       goto error);
+       res = isl_pw_aff_tdiv_q(isl_pw_aff_copy(pa1), isl_pw_aff_copy(pa2));
+       res = isl_pw_aff_mul(pa2, res);
+       res = isl_pw_aff_sub(pa1, res);
+       return res;
+error:
+       isl_pw_aff_free(pa1);
+       isl_pw_aff_free(pa2);
+       return NULL;
+}
+
 static __isl_give isl_pw_aff *pw_aff_min(__isl_take isl_pw_aff *pwaff1,
        __isl_take isl_pw_aff *pwaff2)
 {
@@ -2173,6 +2491,57 @@ __isl_give isl_multi_aff *isl_multi_aff_zero(__isl_take isl_space *space)
        return ma;
 }
 
+/* Create an isl_multi_aff in the given space that maps each
+ * input dimension to the corresponding output dimension.
+ */
+__isl_give isl_multi_aff *isl_multi_aff_identity(__isl_take isl_space *space)
+{
+       int n;
+       isl_multi_aff *ma;
+
+       if (!space)
+               return NULL;
+
+       if (isl_space_is_set(space))
+               isl_die(isl_space_get_ctx(space), isl_error_invalid,
+                       "expecting map space", goto error);
+
+       n = isl_space_dim(space, isl_dim_out);
+       if (n != isl_space_dim(space, isl_dim_in))
+               isl_die(isl_space_get_ctx(space), isl_error_invalid,
+                       "number of input and output dimensions needs to be "
+                       "the same", goto error);
+
+       ma = isl_multi_aff_alloc(isl_space_copy(space));
+
+       if (!n)
+               isl_space_free(space);
+       else {
+               int i;
+               isl_local_space *ls;
+               isl_aff *aff;
+
+               space = isl_space_domain(space);
+               ls = isl_local_space_from_space(space);
+               aff = isl_aff_zero_on_domain(ls);
+
+               for (i = 0; i < n; ++i) {
+                       isl_aff *aff_i;
+                       aff_i = isl_aff_copy(aff);
+                       aff_i = isl_aff_add_coefficient_si(aff_i,
+                                                           isl_dim_in, i, 1);
+                       ma = isl_multi_aff_set_aff(ma, i, aff_i);
+               }
+
+               isl_aff_free(aff);
+       }
+
+       return ma;
+error:
+       isl_space_free(space);
+       return NULL;
+}
+
 /* Create an isl_pw_multi_aff with the given isl_multi_aff on a universe
  * domain.
  */
@@ -2183,6 +2552,15 @@ __isl_give isl_pw_multi_aff *isl_pw_multi_aff_from_multi_aff(
        return isl_pw_multi_aff_alloc(dom, ma);
 }
 
+/* Create a piecewise multi-affine expression in the given space that maps each
+ * input dimension to the corresponding output dimension.
+ */
+__isl_give isl_pw_multi_aff *isl_pw_multi_aff_identity(
+       __isl_take isl_space *space)
+{
+       return isl_pw_multi_aff_from_multi_aff(isl_multi_aff_identity(space));
+}
+
 __isl_give isl_multi_aff *isl_multi_aff_add(__isl_take isl_multi_aff *maff1,
        __isl_take isl_multi_aff *maff2)
 {
@@ -2213,6 +2591,47 @@ error:
        return NULL;
 }
 
+/* Given two multi-affine expressions A -> B and C -> D,
+ * construct a multi-affine expression [A -> C] -> [B -> D].
+ */
+__isl_give isl_multi_aff *isl_multi_aff_product(
+       __isl_take isl_multi_aff *ma1, __isl_take isl_multi_aff *ma2)
+{
+       int i;
+       isl_aff *aff;
+       isl_space *space;
+       isl_multi_aff *res;
+       int in1, in2, out1, out2;
+
+       in1 = isl_multi_aff_dim(ma1, isl_dim_in);
+       in2 = isl_multi_aff_dim(ma2, isl_dim_in);
+       out1 = isl_multi_aff_dim(ma1, isl_dim_out);
+       out2 = isl_multi_aff_dim(ma2, isl_dim_out);
+       space = isl_space_product(isl_multi_aff_get_space(ma1),
+                                 isl_multi_aff_get_space(ma2));
+       res = isl_multi_aff_alloc(isl_space_copy(space));
+       space = isl_space_domain(space);
+
+       for (i = 0; i < out1; ++i) {
+               aff = isl_multi_aff_get_aff(ma1, i);
+               aff = isl_aff_insert_dims(aff, isl_dim_in, in1, in2);
+               aff = isl_aff_reset_domain_space(aff, isl_space_copy(space));
+               res = isl_multi_aff_set_aff(res, i, aff);
+       }
+
+       for (i = 0; i < out2; ++i) {
+               aff = isl_multi_aff_get_aff(ma2, i);
+               aff = isl_aff_insert_dims(aff, isl_dim_in, 0, in1);
+               aff = isl_aff_reset_domain_space(aff, isl_space_copy(space));
+               res = isl_multi_aff_set_aff(res, out1 + i, aff);
+       }
+
+       isl_space_free(space);
+       isl_multi_aff_free(ma1);
+       isl_multi_aff_free(ma2);
+       return res;
+}
+
 /* Exploit the equalities in "eq" to simplify the affine expressions.
  */
 static __isl_give isl_multi_aff *isl_multi_aff_substitute_equalities(
@@ -2352,6 +2771,36 @@ __isl_give isl_multi_aff *isl_multi_aff_drop_dims(__isl_take isl_multi_aff *maff
        return maff;
 }
 
+/* Return the set of domain elements where "ma1" is lexicographically
+ * smaller than or equal to "ma2".
+ */
+__isl_give isl_set *isl_multi_aff_lex_le_set(__isl_take isl_multi_aff *ma1,
+       __isl_take isl_multi_aff *ma2)
+{
+       return isl_multi_aff_lex_ge_set(ma2, ma1);
+}
+
+/* Return the set of domain elements where "ma1" is lexicographically
+ * greater than or equal to "ma2".
+ */
+__isl_give isl_set *isl_multi_aff_lex_ge_set(__isl_take isl_multi_aff *ma1,
+       __isl_take isl_multi_aff *ma2)
+{
+       isl_space *space;
+       isl_map *map1, *map2;
+       isl_map *map, *ge;
+
+       map1 = isl_map_from_multi_aff(ma1);
+       map2 = isl_map_from_multi_aff(ma2);
+       map = isl_map_range_product(map1, map2);
+       space = isl_space_range(isl_map_get_space(map));
+       space = isl_space_domain(isl_space_unwrap(space));
+       ge = isl_map_lex_ge(space);
+       map = isl_map_intersect_range(map, isl_map_wrap(ge));
+
+       return isl_map_domain(map);
+}
+
 #undef PW
 #define PW isl_pw_multi_aff
 #undef EL
@@ -2390,6 +2839,158 @@ __isl_give isl_multi_aff *isl_multi_aff_drop_dims(__isl_take isl_multi_aff *maff
 
 #include <isl_union_templ.c>
 
+/* Given a function "cmp" that returns the set of elements where
+ * "ma1" is "better" than "ma2", return the intersection of this
+ * set with "dom1" and "dom2".
+ */
+static __isl_give isl_set *shared_and_better(__isl_keep isl_set *dom1,
+       __isl_keep isl_set *dom2, __isl_keep isl_multi_aff *ma1,
+       __isl_keep isl_multi_aff *ma2,
+       __isl_give isl_set *(*cmp)(__isl_take isl_multi_aff *ma1,
+                                   __isl_take isl_multi_aff *ma2))
+{
+       isl_set *common;
+       isl_set *better;
+       int is_empty;
+
+       common = isl_set_intersect(isl_set_copy(dom1), isl_set_copy(dom2));
+       is_empty = isl_set_plain_is_empty(common);
+       if (is_empty >= 0 && is_empty)
+               return common;
+       if (is_empty < 0)
+               return isl_set_free(common);
+       better = cmp(isl_multi_aff_copy(ma1), isl_multi_aff_copy(ma2));
+       better = isl_set_intersect(common, better);
+
+       return better;
+}
+
+/* Given a function "cmp" that returns the set of elements where
+ * "ma1" is "better" than "ma2", return a piecewise multi affine
+ * expression defined on the union of the definition domains
+ * of "pma1" and "pma2" that maps to the "best" of "pma1" and
+ * "pma2" on each cell.  If only one of the two input functions
+ * is defined on a given cell, then it is considered the best.
+ */
+static __isl_give isl_pw_multi_aff *pw_multi_aff_union_opt(
+       __isl_take isl_pw_multi_aff *pma1,
+       __isl_take isl_pw_multi_aff *pma2,
+       __isl_give isl_set *(*cmp)(__isl_take isl_multi_aff *ma1,
+                                   __isl_take isl_multi_aff *ma2))
+{
+       int i, j, n;
+       isl_pw_multi_aff *res = NULL;
+       isl_ctx *ctx;
+       isl_set *set = NULL;
+
+       if (!pma1 || !pma2)
+               goto error;
+
+       ctx = isl_space_get_ctx(pma1->dim);
+       if (!isl_space_is_equal(pma1->dim, pma2->dim))
+               isl_die(ctx, isl_error_invalid,
+                       "arguments should live in the same space", goto error);
+
+       if (isl_pw_multi_aff_is_empty(pma1)) {
+               isl_pw_multi_aff_free(pma1);
+               return pma2;
+       }
+
+       if (isl_pw_multi_aff_is_empty(pma2)) {
+               isl_pw_multi_aff_free(pma2);
+               return pma1;
+       }
+
+       n = 2 * (pma1->n + 1) * (pma2->n + 1);
+       res = isl_pw_multi_aff_alloc_size(isl_space_copy(pma1->dim), n);
+
+       for (i = 0; i < pma1->n; ++i) {
+               set = isl_set_copy(pma1->p[i].set);
+               for (j = 0; j < pma2->n; ++j) {
+                       isl_set *better;
+                       int is_empty;
+
+                       better = shared_and_better(pma2->p[j].set,
+                                       pma1->p[i].set, pma2->p[j].maff,
+                                       pma1->p[i].maff, cmp);
+                       is_empty = isl_set_plain_is_empty(better);
+                       if (is_empty < 0 || is_empty) {
+                               isl_set_free(better);
+                               if (is_empty < 0)
+                                       goto error;
+                               continue;
+                       }
+                       set = isl_set_subtract(set, isl_set_copy(better));
+
+                       res = isl_pw_multi_aff_add_piece(res, better,
+                                       isl_multi_aff_copy(pma2->p[j].maff));
+               }
+               res = isl_pw_multi_aff_add_piece(res, set,
+                                       isl_multi_aff_copy(pma1->p[i].maff));
+       }
+
+       for (j = 0; j < pma2->n; ++j) {
+               set = isl_set_copy(pma2->p[j].set);
+               for (i = 0; i < pma1->n; ++i)
+                       set = isl_set_subtract(set,
+                                       isl_set_copy(pma1->p[i].set));
+               res = isl_pw_multi_aff_add_piece(res, set,
+                                       isl_multi_aff_copy(pma2->p[j].maff));
+       }
+
+       isl_pw_multi_aff_free(pma1);
+       isl_pw_multi_aff_free(pma2);
+
+       return res;
+error:
+       isl_pw_multi_aff_free(pma1);
+       isl_pw_multi_aff_free(pma2);
+       isl_set_free(set);
+       return isl_pw_multi_aff_free(res);
+}
+
+static __isl_give isl_pw_multi_aff *pw_multi_aff_union_lexmax(
+       __isl_take isl_pw_multi_aff *pma1,
+       __isl_take isl_pw_multi_aff *pma2)
+{
+       return pw_multi_aff_union_opt(pma1, pma2, &isl_multi_aff_lex_ge_set);
+}
+
+/* Given two piecewise multi affine expressions, return a piecewise
+ * multi-affine expression defined on the union of the definition domains
+ * of the inputs that is equal to the lexicographic maximum of the two
+ * inputs on each cell.  If only one of the two inputs is defined on
+ * a given cell, then it is considered to be the maximum.
+ */
+__isl_give isl_pw_multi_aff *isl_pw_multi_aff_union_lexmax(
+       __isl_take isl_pw_multi_aff *pma1,
+       __isl_take isl_pw_multi_aff *pma2)
+{
+       return isl_pw_multi_aff_align_params_pw_pw_and(pma1, pma2,
+                                                   &pw_multi_aff_union_lexmax);
+}
+
+static __isl_give isl_pw_multi_aff *pw_multi_aff_union_lexmin(
+       __isl_take isl_pw_multi_aff *pma1,
+       __isl_take isl_pw_multi_aff *pma2)
+{
+       return pw_multi_aff_union_opt(pma1, pma2, &isl_multi_aff_lex_le_set);
+}
+
+/* Given two piecewise multi affine expressions, return a piecewise
+ * multi-affine expression defined on the union of the definition domains
+ * of the inputs that is equal to the lexicographic minimum of the two
+ * inputs on each cell.  If only one of the two inputs is defined on
+ * a given cell, then it is considered to be the minimum.
+ */
+__isl_give isl_pw_multi_aff *isl_pw_multi_aff_union_lexmin(
+       __isl_take isl_pw_multi_aff *pma1,
+       __isl_take isl_pw_multi_aff *pma2)
+{
+       return isl_pw_multi_aff_align_params_pw_pw_and(pma1, pma2,
+                                                   &pw_multi_aff_union_lexmin);
+}
+
 static __isl_give isl_pw_multi_aff *pw_multi_aff_add(
        __isl_take isl_pw_multi_aff *pma1, __isl_take isl_pw_multi_aff *pma2)
 {
@@ -2410,6 +3011,54 @@ __isl_give isl_pw_multi_aff *isl_pw_multi_aff_union_add(
        return isl_pw_multi_aff_union_add_(pma1, pma2);
 }
 
+/* Given two piecewise multi-affine expressions A -> B and C -> D,
+ * construct a piecewise multi-affine expression [A -> C] -> [B -> D].
+ */
+static __isl_give isl_pw_multi_aff *pw_multi_aff_product(
+       __isl_take isl_pw_multi_aff *pma1, __isl_take isl_pw_multi_aff *pma2)
+{
+       int i, j, n;
+       isl_space *space;
+       isl_pw_multi_aff *res;
+
+       if (!pma1 || !pma2)
+               goto error;
+
+       n = pma1->n * pma2->n;
+       space = isl_space_product(isl_space_copy(pma1->dim),
+                                 isl_space_copy(pma2->dim));
+       res = isl_pw_multi_aff_alloc_size(space, n);
+
+       for (i = 0; i < pma1->n; ++i) {
+               for (j = 0; j < pma2->n; ++j) {
+                       isl_set *domain;
+                       isl_multi_aff *ma;
+
+                       domain = isl_set_product(isl_set_copy(pma1->p[i].set),
+                                                isl_set_copy(pma2->p[j].set));
+                       ma = isl_multi_aff_product(
+                                       isl_multi_aff_copy(pma1->p[i].maff),
+                                       isl_multi_aff_copy(pma2->p[i].maff));
+                       res = isl_pw_multi_aff_add_piece(res, domain, ma);
+               }
+       }
+
+       isl_pw_multi_aff_free(pma1);
+       isl_pw_multi_aff_free(pma2);
+       return res;
+error:
+       isl_pw_multi_aff_free(pma1);
+       isl_pw_multi_aff_free(pma2);
+       return NULL;
+}
+
+__isl_give isl_pw_multi_aff *isl_pw_multi_aff_product(
+       __isl_take isl_pw_multi_aff *pma1, __isl_take isl_pw_multi_aff *pma2)
+{
+       return isl_pw_multi_aff_align_params_pw_pw_and(pma1, pma2,
+                                               &pw_multi_aff_product);
+}
+
 /* Construct a map mapping the domain of the piecewise multi-affine expression
  * to its range, with each dimension in the range equated to the
  * corresponding affine expression on its cell.
@@ -2561,7 +3210,7 @@ static __isl_give isl_pw_multi_aff *plain_pw_multi_aff_from_map(
 }
 
 /* Try and create an isl_pw_multi_aff that is equivalent to the given isl_map.
- * This obivously only works if the input "map" is single-valued.
+ * This obviously only works if the input "map" is single-valued.
  * If so, we compute the lexicographic minimum of the image in the form
  * of an isl_pw_multi_aff.  Since the image is unique, it is equal
  * to its lexicographic minimum.
@@ -2652,7 +3301,7 @@ __isl_give isl_pw_aff *isl_set_indicator_function(__isl_take isl_set *set)
  *
  * The result is
  *
- *     floor((a f + d g')/(m d))
+ *     (a f + d g')/(m d)
  *
  * where g' is the result of plugging in "subs" in each of the integer
  * divisions in g.
@@ -2686,11 +3335,8 @@ __isl_give isl_aff *isl_aff_substitute(__isl_take isl_aff *aff,
        pos += isl_local_space_offset(aff->ls, type);
 
        isl_int_init(v);
-       isl_int_set(v, aff->v->el[1 + pos]);
-       isl_int_set_si(aff->v->el[1 + pos], 0);
-       isl_seq_combine(aff->v->el + 1, subs->v->el[0], aff->v->el + 1,
-                       v, subs->v->el + 1, subs->v->size - 1);
-       isl_int_mul(aff->v->el[0], aff->v->el[0], subs->v->el[0]);
+       isl_seq_substitute(aff->v->el, pos, subs->v->el,
+                           aff->v->size, subs->v->size, v);
        isl_int_clear(v);
 
        return aff;
@@ -3209,3 +3855,87 @@ __isl_give isl_union_pw_multi_aff *isl_union_pw_multi_aff_flat_range_product(
 {
        return bin_op(upma1, upma2, &flat_range_product_entry);
 }
+
+/* Replace the affine expressions at position "pos" in "pma" by "pa".
+ * The parameters are assumed to have been aligned.
+ *
+ * The implementation essentially performs an isl_pw_*_on_shared_domain,
+ * except that it works on two different isl_pw_* types.
+ */
+static __isl_give isl_pw_multi_aff *pw_multi_aff_set_pw_aff(
+       __isl_take isl_pw_multi_aff *pma, unsigned pos,
+       __isl_take isl_pw_aff *pa)
+{
+       int i, j, n;
+       isl_pw_multi_aff *res = NULL;
+
+       if (!pma || !pa)
+               goto error;
+
+       if (!isl_space_tuple_match(pma->dim, isl_dim_in, pa->dim, isl_dim_in))
+               isl_die(isl_pw_multi_aff_get_ctx(pma), isl_error_invalid,
+                       "domains don't match", goto error);
+       if (pos >= isl_pw_multi_aff_dim(pma, isl_dim_out))
+               isl_die(isl_pw_multi_aff_get_ctx(pma), isl_error_invalid,
+                       "index out of bounds", goto error);
+
+       n = pma->n * pa->n;
+       res = isl_pw_multi_aff_alloc_size(isl_pw_multi_aff_get_space(pma), n);
+
+       for (i = 0; i < pma->n; ++i) {
+               for (j = 0; j < pa->n; ++j) {
+                       isl_set *common;
+                       isl_multi_aff *res_ij;
+                       int empty;
+
+                       common = isl_set_intersect(isl_set_copy(pma->p[i].set),
+                                                  isl_set_copy(pa->p[j].set));
+                       empty = isl_set_plain_is_empty(common);
+                       if (empty < 0 || empty) {
+                               isl_set_free(common);
+                               if (empty < 0)
+                                       goto error;
+                               continue;
+                       }
+
+                       res_ij = isl_multi_aff_set_aff(
+                                       isl_multi_aff_copy(pma->p[i].maff), pos,
+                                       isl_aff_copy(pa->p[j].aff));
+                       res_ij = isl_multi_aff_gist(res_ij,
+                                       isl_set_copy(common));
+
+                       res = isl_pw_multi_aff_add_piece(res, common, res_ij);
+               }
+       }
+
+       isl_pw_multi_aff_free(pma);
+       isl_pw_aff_free(pa);
+       return res;
+error:
+       isl_pw_multi_aff_free(pma);
+       isl_pw_aff_free(pa);
+       return isl_pw_multi_aff_free(res);
+}
+
+/* Replace the affine expressions at position "pos" in "pma" by "pa".
+ */
+__isl_give isl_pw_multi_aff *isl_pw_multi_aff_set_pw_aff(
+       __isl_take isl_pw_multi_aff *pma, unsigned pos,
+       __isl_take isl_pw_aff *pa)
+{
+       if (!pma || !pa)
+               goto error;
+       if (isl_space_match(pma->dim, isl_dim_param, pa->dim, isl_dim_param))
+               return pw_multi_aff_set_pw_aff(pma, pos, pa);
+       if (!isl_space_has_named_params(pma->dim) ||
+           !isl_space_has_named_params(pa->dim))
+               isl_die(isl_pw_multi_aff_get_ctx(pma), isl_error_invalid,
+                       "unaligned unnamed parameters", goto error);
+       pma = isl_pw_multi_aff_align_params(pma, isl_pw_aff_get_space(pa));
+       pa = isl_pw_aff_align_params(pa, isl_pw_multi_aff_get_space(pma));
+       return pw_multi_aff_set_pw_aff(pma, pos, pa);
+error:
+       isl_pw_multi_aff_free(pma);
+       isl_pw_aff_free(pa);
+       return NULL;
+}