middle-end: Prevent the use of the cond inversion detection code when both conditions...
authorTamar Christina <tamar.christina@arm.com>
Mon, 11 Apr 2022 14:09:05 +0000 (15:09 +0100)
committerTamar Christina <tamar.christina@arm.com>
Mon, 11 Apr 2022 14:09:05 +0000 (15:09 +0100)
commit78c718490bc2843d4dadcef8a0ae14aed1d15a32
tree29c5af69f5a2200a85e600fda6c1baed48f26ef0
parent790b02af6a1fcfa07dba6129909b3578a55a51fa
middle-end: Prevent the use of the cond inversion detection code when both conditions are external. [PR105197]

Previously ifcvt used to enforce that a mask A and the inverse of said mask be
represented as ~A. So for the masks

  _25 = _6 != 0;
  _44 = _4 != 0;

ifcvt would produce for an operation requiring the inverse of said mask

  _26 = ~_25;
  _43 = ~_44;

but now that VN is applied to the entire function body we get a simplification
on the mask and produce:

  _26 = _6 == 0;
  _43 = _4 == 0;

This in itself is not a problem semantically speaking (though it does create
more masks that need to be tracked) but when vectorizing the masked conditional
we would still detect _26 and _43 to be inverses of _25 and _44 and mark them
as requiring their operands be swapped.

When vectorizing we swap the operands but don't find the BIT_NOT_EXPR to remove
and so we leave the condition as is which produces invalid code:

------>vectorizing statement: _ifc__41 = _43 ? 0 : _ifc__40;
created new init_stmt: vect_cst__136 = { 0, ... }
add new stmt: _137 = mask__43.26_135 & loop_mask_111
note:  add new stmt: vect__ifc__41.27_138 = VEC_COND_EXPR <_137, vect__ifc__40.25_133, vect_cst__136>;

This fixes disabling the inversion detection code when the loop isn't masked
since both conditional would be external.  We'd then not use the new cond_code
and would incorrectly still swap the operands.

The resulting code is also better than GCC-11 with most operations now
predicated on the loop mask rather than a ptrue.

gcc/ChangeLog:

PR target/105197
* tree-vect-stmts.cc (vectorizable_condition): Prevent cond swap when
not masked.

gcc/testsuite/ChangeLog:

PR target/105197
* gcc.target/aarch64/sve/pr105197-1.c: New test.
* gcc.target/aarch64/sve/pr105197-2.c: New test.
gcc/testsuite/gcc.target/aarch64/sve/pr105197-1.c [new file with mode: 0644]
gcc/testsuite/gcc.target/aarch64/sve/pr105197-2.c [new file with mode: 0644]
gcc/tree-vect-stmts.cc