intel/compiler: workaround for SIMD8 half-float MAD in gen8
authorIago Toral Quiroga <itoral@igalia.com>
Mon, 21 Jan 2019 11:11:44 +0000 (12:11 +0100)
committerJuan A. Suarez Romero <jasuarez@igalia.com>
Thu, 18 Apr 2019 09:05:18 +0000 (11:05 +0200)
commit0986199b31ab2a6086131887e474bc8f79fbc28d
tree1a70ea5493efd1d21c1e33f8240e5af857284c09
parentaaae24179ff1007776d2f3a5a813f2c52dc83eba
intel/compiler: workaround for SIMD8 half-float MAD in gen8

Empirical testing shows that gen8 has a bug where MAD instructions with
a half-float source starting at a non-zero offset fail to execute
properly.

This scenario usually happened in SIMD8 executions, where we used to
pack vector components Y and W in the second half of SIMD registers
(therefore, with a 16B offset). It looks like we are not currently doing
this any more but this would handle the situation properly if we ever
happen to produce code like this again.

v2 (Jason):
 - Move this workaround to the lower_regioning pass as an additional case
   to has_invalid_src_region()
 - Do not apply the workaround if the stride of the source operand is 0,
   testing suggests the problem doesn't exist in that case.

v3 (Jason):
 - We want offset % REG_SIZE > 0, not just offset > 0
 - Use a helper to compute the offset

Reviewed-by: Topi Pohjolainen <topi.pohjolainen@intel.com> (v1)
src/intel/compiler/brw_fs_lower_regioning.cpp