Power8 inline assembly tweaks
authorAlan Modra <amodra@gmail.com>
Sat, 1 Apr 2017 09:05:59 +0000 (19:35 +1030)
committerAlan Modra <amodra@gmail.com>
Tue, 4 Apr 2017 13:43:54 +0000 (23:13 +0930)
commitdc40bc7368ee6632eb9172648332da7db826c821
tree04f8f6cd295b1a83d5944a3a1011510aa15ecfa7
parent1acfc78c8f8c19dc876e8c859bd1c55619b64205
Power8 inline assembly tweaks

Further fixes on top of 9e2f316ed.  Writing some doco for gcc on
inline assembly woke me up to some more errors.

- dgemv_kernel_4x4 asm did not mention *ap as a memory input, and
  *y is both read and write.
- sasum_kernel_32 and casum_kernel_16 did not use %x for a vsx insn
  operand, a problem if the "=f" sum output was ever allocated a vsx
  reg in the altivec set.  This might be possible with inlining and
  future gcc optimisation.
kernel/power/casum_microk_power8.c
kernel/power/dgemv_n_microk_power8.c
kernel/power/sasum_microk_power8.c