powerpc: Fix POWER7/PPC64 performance regression on LE
authorAdhemerval Zanella <azanella@linux.vnet.ibm.com>
Mon, 12 Jan 2015 01:33:17 +0000 (19:33 -0600)
committerAdhemerval Zanella <azanella@linux.vnet.ibm.com>
Tue, 13 Jan 2015 19:35:40 +0000 (14:35 -0500)
commitce6615c9c686acd34672a9f4eba9bcf5553496f6
treef729a9d836d1359dfb789fc353d48112a22b108c
parentd3b00f468bec441596877a685a19f43dee88657f
powerpc: Fix POWER7/PPC64 performance regression on LE

This patch fixes a performance regression on the POWER7/PPC64 memcmp
porting for Little Endian.  The LE code uses 'ldbrx' instruction to read
the memory on byte reversed form, however ISA 2.06 just provide the indexed
form which uses a register value as additional index, instead of a fixed value
enconded in the instruction.

And the port strategy for LE uses r0 index value and update the address
value on each compare loop interation.  For large compare size values,
it adds 8 more instructions plus some more depending of trailing
size.  This patch fixes it by adding pre-calculate indexes to remove the
address update on loops and tailing sizes.

For large sizes it shows a considerable gain, with double performance
pairing with BE.
ChangeLog
sysdeps/powerpc/powerpc64/power7/memcmp.S