aarch64,falkor: Use vector registers for memcpy
authorSiddhesh Poyarekar <siddhesh@sourceware.org>
Fri, 29 Jun 2018 17:15:59 +0000 (22:45 +0530)
committerSiddhesh Poyarekar <siddhesh@sourceware.org>
Fri, 29 Jun 2018 17:15:59 +0000 (22:45 +0530)
commit0aec4c1d1801e8016ebe89281d16597e0557b8be
tree7b0468557d57862885d8ee5b914125f6ffc66102
parentce76a5cb8d3658cc4fc935cf774e8bb5836796dc
aarch64,falkor: Use vector registers for memcpy

Vector registers perform better than scalar register pairs for copying
data so prefer them instead.  This results in a time reduction of over
50% (i.e. 2x speed improvemnet) for some smaller sizes for memcpy-walk.
Larger sizes show improvements of around 1% to 2%.  memcpy-random shows
a very small improvement, in the range of 1-2%.

* sysdeps/aarch64/multiarch/memcpy_falkor.S (__memcpy_falkor):
Use vector registers.
ChangeLog
sysdeps/aarch64/multiarch/memcpy_falkor.S