x86: Small improvements for wcslen
authorNoah Goldstein <goldstein.w.n@gmail.com>
Fri, 25 Mar 2022 22:13:33 +0000 (17:13 -0500)
committerNoah Goldstein <goldstein.w.n@gmail.com>
Mon, 28 Mar 2022 20:00:03 +0000 (15:00 -0500)
commit244b415d386487521882debb845a040a4758cb18
tree25037631403bb43edecf213273f0a8cf28ec9b15
parentf5bff979d02cf115be94c0c0c6f1a1a505964772
x86: Small improvements for wcslen

Just a few QOL changes.
    1. Prefer `add` > `lea` as it has high execution units it can run
       on.
    2. Don't break macro-fusion between `test` and `jcc`
    3. Reduce code size by removing gratuitous padding bytes (-90
       bytes).

geometric_mean(N=20) of all benchmarks New / Original: 0.959

All string/memory tests pass.
Reviewed-by: H.J. Lu <hjl.tools@gmail.com>
sysdeps/x86_64/wcslen.S