This patch improves strcat performance by using strlen and strcpy. Strlen has a fast C
authorWilco Dijkstra <wdijkstr@arm.com>
Fri, 24 Oct 2014 16:08:42 +0000 (16:08 +0000)
committerWilco Dijkstra <wdijkstr@arm.com>
Fri, 24 Oct 2014 16:08:42 +0000 (16:08 +0000)
implementation, so this improves performance even on targets which don't have an optimized
strlen and strcpy - it is 25% faster in bench-strcat. On targets which don't provide an
optimized strcat but which do have an optimized strlen and strcpy, performance gain is > 2x.

ChangeLog
string/strcat.c

index 98548cb..f73c55e 100644 (file)
--- a/ChangeLog
+++ b/ChangeLog
@@ -1,5 +1,9 @@
 2014-10-24  Wilco Dijkstra  <wdijkstr@arm.com>
 
+       * string/strcat.c (strcat): Improve performance by using strlen/strcpy.
+
+2014-10-24  Wilco Dijkstra  <wdijkstr@arm.com>
+
        * sysdeps/aarch64/fpu/fgetexcptflg.c (fegetexceptflag):
        Call libc_fetestexcept_aarch64.
 
index 2cbe8b3..983d115 100644 (file)
 char *
 strcat (char *dest, const char *src)
 {
-  char *s1 = dest;
-  const char *s2 = src;
-  char c;
-
-  /* Find the end of the string.  */
-  do
-    c = *s1++;
-  while (c != '\0');
-
-  /* Make S1 point before the next character, so we can increment
-     it while memory is read (wins on pipelined cpus).  */
-  s1 -= 2;
-
-  do
-    {
-      c = *s2++;
-      *++s1 = c;
-    }
-  while (c != '\0');
-
+  strcpy (dest + strlen (dest), src);
   return dest;
 }
 libc_hidden_builtin_def (strcat)