fix doc for eina_str
[framework/uifw/eina.git] / src / lib / eina_str.c
1 /*
2  * vim:ts=8:sw=3:sts=8:noexpandtab:cino=>5n-3f0^-2{2
3  */
4 /* Leave the OpenBSD version below so we can track upstream fixes */
5 /*      $OpenBSD: strlcpy.c,v 1.11 2006/05/05 15:27:38 millert Exp $        */
6
7 /*
8  * Copyright (c) 1998 Todd C. Miller <Todd.Miller@courtesan.com>
9  *
10  * Permission to use, copy, modify, and distribute this software for any
11  * purpose with or without fee is hereby granted, provided that the above
12  * copyright notice and this permission notice appear in all copies.
13  *
14  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
15  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
16  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
17  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
18  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
19  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
20  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
21  */
22
23 /*
24  * vim:ts=8:sw=3:sts=8:noexpandtab:cino=>5n-3f0^-2{2
25  */
26
27 #ifdef HAVE_CONFIG_H
28 # include "config.h"
29 #endif
30
31 #include <stdio.h>
32 #include <stdlib.h>
33 #include <string.h>
34 #include <limits.h>
35
36 #ifdef HAVE_ICONV
37 # include <errno.h>
38 # include <iconv.h>
39 #endif
40
41 #include "eina_private.h"
42 #include "eina_str.h"
43
44 /*============================================================================*
45  *                                  Local                                     *
46  *============================================================================*/
47
48 /**
49  * @cond LOCAL
50  */
51
52 /*
53  * Internal helper function used by eina_str_has_suffix() and
54  * eina_str_has_extension()
55  */
56 static inline Eina_Bool
57 eina_str_has_suffix_helper(const char *str,
58                            const char *suffix,
59                            int (*cmp)(const char *, const char *))
60 {
61    size_t str_len;
62    size_t suffix_len;
63
64    str_len = strlen(str);
65    suffix_len = eina_strlen_bounded(suffix, str_len);
66    if (suffix_len == (size_t)-1)
67      return EINA_FALSE;
68
69    return cmp(str + str_len - suffix_len, suffix) == 0;
70 }
71
72 static inline char **
73 eina_str_split_full_helper(const char *str, const char *delim, int max_tokens, unsigned int *elements)
74 {
75    char *s, **str_array;
76    const char *src;
77    size_t len, dlen;
78    unsigned int tokens;
79
80    dlen = strlen(delim);
81    if (dlen == 0)
82      {
83         if (elements) *elements = 0;
84         return NULL;
85      }
86
87    tokens = 0;
88    src = str;
89    /* count tokens and check strlen(str) */
90    while (*src != '\0')
91      {
92         const char *d = delim, *d_end = d + dlen;
93         const char *tmp = src;
94         for (; (d < d_end) && (*tmp != '\0'); d++, tmp++)
95           {
96              if (EINA_LIKELY(*d != *tmp))
97                break;
98           }
99         if (EINA_UNLIKELY(d == d_end))
100           {
101              src = tmp;
102              tokens++;
103           }
104         else
105           src++;
106      }
107    len = src - str;
108
109    if ((max_tokens > 0) && (tokens > (unsigned int)max_tokens))
110      tokens = max_tokens;
111
112    str_array = malloc(sizeof(char *) * (tokens + 2));
113    if (!str_array)
114      {
115         if (elements) *elements = 0;
116         return NULL;
117      }
118
119    s = malloc(len + 1);
120    if (!s)
121      {
122         free(str_array);
123         if (elements) *elements = 0;
124         return NULL;
125      }
126
127    /* copy tokens and string */
128    tokens = 0;
129    str_array[0] = s;
130    src = str;
131    while (*src != '\0')
132      {
133         const char *d = delim, *d_end = d + dlen;
134         const char *tmp = src;
135         for (; (d < d_end) && (*tmp != '\0'); d++, tmp++)
136           {
137              if (EINA_LIKELY(*d != *tmp))
138                break;
139           }
140         if (EINA_UNLIKELY(d == d_end))
141           {
142              src = tmp;
143              *s = '\0';
144              s += dlen;
145              tokens++;
146              str_array[tokens] = s;
147           }
148         else
149           {
150              *s = *src;
151              s++;
152              src++;
153           }
154      }
155    *s = '\0';
156    str_array[tokens + 1] = NULL;
157    if (elements) *elements = (tokens + 1);
158    return str_array;
159 }
160
161 /**
162  * @endcond
163  */
164
165 /*============================================================================*
166  *                                 Global                                     *
167  *============================================================================*/
168
169 /*============================================================================*
170  *                                   API                                      *
171  *============================================================================*/
172
173 /**
174  * @addtogroup Eina_String_Group String
175  *
176  * @brief These functions provide useful C string management.
177  *
178  * @{
179  */
180
181
182 /**
183  * @brief Copy a c-string to another.
184  *
185  * @param dst The destination string.
186  * @param src The source string.
187  * @param siz The size of the destination string.
188  * @return The length of the source string.
189  *
190  * This function copies up to @p siz - 1 characters from the
191  * NUL-terminated string @p src to @p dst, NUL-terminating the result
192  * (unless @p siz is equal to 0). The returned value is the length of
193  * @p src. If the returned value is greater than @p siz, truncation
194  * occured.
195  */
196 EAPI size_t
197 eina_strlcpy(char *dst, const char *src, size_t siz)
198 {
199 #ifdef HAVE_STRLCPY
200    return strlcpy(dst, src, siz);
201 #else
202    char *d = dst;
203    const char *s = src;
204    size_t n = siz;
205
206    /* Copy as many bytes as will fit */
207    if (n != 0)
208      {
209         while (--n != 0)
210           {
211              if ((*d++ = *s++) == '\0')
212                break;
213           }
214      }
215
216    /* Not enough room in dst, add NUL and traverse rest of src */
217    if (n == 0)
218      {
219         if (siz != 0)
220           *d = '\0';                /* NUL-terminate dst */
221         while (*s++)
222           ;
223      }
224
225    return(s - src - 1);        /* count does not include NUL */
226 #endif
227 }
228
229 /**
230  * @brief Append a c-string.
231  *
232  * @param dst The destination string.
233  * @param src The source string.
234  * @param siz The size of the destination string.
235  * @return The length of the source string plus MIN(siz, strlen(initial dst))
236  *
237  * This function appends @p src to @p dst of size @p siz (unlike
238  * strncat, @p siz is the full size of @p dst, not space left).  At
239  * most @p siz - 1 characters will be copied.  Always NUL terminates
240  * (unless @p siz <= strlen(dst)). This function returns strlen(src) +
241  * MIN(siz, strlen(initial dst)). If the returned value is greater or
242  * equal than @p siz, truncation occurred.
243  */
244 EAPI size_t
245 eina_strlcat(char *dst, const char *src, size_t siz)
246 {
247    char *d = dst;
248    const char *s = src;
249    size_t n = siz;
250    size_t dlen;
251
252    /* Find the end of dst and adjust bytes left but don't go past end */
253    while (n-- != 0 && *d != '\0')
254      d++;
255    dlen = d - dst;
256    n = siz - dlen;
257
258    if (n == 0)
259      return(dlen + strlen(s));
260    while (*s != '\0') {
261         if (n != 1) {
262              *d++ = *s;
263              n--;
264         }
265         s++;
266    }
267    *d = '\0';
268
269    return(dlen + (s - src));        /* count does not include NUL */
270 }
271
272 /**
273  * @brief Check if the given string has the given prefix.
274  *
275  * @param str The string to work with.
276  * @param prefix The prefix to check for.
277  * @return #EINA_TRUE if the string has the given prefix, #EINA_FALSE otherwise.
278  *
279  * This function returns #EINA_TRUE if @p str has the prefix
280  * @p prefix, #EINA_FALSE otherwise. If the length of @p prefix is
281  * greater than @p str, #EINA_FALSE is returned.
282  */
283 EAPI Eina_Bool
284 eina_str_has_prefix(const char *str, const char *prefix)
285 {
286    size_t str_len;
287    size_t prefix_len;
288
289    str_len = strlen(str);
290    prefix_len = eina_strlen_bounded(prefix, str_len);
291    if (prefix_len == (size_t)-1)
292      return EINA_FALSE;
293
294    return (strncmp(str, prefix, prefix_len) == 0);
295 }
296
297 /**
298  * @brief Check if the given string has the given suffix.
299  *
300  * @param str The string to work with.
301  * @param suffix The suffix to check for.
302  * @return #EINA_TRUE if the string has the given suffix, #EINA_FALSE otherwise.
303  *
304  * This function returns #EINA_TRUE if @p str has the suffix
305  * @p suffix, #EINA_FALSE otherwise. If the length of @p suffix is
306  * greater than @p str, #EINA_FALSE is returned.
307  */
308 /**
309  * @param str the string to work with
310  * @param suffix the suffix to check for
311  * @return true if str has the given suffix
312  * @brief checks if the string has the given suffix
313  */
314 EAPI Eina_Bool
315 eina_str_has_suffix(const char *str, const char *suffix)
316 {
317    return eina_str_has_suffix_helper(str, suffix, strcmp);
318 }
319
320 /**
321  * @brief Check if the given string has the given suffix.
322  *
323  * @param str The string to work with.
324  * @param ext The  extension to check for.
325  * @return #EINA_TRUE if the string has the given extension, #EINA_FALSE otherwise.
326  *
327  * This function does the same like eina_str_has_suffix(), but with a
328  * case insensitive compare.
329  */
330 EAPI Eina_Bool
331 eina_str_has_extension(const char *str, const char *ext)
332 {
333    return eina_str_has_suffix_helper(str, ext, strcasecmp);
334 }
335
336 /**
337  * @brief Split a string using a delimiter and returns number of elements.
338  *
339  * @param str The string to split.
340  * @param delim The string which specifies the places at which to split the string.
341  * @param max_tokens The maximum number of strings to split string into.
342  * @param elements Where to return the number of elements in returned
343  *        array (not counting the terminating @c NULL). May be @c NULL.
344  * @return A newly-allocated NULL-terminated array of strings.
345  *
346  * This functin splits @p str into a maximum of @p max_tokens pieces,
347  * using the given delimiter @p delim. @p delim is not included in any
348  * of the resulting strings, unless @p max_tokens is reached. If
349  * @p max_tokens is less than @c 1, the string is splitted completely. If
350  * @p max_tokens is reached, the last string in the returned string
351  * array contains the remainder of string. The returned value is a
352  * newly allocated NUL-terminated array of string. To free it, free
353  * the first element of the array and the array itself.
354  *
355  * @see eina_str_split()
356  */
357 EAPI char **
358 eina_str_split_full(const char *str, const char *delim, int max_tokens, unsigned int *elements)
359 {
360    return eina_str_split_full_helper(str, delim, max_tokens, elements);
361 }
362
363
364 /**
365  * @brief Split a string using a delimiter.
366  *
367  * @param str The string to split.
368  * @param delim The string which specifies the places at which to split the string.
369  * @param max_tokens The maximum number of strings to split string into.
370  * @return A newly-allocated NULL-terminated array of strings.
371  *
372  * This functin splits @p str into a maximum of @p max_tokens pieces,
373  * using the given delimiter @p delim. @p delim is not included in any
374  * of the resulting strings, unless @p max_tokens is reached. If
375  * @p max_tokens is less than @c 1, the string is splitted completely. If
376  * @p max_tokens is reached, the last string in the returned string
377  * array contains the remainder of string. The returned value is a
378  * newly allocated NUL-terminated array of string. To free it, free
379  * the first element of the array and the array itself.
380  */
381 EAPI char **
382 eina_str_split(const char *str, const char *delim, int max_tokens)
383 {
384    return eina_str_split_full_helper(str, delim, max_tokens, NULL);
385 }
386
387 /**
388  * @brief Join two strings of known length.
389  *
390  * @param dst The buffer to store the result.
391  * @param size Size (in byte) of the buffer.
392  * @param sep The separator character to use.
393  * @param a First string to use, before @p sep.
394  * @param a_len length of @p a.
395  * @param b Second string to use, after @p sep.
396  * @param b_len length of @p b.
397  * @return The number of characters printed.
398  *
399  * This function joins the strings @p a and @p b (in that order) and
400  * separate them with @p sep. The result is stored in the buffer
401  * @p dst and at most @p size - 1 characters will be written and the
402  * string is NULL-terminated. @p a_len is the length of @p a (not
403  * including '\\0') and @p b_len is the length of @p b (not including
404  * '\\0'). This function returns the number of characters printed (not
405  * including the trailing '\\0' used to end output to strings). Just
406  * like snprintf(), it will not write more than @p size bytes, thus a
407  * returned value of @p size or more means that the output was
408  * truncated.
409  *
410  * @see eina_str_join()
411  * @see eina_str_join_static()
412  */
413 EAPI size_t
414 eina_str_join_len(char *dst, size_t size, char sep, const char *a, size_t a_len, const char *b, size_t b_len)
415 {
416    size_t ret = a_len + b_len + 1;
417    size_t off;
418
419    if (size < 1) return ret;
420
421    if (size <= a_len)
422      {
423         memcpy(dst, a, size - 1);
424         dst[size - 1] = '\0';
425         return ret;
426      }
427
428    memcpy(dst, a, a_len);
429    off = a_len;
430
431    if (size <= off + 1)
432      {
433         dst[size - 1] = '\0';
434         return ret;
435      }
436
437    dst[off] = sep;
438    off++;
439
440    if (size <= off + b_len + 1)
441      {
442         memcpy(dst + off, b, size - off - 1);
443         dst[size - 1] = '\0';
444         return ret;
445      }
446
447    memcpy(dst + off, b, b_len);
448    dst[off + b_len] = '\0';
449    return ret;
450 }
451
452 /**
453  * @brief Use iconv to convert a text string from one encoding to another
454  *
455  * @param enc_from encoding to convert from
456  * @param enc_to   encoding to convert to
457  * @param text     text to convert
458  *
459  */
460 #ifdef HAVE_ICONV
461 EAPI char *
462 eina_str_convert(const char *enc_from, const char *enc_to, const char *text)
463 {
464    iconv_t ic;
465    char *new_txt, *inp, *outp;
466    size_t inb, outb, outlen, tob, outalloc;
467
468    if (!text) return NULL;
469    ic = iconv_open(enc_to, enc_from);
470    if (ic == (iconv_t)(-1)) return NULL;
471    new_txt  = malloc(64);
472    inb      = strlen(text);
473    outb     = 64;
474    inp      = (char*)text;
475    outp     = new_txt;
476    outalloc = 64;
477    outlen   = 0;
478
479    for (;;)
480      {
481         size_t count;
482
483         tob = outb;
484         count = iconv(ic, &inp, &inb, &outp, &outb);
485         outlen += tob - outb;
486         if (count == (size_t)(-1))
487           {
488              if (errno == E2BIG)
489                {
490                   new_txt = realloc(new_txt, outalloc + 64);
491                   outp = new_txt + outlen;
492                   outalloc += 64;
493                   outb += 64;
494                }
495              else if (errno == EILSEQ)
496                {
497                   if (new_txt) free(new_txt);
498                   new_txt = NULL;
499                   break;
500                }
501              else if (errno == EINVAL)
502                {
503                   if (new_txt) free(new_txt);
504                   new_txt = NULL;
505                   break;
506                }
507              else
508                {
509                   if (new_txt) free(new_txt);
510                   new_txt = NULL;
511                   break;
512                }
513           }
514         if (inb == 0)
515           {
516              if (outalloc == outlen) new_txt = realloc(new_txt, outalloc + 1);
517              new_txt[outlen] = 0;
518              break;
519           }
520      }
521    iconv_close(ic);
522    return new_txt;
523 }
524 #else
525 EAPI char *
526 eina_str_convert(const char *enc_from __UNUSED__, const char *enc_to __UNUSED__, const char *text __UNUSED__)
527 {
528    return NULL;
529 }
530 #endif
531
532 /**
533  * @brief Put a \ before and Space( ), \ or ' in a string.
534  *
535  * @param str the string to escape
536  *
537  * A newly allocated string is returned.
538  */
539 EAPI char *
540 eina_str_escape(const char *str)
541 {
542    char *s2, *d;
543    const char *s;
544
545    s2 = malloc((strlen(str) * 2) + 1);
546    if (!s2) return NULL;
547    for (s = str, d = s2; *s != 0; s++, d++)
548      {
549         if ((*s == ' ') || (*s == '\\') || (*s == '\''))
550           {
551              *d = '\\';
552              d++;
553           }
554         *d = *s;
555      }
556    *d = 0;
557    return s2;
558 }
559
560 /**
561  * @}
562  */