DBusMessage: always access refcount atomically, even for assertions/initial ref
[platform/upstream/dbus.git] / dbus / dbus-string.c
1 /* -*- mode: C; c-file-style: "gnu"; indent-tabs-mode: nil; -*- */
2 /* dbus-string.c String utility class (internal to D-Bus implementation)
3  * 
4  * Copyright (C) 2002, 2003, 2004, 2005 Red Hat, Inc.
5  * Copyright (C) 2006 Ralf Habacker <ralf.habacker@freenet.de>
6  *
7  * Licensed under the Academic Free License version 2.1
8  * 
9  * This program is free software; you can redistribute it and/or modify
10  * it under the terms of the GNU General Public License as published by
11  * the Free Software Foundation; either version 2 of the License, or
12  * (at your option) any later version.
13  *
14  * This program is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17  * GNU General Public License for more details.
18  * 
19  * You should have received a copy of the GNU General Public License
20  * along with this program; if not, write to the Free Software
21  * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA
22  *
23  */
24
25 #include <config.h>
26 #include "dbus-internals.h"
27 #include "dbus-string.h"
28 /* we allow a system header here, for speed/convenience */
29 #include <string.h>
30 /* for vsnprintf */
31 #include <stdio.h>
32 #define DBUS_CAN_USE_DBUS_STRING_PRIVATE 1
33 #include "dbus-string-private.h"
34 #include "dbus-marshal-basic.h" /* probably should be removed by moving the usage of DBUS_TYPE
35                                  * into the marshaling-related files
36                                  */
37 /* for DBUS_VA_COPY */
38 #include "dbus-sysdeps.h"
39
40 /**
41  * @defgroup DBusString DBusString class
42  * @ingroup  DBusInternals
43  * @brief DBusString data structure for safer string handling
44  *
45  * Types and functions related to DBusString. DBusString is intended
46  * to be a string class that makes it hard to mess up security issues
47  * (and just in general harder to write buggy code).  It should be
48  * used (or extended and then used) rather than the libc stuff in
49  * string.h.  The string class is a bit inconvenient at spots because
50  * it handles out-of-memory failures and tries to be extra-robust.
51  * 
52  * A DBusString has a maximum length set at initialization time; this
53  * can be used to ensure that a buffer doesn't get too big.  The
54  * _dbus_string_lengthen() method checks for overflow, and for max
55  * length being exceeded.
56  * 
57  * Try to avoid conversion to a plain C string, i.e. add methods on
58  * the string object instead, only convert to C string when passing
59  * things out to the public API. In particular, no sprintf, strcpy,
60  * strcat, any of that should be used. The GString feature of
61  * accepting negative numbers for "length of string" is also absent,
62  * because it could keep us from detecting bogus huge lengths. i.e. if
63  * we passed in some bogus huge length it would be taken to mean
64  * "current length of string" instead of "broken crack"
65  *
66  * @todo #DBusString needs a lot of cleaning up; some of the
67  * API is no longer used, and the API is pretty inconsistent.
68  * In particular all the "append" APIs, especially those involving
69  * alignment but probably lots of them, are no longer used by the
70  * marshaling code which always does "inserts" now.
71  */
72
73 /**
74  * @addtogroup DBusString
75  * @{
76  */
77
78 static void
79 fixup_alignment (DBusRealString *real)
80 {
81   unsigned char *aligned;
82   unsigned char *real_block;
83   unsigned int old_align_offset;
84
85   /* we have to have extra space in real->allocated for the align offset and nul byte */
86   _dbus_assert (real->len <= real->allocated - _DBUS_STRING_ALLOCATION_PADDING);
87   
88   old_align_offset = real->align_offset;
89   real_block = real->str - old_align_offset;
90   
91   aligned = _DBUS_ALIGN_ADDRESS (real_block, 8);
92
93   real->align_offset = aligned - real_block;
94   real->str = aligned;
95   
96   if (old_align_offset != real->align_offset)
97     {
98       /* Here comes the suck */
99       memmove (real_block + real->align_offset,
100                real_block + old_align_offset,
101                real->len + 1);
102     }
103
104   _dbus_assert (real->align_offset < 8);
105   _dbus_assert (_DBUS_ALIGN_ADDRESS (real->str, 8) == real->str);
106 }
107
108 static void
109 undo_alignment (DBusRealString *real)
110 {
111   if (real->align_offset != 0)
112     {
113       memmove (real->str - real->align_offset,
114                real->str,
115                real->len + 1);
116
117       real->str = real->str - real->align_offset;
118       real->align_offset = 0;
119     }
120 }
121
122 /**
123  * Initializes a string that can be up to the given allocation size
124  * before it has to realloc. The string starts life with zero length.
125  * The string must eventually be freed with _dbus_string_free().
126  * 
127  * @param str memory to hold the string
128  * @param allocate_size amount to preallocate
129  * @returns #TRUE on success, #FALSE if no memory
130  */
131 dbus_bool_t
132 _dbus_string_init_preallocated (DBusString *str,
133                                 int         allocate_size)
134 {
135   DBusRealString *real;
136   
137   _dbus_assert (str != NULL);
138
139   _dbus_assert (sizeof (DBusString) == sizeof (DBusRealString));
140   
141   real = (DBusRealString*) str;
142
143   /* It's very important not to touch anything
144    * other than real->str if we're going to fail,
145    * since we also use this function to reset
146    * an existing string, e.g. in _dbus_string_steal_data()
147    */
148   
149   real->str = dbus_malloc (_DBUS_STRING_ALLOCATION_PADDING + allocate_size);
150   if (real->str == NULL)
151     return FALSE;  
152   
153   real->allocated = _DBUS_STRING_ALLOCATION_PADDING + allocate_size;
154   real->len = 0;
155   real->str[real->len] = '\0';
156   
157   real->max_length = _DBUS_STRING_MAX_MAX_LENGTH;
158   real->constant = FALSE;
159   real->locked = FALSE;
160   real->invalid = FALSE;
161   real->align_offset = 0;
162   
163   fixup_alignment (real);
164   
165   return TRUE;
166 }
167
168 /**
169  * Initializes a string. The string starts life with zero length.  The
170  * string must eventually be freed with _dbus_string_free().
171  * 
172  * @param str memory to hold the string
173  * @returns #TRUE on success, #FALSE if no memory
174  */
175 dbus_bool_t
176 _dbus_string_init (DBusString *str)
177 {
178   return _dbus_string_init_preallocated (str, 0);
179 }
180
181 #ifdef DBUS_BUILD_TESTS
182 /* The max length thing is sort of a historical artifact
183  * from a feature that turned out to be dumb; perhaps
184  * we should purge it entirely. The problem with
185  * the feature is that it looks like memory allocation
186  * failure, but is not a transient or resolvable failure.
187  */
188 static void
189 set_max_length (DBusString *str,
190                 int         max_length)
191 {
192   DBusRealString *real;
193   
194   real = (DBusRealString*) str;
195
196   real->max_length = max_length;
197 }
198 #endif /* DBUS_BUILD_TESTS */
199
200 /**
201  * Initializes a constant string. The value parameter is not copied
202  * (should be static), and the string may never be modified.
203  * It is safe but not necessary to call _dbus_string_free()
204  * on a const string. The string has a length limit of MAXINT - 8.
205  * 
206  * @param str memory to use for the string
207  * @param value a string to be stored in str (not copied!!!)
208  */
209 void
210 _dbus_string_init_const (DBusString *str,
211                          const char *value)
212 {
213   _dbus_assert (value != NULL);
214   
215   _dbus_string_init_const_len (str, value,
216                                strlen (value));
217 }
218
219 /**
220  * Initializes a constant string with a length. The value parameter is
221  * not copied (should be static), and the string may never be
222  * modified.  It is safe but not necessary to call _dbus_string_free()
223  * on a const string.
224  * 
225  * @param str memory to use for the string
226  * @param value a string to be stored in str (not copied!!!)
227  * @param len the length to use
228  */
229 void
230 _dbus_string_init_const_len (DBusString *str,
231                              const char *value,
232                              int         len)
233 {
234   DBusRealString *real;
235   
236   _dbus_assert (str != NULL);
237   _dbus_assert (len == 0 || value != NULL);
238   _dbus_assert (len <= _DBUS_STRING_MAX_MAX_LENGTH);
239   _dbus_assert (len >= 0);
240   
241   real = (DBusRealString*) str;
242   
243   real->str = (unsigned char*) value;
244   real->len = len;
245   real->allocated = real->len + _DBUS_STRING_ALLOCATION_PADDING; /* a lie, just to avoid special-case assertions... */
246   real->max_length = real->len + 1;
247   real->constant = TRUE;
248   real->locked = TRUE;
249   real->invalid = FALSE;
250   real->align_offset = 0;
251
252   /* We don't require const strings to be 8-byte aligned as the
253    * memory is coming from elsewhere.
254    */
255 }
256
257 /**
258  * Frees a string created by _dbus_string_init().
259  *
260  * @param str memory where the string is stored.
261  */
262 void
263 _dbus_string_free (DBusString *str)
264 {
265   DBusRealString *real = (DBusRealString*) str;
266   DBUS_GENERIC_STRING_PREAMBLE (real);
267   
268   if (real->constant)
269     return;
270   dbus_free (real->str - real->align_offset);
271
272   real->invalid = TRUE;
273 }
274
275 static dbus_bool_t
276 compact (DBusRealString *real,
277          int             max_waste)
278 {
279   unsigned char *new_str;
280   int new_allocated;
281   int waste;
282
283   waste = real->allocated - (real->len + _DBUS_STRING_ALLOCATION_PADDING);
284
285   if (waste <= max_waste)
286     return TRUE;
287
288   new_allocated = real->len + _DBUS_STRING_ALLOCATION_PADDING;
289
290   new_str = dbus_realloc (real->str - real->align_offset, new_allocated);
291   if (_DBUS_UNLIKELY (new_str == NULL))
292     return FALSE;
293
294   real->str = new_str + real->align_offset;
295   real->allocated = new_allocated;
296   fixup_alignment (real);
297
298   return TRUE;
299 }
300
301 #ifdef DBUS_BUILD_TESTS
302 /* Not using this feature at the moment,
303  * so marked DBUS_BUILD_TESTS-only
304  */
305 /**
306  * Locks a string such that any attempts to change the string will
307  * result in aborting the program. Also, if the string is wasting a
308  * lot of memory (allocation is sufficiently larger than what the
309  * string is really using), _dbus_string_lock() will realloc the
310  * string's data to "compact" it.
311  *
312  * @param str the string to lock.
313  */
314 void
315 _dbus_string_lock (DBusString *str)
316 {  
317   DBUS_LOCKED_STRING_PREAMBLE (str); /* can lock multiple times */
318
319   real->locked = TRUE;
320
321   /* Try to realloc to avoid excess memory usage, since
322    * we know we won't change the string further
323    */
324 #define MAX_WASTE 48
325   compact (real, MAX_WASTE);
326 }
327 #endif /* DBUS_BUILD_TESTS */
328
329 static dbus_bool_t
330 reallocate_for_length (DBusRealString *real,
331                        int             new_length)
332 {
333   int new_allocated;
334   unsigned char *new_str;
335
336   /* at least double our old allocation to avoid O(n), avoiding
337    * overflow
338    */
339   if (real->allocated > (_DBUS_STRING_MAX_MAX_LENGTH + _DBUS_STRING_ALLOCATION_PADDING) / 2)
340     new_allocated = _DBUS_STRING_MAX_MAX_LENGTH + _DBUS_STRING_ALLOCATION_PADDING;
341   else
342     new_allocated = real->allocated * 2;
343
344   /* if you change the code just above here, run the tests without
345    * the following assert-only hack before you commit
346    */
347   /* This is keyed off asserts in addition to tests so when you
348    * disable asserts to profile, you don't get this destroyer
349    * of profiles.
350    */
351 #ifdef DBUS_DISABLE_ASSERT
352 #else
353 #ifdef DBUS_BUILD_TESTS
354   new_allocated = 0; /* ensure a realloc every time so that we go
355                       * through all malloc failure codepaths
356                       */
357 #endif /* DBUS_BUILD_TESTS */
358 #endif /* !DBUS_DISABLE_ASSERT */
359
360   /* But be sure we always alloc at least space for the new length */
361   new_allocated = MAX (new_allocated,
362                        new_length + _DBUS_STRING_ALLOCATION_PADDING);
363
364   _dbus_assert (new_allocated >= real->allocated); /* code relies on this */
365   new_str = dbus_realloc (real->str - real->align_offset, new_allocated);
366   if (_DBUS_UNLIKELY (new_str == NULL))
367     return FALSE;
368
369   real->str = new_str + real->align_offset;
370   real->allocated = new_allocated;
371   fixup_alignment (real);
372
373   return TRUE;
374 }
375
376 /**
377  * Compacts the string to avoid wasted memory.  Wasted memory is
378  * memory that is allocated but not actually required to store the
379  * current length of the string.  The compact is only done if more
380  * than the given amount of memory is being wasted (otherwise the
381  * waste is ignored and the call does nothing).
382  *
383  * @param str the string
384  * @param max_waste the maximum amount of waste to ignore
385  * @returns #FALSE if the compact failed due to realloc failure
386  */
387 dbus_bool_t
388 _dbus_string_compact (DBusString *str,
389                       int         max_waste)
390 {
391   DBUS_STRING_PREAMBLE (str);
392
393   return compact (real, max_waste);
394 }
395
396 static dbus_bool_t
397 set_length (DBusRealString *real,
398             int             new_length)
399 {
400   /* Note, we are setting the length not including nul termination */
401
402   /* exceeding max length is the same as failure to allocate memory */
403   if (_DBUS_UNLIKELY (new_length > real->max_length))
404     return FALSE;
405   else if (new_length > (real->allocated - _DBUS_STRING_ALLOCATION_PADDING) &&
406            _DBUS_UNLIKELY (!reallocate_for_length (real, new_length)))
407     return FALSE;
408   else
409     {
410       real->len = new_length;
411       real->str[new_length] = '\0';
412       return TRUE;
413     }
414 }
415
416 static dbus_bool_t
417 open_gap (int             len,
418           DBusRealString *dest,
419           int             insert_at)
420 {
421   if (len == 0)
422     return TRUE;
423
424   if (len > dest->max_length - dest->len)
425     return FALSE; /* detected overflow of dest->len + len below */
426   
427   if (!set_length (dest, dest->len + len))
428     return FALSE;
429
430   memmove (dest->str + insert_at + len, 
431            dest->str + insert_at,
432            dest->len - len - insert_at);
433
434   return TRUE;
435 }
436
437 #ifndef _dbus_string_get_data
438 /**
439  * Gets the raw character buffer from the string.  The returned buffer
440  * will be nul-terminated, but note that strings may contain binary
441  * data so there may be extra nul characters prior to the termination.
442  * This function should be little-used, extend DBusString or add
443  * stuff to dbus-sysdeps.c instead. It's an error to use this
444  * function on a const string.
445  *
446  * @param str the string
447  * @returns the data
448  */
449 char*
450 _dbus_string_get_data (DBusString *str)
451 {
452   DBUS_STRING_PREAMBLE (str);
453   
454   return (char*) real->str;
455 }
456 #endif /* _dbus_string_get_data */
457
458 /* only do the function if we don't have the macro */
459 #ifndef _dbus_string_get_const_data
460 /**
461  * Gets the raw character buffer from a const string.
462  *
463  * @param str the string
464  * @returns the string data
465  */
466 const char*
467 _dbus_string_get_const_data (const DBusString  *str)
468 {
469   DBUS_CONST_STRING_PREAMBLE (str);
470   
471   return (const char*) real->str;
472 }
473 #endif /* _dbus_string_get_const_data */
474
475 /**
476  * Gets a sub-portion of the raw character buffer from the
477  * string. The "len" field is required simply for error
478  * checking, to be sure you don't try to use more
479  * string than exists. The nul termination of the
480  * returned buffer remains at the end of the entire
481  * string, not at start + len.
482  *
483  * @param str the string
484  * @param start byte offset to return
485  * @param len length of segment to return
486  * @returns the string data
487  */
488 char*
489 _dbus_string_get_data_len (DBusString *str,
490                            int         start,
491                            int         len)
492 {
493   DBUS_STRING_PREAMBLE (str);
494   _dbus_assert (start >= 0);
495   _dbus_assert (len >= 0);
496   _dbus_assert (start <= real->len);
497   _dbus_assert (len <= real->len - start);
498   
499   return (char*) real->str + start;
500 }
501
502 /* only do the function if we don't have the macro */
503 #ifndef _dbus_string_get_const_data_len
504 /**
505  * const version of _dbus_string_get_data_len().
506  *
507  * @param str the string
508  * @param start byte offset to return
509  * @param len length of segment to return
510  * @returns the string data
511  */
512 const char*
513 _dbus_string_get_const_data_len (const DBusString  *str,
514                                  int                start,
515                                  int                len)
516 {
517   DBUS_CONST_STRING_PREAMBLE (str);
518   _dbus_assert (start >= 0);
519   _dbus_assert (len >= 0);
520   _dbus_assert (start <= real->len);
521   _dbus_assert (len <= real->len - start);
522   
523   return (const char*) real->str + start;
524 }
525 #endif /* _dbus_string_get_const_data_len */
526
527 /* only do the function if we don't have the macro */
528 #ifndef _dbus_string_set_byte
529 /**
530  * Sets the value of the byte at the given position.
531  *
532  * @param str the string
533  * @param i the position
534  * @param byte the new value
535  */
536 void
537 _dbus_string_set_byte (DBusString    *str,
538                        int            i,
539                        unsigned char  byte)
540 {
541   DBUS_STRING_PREAMBLE (str);
542   _dbus_assert (i < real->len);
543   _dbus_assert (i >= 0);
544   
545   real->str[i] = byte;
546 }
547 #endif /* _dbus_string_set_byte */
548
549 /* only have the function if we didn't create a macro */
550 #ifndef _dbus_string_get_byte
551 /**
552  * Gets the byte at the given position. It is
553  * allowed to ask for the nul byte at the end of
554  * the string.
555  *
556  * @param str the string
557  * @param start the position
558  * @returns the byte at that position
559  */
560 unsigned char
561 _dbus_string_get_byte (const DBusString  *str,
562                        int                start)
563 {
564   DBUS_CONST_STRING_PREAMBLE (str);
565   _dbus_assert (start <= real->len);
566   _dbus_assert (start >= 0);
567   
568   return real->str[start];
569 }
570 #endif /* _dbus_string_get_byte */
571
572 /**
573  * Inserts a number of bytes of a given value at the
574  * given position.
575  *
576  * @param str the string
577  * @param i the position
578  * @param n_bytes number of bytes
579  * @param byte the value to insert
580  * @returns #TRUE on success
581  */
582 dbus_bool_t
583 _dbus_string_insert_bytes (DBusString   *str,
584                            int           i,
585                            int           n_bytes,
586                            unsigned char byte)
587 {
588   DBUS_STRING_PREAMBLE (str);
589   _dbus_assert (i <= real->len);
590   _dbus_assert (i >= 0);
591   _dbus_assert (n_bytes >= 0);
592
593   if (n_bytes == 0)
594     return TRUE;
595   
596   if (!open_gap (n_bytes, real, i))
597     return FALSE;
598   
599   memset (real->str + i, byte, n_bytes);
600
601   return TRUE;
602 }
603
604 /**
605  * Inserts a single byte at the given position.
606  *
607  * @param str the string
608  * @param i the position
609  * @param byte the value to insert
610  * @returns #TRUE on success
611  */
612 dbus_bool_t
613 _dbus_string_insert_byte (DBusString   *str,
614                            int           i,
615                            unsigned char byte)
616 {
617   DBUS_STRING_PREAMBLE (str);
618   _dbus_assert (i <= real->len);
619   _dbus_assert (i >= 0);
620   
621   if (!open_gap (1, real, i))
622     return FALSE;
623
624   real->str[i] = byte;
625
626   return TRUE;
627 }
628
629 /**
630  * Like _dbus_string_get_data(), but removes the
631  * gotten data from the original string. The caller
632  * must free the data returned. This function may
633  * fail due to lack of memory, and return #FALSE.
634  *
635  * @param str the string
636  * @param data_return location to return the buffer
637  * @returns #TRUE on success
638  */
639 dbus_bool_t
640 _dbus_string_steal_data (DBusString        *str,
641                          char             **data_return)
642 {
643   int old_max_length;
644   DBUS_STRING_PREAMBLE (str);
645   _dbus_assert (data_return != NULL);
646
647   undo_alignment (real);
648   
649   *data_return = (char*) real->str;
650
651   old_max_length = real->max_length;
652   
653   /* reset the string */
654   if (!_dbus_string_init (str))
655     {
656       /* hrm, put it back then */
657       real->str = (unsigned char*) *data_return;
658       *data_return = NULL;
659       fixup_alignment (real);
660       return FALSE;
661     }
662
663   real->max_length = old_max_length;
664
665   return TRUE;
666 }
667
668 #ifdef DBUS_BUILD_TESTS
669 /**
670  * Like _dbus_string_get_data_len(), but removes the gotten data from
671  * the original string. The caller must free the data returned. This
672  * function may fail due to lack of memory, and return #FALSE.
673  * The returned string is nul-terminated and has length len.
674  *
675  * @todo this function is broken because on failure it
676  * may corrupt the source string.
677  * 
678  * @param str the string
679  * @param data_return location to return the buffer
680  * @param start the start of segment to steal
681  * @param len the length of segment to steal
682  * @returns #TRUE on success
683  */
684 dbus_bool_t
685 _dbus_string_steal_data_len (DBusString        *str,
686                              char             **data_return,
687                              int                start,
688                              int                len)
689 {
690   DBusString dest;
691   DBUS_STRING_PREAMBLE (str);
692   _dbus_assert (data_return != NULL);
693   _dbus_assert (start >= 0);
694   _dbus_assert (len >= 0);
695   _dbus_assert (start <= real->len);
696   _dbus_assert (len <= real->len - start);
697
698   if (!_dbus_string_init (&dest))
699     return FALSE;
700
701   set_max_length (&dest, real->max_length);
702   
703   if (!_dbus_string_move_len (str, start, len, &dest, 0))
704     {
705       _dbus_string_free (&dest);
706       return FALSE;
707     }
708
709   _dbus_warn ("Broken code in _dbus_string_steal_data_len(), see @todo, FIXME\n");
710   if (!_dbus_string_steal_data (&dest, data_return))
711     {
712       _dbus_string_free (&dest);
713       return FALSE;
714     }
715
716   _dbus_string_free (&dest);
717   return TRUE;
718 }
719 #endif /* DBUS_BUILD_TESTS */
720
721 /**
722  * Copies the data from the string into a char*
723  *
724  * @param str the string
725  * @param data_return place to return the data
726  * @returns #TRUE on success, #FALSE on no memory
727  */
728 dbus_bool_t
729 _dbus_string_copy_data (const DBusString  *str,
730                         char             **data_return)
731 {
732   DBUS_CONST_STRING_PREAMBLE (str);
733   _dbus_assert (data_return != NULL);
734   
735   *data_return = dbus_malloc (real->len + 1);
736   if (*data_return == NULL)
737     return FALSE;
738
739   memcpy (*data_return, real->str, real->len + 1);
740
741   return TRUE;
742 }
743
744 /**
745  * Copies the contents of a DBusString into a different buffer. It is
746  * a bug if avail_len is too short to hold the string contents. nul
747  * termination is not copied, just the supplied bytes.
748  * 
749  * @param str a string
750  * @param buffer a C buffer to copy data to
751  * @param avail_len maximum length of C buffer
752  */
753 void
754 _dbus_string_copy_to_buffer (const DBusString  *str,
755                              char              *buffer,
756                              int                avail_len)
757 {
758   DBUS_CONST_STRING_PREAMBLE (str);
759
760   _dbus_assert (avail_len >= 0);
761   _dbus_assert (avail_len >= real->len);
762   
763   memcpy (buffer, real->str, real->len);
764 }
765
766 /**
767  * Copies the contents of a DBusString into a different buffer. It is
768  * a bug if avail_len is too short to hold the string contents plus a
769  * nul byte. 
770  * 
771  * @param str a string
772  * @param buffer a C buffer to copy data to
773  * @param avail_len maximum length of C buffer
774  */
775 void
776 _dbus_string_copy_to_buffer_with_nul (const DBusString  *str,
777                                       char              *buffer,
778                                       int                avail_len)
779 {
780   DBUS_CONST_STRING_PREAMBLE (str);
781
782   _dbus_assert (avail_len >= 0);
783   _dbus_assert (avail_len > real->len);
784   
785   memcpy (buffer, real->str, real->len+1);
786 }
787
788 #ifdef DBUS_BUILD_TESTS
789 /**
790  * Copies a segment of the string into a char*
791  *
792  * @param str the string
793  * @param data_return place to return the data
794  * @param start start index
795  * @param len length to copy
796  * @returns #FALSE if no memory
797  */
798 dbus_bool_t
799 _dbus_string_copy_data_len (const DBusString  *str,
800                             char             **data_return,
801                             int                start,
802                             int                len)
803 {
804   DBusString dest;
805
806   DBUS_CONST_STRING_PREAMBLE (str);
807   _dbus_assert (data_return != NULL);
808   _dbus_assert (start >= 0);
809   _dbus_assert (len >= 0);
810   _dbus_assert (start <= real->len);
811   _dbus_assert (len <= real->len - start);
812
813   if (!_dbus_string_init (&dest))
814     return FALSE;
815
816   set_max_length (&dest, real->max_length);
817
818   if (!_dbus_string_copy_len (str, start, len, &dest, 0))
819     {
820       _dbus_string_free (&dest);
821       return FALSE;
822     }
823
824   if (!_dbus_string_steal_data (&dest, data_return))
825     {
826       _dbus_string_free (&dest);
827       return FALSE;
828     }
829
830   _dbus_string_free (&dest);
831   return TRUE;
832 }
833 #endif /* DBUS_BUILD_TESTS */
834
835 /* Only have the function if we don't have the macro */
836 #ifndef _dbus_string_get_length
837 /**
838  * Gets the length of a string (not including nul termination).
839  *
840  * @returns the length.
841  */
842 int
843 _dbus_string_get_length (const DBusString  *str)
844 {
845   DBUS_CONST_STRING_PREAMBLE (str);
846   
847   return real->len;
848 }
849 #endif /* !_dbus_string_get_length */
850
851 /**
852  * Makes a string longer by the given number of bytes.  Checks whether
853  * adding additional_length to the current length would overflow an
854  * integer, and checks for exceeding a string's max length.
855  * The new bytes are not initialized, other than nul-terminating
856  * the end of the string. The uninitialized bytes may contain
857  * nul bytes or other junk.
858  *
859  * @param str a string
860  * @param additional_length length to add to the string.
861  * @returns #TRUE on success.
862  */
863 dbus_bool_t
864 _dbus_string_lengthen (DBusString *str,
865                        int         additional_length)
866 {
867   DBUS_STRING_PREAMBLE (str);  
868   _dbus_assert (additional_length >= 0);
869
870   if (_DBUS_UNLIKELY (additional_length > real->max_length - real->len))
871     return FALSE; /* would overflow */
872   
873   return set_length (real,
874                      real->len + additional_length);
875 }
876
877 /**
878  * Makes a string shorter by the given number of bytes.
879  *
880  * @param str a string
881  * @param length_to_remove length to remove from the string.
882  */
883 void
884 _dbus_string_shorten (DBusString *str,
885                       int         length_to_remove)
886 {
887   DBUS_STRING_PREAMBLE (str);
888   _dbus_assert (length_to_remove >= 0);
889   _dbus_assert (length_to_remove <= real->len);
890
891   set_length (real,
892               real->len - length_to_remove);
893 }
894
895 /**
896  * Sets the length of a string. Can be used to truncate or lengthen
897  * the string. If the string is lengthened, the function may fail and
898  * return #FALSE. Newly-added bytes are not initialized, as with
899  * _dbus_string_lengthen().
900  *
901  * @param str a string
902  * @param length new length of the string.
903  * @returns #FALSE on failure.
904  */
905 dbus_bool_t
906 _dbus_string_set_length (DBusString *str,
907                          int         length)
908 {
909   DBUS_STRING_PREAMBLE (str);
910   _dbus_assert (length >= 0);
911
912   return set_length (real, length);
913 }
914
915 static dbus_bool_t
916 align_insert_point_then_open_gap (DBusString *str,
917                                   int        *insert_at_p,
918                                   int         alignment,
919                                   int         gap_size)
920 {
921   unsigned long new_len; /* ulong to avoid _DBUS_ALIGN_VALUE overflow */
922   unsigned long gap_pos;
923   int insert_at;
924   int delta;
925   DBUS_STRING_PREAMBLE (str);
926   _dbus_assert (alignment >= 1);
927   _dbus_assert (alignment <= 8); /* it has to be a bug if > 8 */
928
929   insert_at = *insert_at_p;
930
931   _dbus_assert (insert_at <= real->len);
932   
933   gap_pos = _DBUS_ALIGN_VALUE (insert_at, alignment);
934   new_len = real->len + (gap_pos - insert_at) + gap_size;
935   
936   if (_DBUS_UNLIKELY (new_len > (unsigned long) real->max_length))
937     return FALSE;
938   
939   delta = new_len - real->len;
940   _dbus_assert (delta >= 0);
941
942   if (delta == 0) /* only happens if gap_size == 0 and insert_at is aligned already */
943     {
944       _dbus_assert (((unsigned long) *insert_at_p) == gap_pos);
945       return TRUE;
946     }
947
948   if (_DBUS_UNLIKELY (!open_gap (new_len - real->len,
949                                  real, insert_at)))
950     return FALSE;
951
952   /* nul the padding if we had to add any padding */
953   if (gap_size < delta)
954     {
955       memset (&real->str[insert_at], '\0',
956               gap_pos - insert_at);
957     }
958
959   *insert_at_p = gap_pos;
960   
961   return TRUE;
962 }
963
964 static dbus_bool_t
965 align_length_then_lengthen (DBusString *str,
966                             int         alignment,
967                             int         then_lengthen_by)
968 {
969   int insert_at;
970
971   insert_at = _dbus_string_get_length (str);
972   
973   return align_insert_point_then_open_gap (str,
974                                            &insert_at,
975                                            alignment, then_lengthen_by);
976 }
977
978 /**
979  * Align the length of a string to a specific alignment (typically 4 or 8)
980  * by appending nul bytes to the string.
981  *
982  * @param str a string
983  * @param alignment the alignment
984  * @returns #FALSE if no memory
985  */
986 dbus_bool_t
987 _dbus_string_align_length (DBusString *str,
988                            int         alignment)
989 {
990   return align_length_then_lengthen (str, alignment, 0);
991 }
992
993 /**
994  * Preallocate extra_bytes such that a future lengthening of the
995  * string by extra_bytes is guaranteed to succeed without an out of
996  * memory error.
997  *
998  * @param str a string
999  * @param extra_bytes bytes to alloc
1000  * @returns #FALSE if no memory
1001  */
1002 dbus_bool_t
1003 _dbus_string_alloc_space (DBusString        *str,
1004                           int                extra_bytes)
1005 {
1006   if (!_dbus_string_lengthen (str, extra_bytes))
1007     return FALSE;
1008   _dbus_string_shorten (str, extra_bytes);
1009
1010   return TRUE;
1011 }
1012
1013 static dbus_bool_t
1014 append (DBusRealString *real,
1015         const char     *buffer,
1016         int             buffer_len)
1017 {
1018   if (buffer_len == 0)
1019     return TRUE;
1020
1021   if (!_dbus_string_lengthen ((DBusString*)real, buffer_len))
1022     return FALSE;
1023
1024   memcpy (real->str + (real->len - buffer_len),
1025           buffer,
1026           buffer_len);
1027
1028   return TRUE;
1029 }
1030
1031 /**
1032  * Appends a nul-terminated C-style string to a DBusString.
1033  *
1034  * @param str the DBusString
1035  * @param buffer the nul-terminated characters to append
1036  * @returns #FALSE if not enough memory.
1037  */
1038 dbus_bool_t
1039 _dbus_string_append (DBusString *str,
1040                      const char *buffer)
1041 {
1042   unsigned long buffer_len;
1043   
1044   DBUS_STRING_PREAMBLE (str);
1045   _dbus_assert (buffer != NULL);
1046   
1047   buffer_len = strlen (buffer);
1048   if (buffer_len > (unsigned long) real->max_length)
1049     return FALSE;
1050   
1051   return append (real, buffer, buffer_len);
1052 }
1053
1054 /** assign 2 bytes from one string to another */
1055 #define ASSIGN_2_OCTETS(p, octets) \
1056   *((dbus_uint16_t*)(p)) = *((dbus_uint16_t*)(octets));
1057
1058 /** assign 4 bytes from one string to another */
1059 #define ASSIGN_4_OCTETS(p, octets) \
1060   *((dbus_uint32_t*)(p)) = *((dbus_uint32_t*)(octets));
1061
1062 #ifdef DBUS_HAVE_INT64
1063 /** assign 8 bytes from one string to another */
1064 #define ASSIGN_8_OCTETS(p, octets) \
1065   *((dbus_uint64_t*)(p)) = *((dbus_uint64_t*)(octets));
1066 #else
1067 /** assign 8 bytes from one string to another */
1068 #define ASSIGN_8_OCTETS(p, octets)              \
1069 do {                                            \
1070   unsigned char *b;                             \
1071                                                 \
1072   b = p;                                        \
1073                                                 \
1074   *b++ = octets[0];                             \
1075   *b++ = octets[1];                             \
1076   *b++ = octets[2];                             \
1077   *b++ = octets[3];                             \
1078   *b++ = octets[4];                             \
1079   *b++ = octets[5];                             \
1080   *b++ = octets[6];                             \
1081   *b++ = octets[7];                             \
1082   _dbus_assert (b == p + 8);                    \
1083 } while (0)
1084 #endif /* DBUS_HAVE_INT64 */
1085
1086 #ifdef DBUS_BUILD_TESTS
1087 /**
1088  * Appends 4 bytes aligned on a 4 byte boundary
1089  * with any alignment padding initialized to 0.
1090  *
1091  * @param str the DBusString
1092  * @param octets 4 bytes to append
1093  * @returns #FALSE if not enough memory.
1094  */
1095 dbus_bool_t
1096 _dbus_string_append_4_aligned (DBusString         *str,
1097                                const unsigned char octets[4])
1098 {
1099   DBUS_STRING_PREAMBLE (str);
1100   
1101   if (!align_length_then_lengthen (str, 4, 4))
1102     return FALSE;
1103
1104   ASSIGN_4_OCTETS (real->str + (real->len - 4), octets);
1105
1106   return TRUE;
1107 }
1108 #endif /* DBUS_BUILD_TESTS */
1109
1110 #ifdef DBUS_BUILD_TESTS
1111 /**
1112  * Appends 8 bytes aligned on an 8 byte boundary
1113  * with any alignment padding initialized to 0.
1114  *
1115  * @param str the DBusString
1116  * @param octets 8 bytes to append
1117  * @returns #FALSE if not enough memory.
1118  */
1119 dbus_bool_t
1120 _dbus_string_append_8_aligned (DBusString         *str,
1121                                const unsigned char octets[8])
1122 {
1123   DBUS_STRING_PREAMBLE (str);
1124   
1125   if (!align_length_then_lengthen (str, 8, 8))
1126     return FALSE;
1127
1128   ASSIGN_8_OCTETS (real->str + (real->len - 8), octets);
1129
1130   return TRUE;
1131 }
1132 #endif /* DBUS_BUILD_TESTS */
1133
1134 /**
1135  * Inserts 2 bytes aligned on a 2 byte boundary
1136  * with any alignment padding initialized to 0.
1137  *
1138  * @param str the DBusString
1139  * @param insert_at where to insert
1140  * @param octets 2 bytes to insert
1141  * @returns #FALSE if not enough memory.
1142  */
1143 dbus_bool_t
1144 _dbus_string_insert_2_aligned (DBusString         *str,
1145                                int                 insert_at,
1146                                const unsigned char octets[4])
1147 {
1148   DBUS_STRING_PREAMBLE (str);
1149   
1150   if (!align_insert_point_then_open_gap (str, &insert_at, 2, 2))
1151     return FALSE;
1152
1153   ASSIGN_2_OCTETS (real->str + insert_at, octets);
1154
1155   return TRUE;
1156 }
1157
1158 /**
1159  * Inserts 4 bytes aligned on a 4 byte boundary
1160  * with any alignment padding initialized to 0.
1161  *
1162  * @param str the DBusString
1163  * @param insert_at where to insert
1164  * @param octets 4 bytes to insert
1165  * @returns #FALSE if not enough memory.
1166  */
1167 dbus_bool_t
1168 _dbus_string_insert_4_aligned (DBusString         *str,
1169                                int                 insert_at,
1170                                const unsigned char octets[4])
1171 {
1172   DBUS_STRING_PREAMBLE (str);
1173   
1174   if (!align_insert_point_then_open_gap (str, &insert_at, 4, 4))
1175     return FALSE;
1176
1177   ASSIGN_4_OCTETS (real->str + insert_at, octets);
1178
1179   return TRUE;
1180 }
1181
1182 /**
1183  * Inserts 8 bytes aligned on an 8 byte boundary
1184  * with any alignment padding initialized to 0.
1185  *
1186  * @param str the DBusString
1187  * @param insert_at where to insert
1188  * @param octets 8 bytes to insert
1189  * @returns #FALSE if not enough memory.
1190  */
1191 dbus_bool_t
1192 _dbus_string_insert_8_aligned (DBusString         *str,
1193                                int                 insert_at,
1194                                const unsigned char octets[8])
1195 {
1196   DBUS_STRING_PREAMBLE (str);
1197   
1198   if (!align_insert_point_then_open_gap (str, &insert_at, 8, 8))
1199     return FALSE;
1200
1201   _dbus_assert (_DBUS_ALIGN_VALUE (insert_at, 8) == (unsigned) insert_at);
1202   
1203   ASSIGN_8_OCTETS (real->str + insert_at, octets);
1204
1205   return TRUE;
1206 }
1207
1208
1209 /**
1210  * Inserts padding at *insert_at such to align it to the given
1211  * boundary. Initializes the padding to nul bytes. Sets *insert_at
1212  * to the aligned position.
1213  *
1214  * @param str the DBusString
1215  * @param insert_at location to be aligned
1216  * @param alignment alignment boundary (1, 2, 4, or 8)
1217  * @returns #FALSE if not enough memory.
1218  */
1219 dbus_bool_t
1220 _dbus_string_insert_alignment (DBusString        *str,
1221                                int               *insert_at,
1222                                int                alignment)
1223 {
1224   DBUS_STRING_PREAMBLE (str);
1225   
1226   if (!align_insert_point_then_open_gap (str, insert_at, alignment, 0))
1227     return FALSE;
1228
1229   _dbus_assert (_DBUS_ALIGN_VALUE (*insert_at, alignment) == (unsigned) *insert_at);
1230
1231   return TRUE;
1232 }
1233
1234 /**
1235  * Appends a printf-style formatted string
1236  * to the #DBusString.
1237  *
1238  * @param str the string
1239  * @param format printf format
1240  * @param args variable argument list
1241  * @returns #FALSE if no memory
1242  */
1243 dbus_bool_t
1244 _dbus_string_append_printf_valist  (DBusString        *str,
1245                                     const char        *format,
1246                                     va_list            args)
1247 {
1248   int len;
1249   va_list args_copy;
1250
1251   DBUS_STRING_PREAMBLE (str);
1252
1253   DBUS_VA_COPY (args_copy, args);
1254
1255   /* Measure the message length without terminating nul */
1256   len = _dbus_printf_string_upper_bound (format, args);
1257
1258   if (len < 0)
1259     return FALSE;
1260
1261   if (!_dbus_string_lengthen (str, len))
1262     {
1263       /* don't leak the copy */
1264       va_end (args_copy);
1265       return FALSE;
1266     }
1267   
1268   vsprintf ((char*) (real->str + (real->len - len)),
1269             format, args_copy);
1270
1271   va_end (args_copy);
1272
1273   return TRUE;
1274 }
1275
1276 /**
1277  * Appends a printf-style formatted string
1278  * to the #DBusString.
1279  *
1280  * @param str the string
1281  * @param format printf format
1282  * @returns #FALSE if no memory
1283  */
1284 dbus_bool_t
1285 _dbus_string_append_printf (DBusString        *str,
1286                             const char        *format,
1287                             ...)
1288 {
1289   va_list args;
1290   dbus_bool_t retval;
1291   
1292   va_start (args, format);
1293   retval = _dbus_string_append_printf_valist (str, format, args);
1294   va_end (args);
1295
1296   return retval;
1297 }
1298
1299 /**
1300  * Appends block of bytes with the given length to a DBusString.
1301  *
1302  * @param str the DBusString
1303  * @param buffer the bytes to append
1304  * @param len the number of bytes to append
1305  * @returns #FALSE if not enough memory.
1306  */
1307 dbus_bool_t
1308 _dbus_string_append_len (DBusString *str,
1309                          const char *buffer,
1310                          int         len)
1311 {
1312   DBUS_STRING_PREAMBLE (str);
1313   _dbus_assert (buffer != NULL);
1314   _dbus_assert (len >= 0);
1315
1316   return append (real, buffer, len);
1317 }
1318
1319 /**
1320  * Appends a single byte to the string, returning #FALSE
1321  * if not enough memory.
1322  *
1323  * @param str the string
1324  * @param byte the byte to append
1325  * @returns #TRUE on success
1326  */
1327 dbus_bool_t
1328 _dbus_string_append_byte (DBusString    *str,
1329                           unsigned char  byte)
1330 {
1331   DBUS_STRING_PREAMBLE (str);
1332
1333   if (!set_length (real, real->len + 1))
1334     return FALSE;
1335
1336   real->str[real->len-1] = byte;
1337
1338   return TRUE;
1339 }
1340
1341 #ifdef DBUS_BUILD_TESTS
1342 /**
1343  * Appends a single Unicode character, encoding the character
1344  * in UTF-8 format.
1345  *
1346  * @param str the string
1347  * @param ch the Unicode character
1348  */
1349 dbus_bool_t
1350 _dbus_string_append_unichar (DBusString    *str,
1351                              dbus_unichar_t ch)
1352 {
1353   int len;
1354   int first;
1355   int i;
1356   unsigned char *out;
1357   
1358   DBUS_STRING_PREAMBLE (str);
1359
1360   /* this code is from GLib but is pretty standard I think */
1361   
1362   len = 0;
1363   
1364   if (ch < 0x80)
1365     {
1366       first = 0;
1367       len = 1;
1368     }
1369   else if (ch < 0x800)
1370     {
1371       first = 0xc0;
1372       len = 2;
1373     }
1374   else if (ch < 0x10000)
1375     {
1376       first = 0xe0;
1377       len = 3;
1378     }
1379    else if (ch < 0x200000)
1380     {
1381       first = 0xf0;
1382       len = 4;
1383     }
1384   else if (ch < 0x4000000)
1385     {
1386       first = 0xf8;
1387       len = 5;
1388     }
1389   else
1390     {
1391       first = 0xfc;
1392       len = 6;
1393     }
1394
1395   if (len > (real->max_length - real->len))
1396     return FALSE; /* real->len + len would overflow */
1397   
1398   if (!set_length (real, real->len + len))
1399     return FALSE;
1400
1401   out = real->str + (real->len - len);
1402   
1403   for (i = len - 1; i > 0; --i)
1404     {
1405       out[i] = (ch & 0x3f) | 0x80;
1406       ch >>= 6;
1407     }
1408   out[0] = ch | first;
1409
1410   return TRUE;
1411 }
1412 #endif /* DBUS_BUILD_TESTS */
1413
1414 static void
1415 delete (DBusRealString *real,
1416         int             start,
1417         int             len)
1418 {
1419   if (len == 0)
1420     return;
1421   
1422   memmove (real->str + start, real->str + start + len, real->len - (start + len));
1423   real->len -= len;
1424   real->str[real->len] = '\0';
1425 }
1426
1427 /**
1428  * Deletes a segment of a DBusString with length len starting at
1429  * start. (Hint: to clear an entire string, setting length to 0
1430  * with _dbus_string_set_length() is easier.)
1431  *
1432  * @param str the DBusString
1433  * @param start where to start deleting
1434  * @param len the number of bytes to delete
1435  */
1436 void
1437 _dbus_string_delete (DBusString       *str,
1438                      int               start,
1439                      int               len)
1440 {
1441   DBUS_STRING_PREAMBLE (str);
1442   _dbus_assert (start >= 0);
1443   _dbus_assert (len >= 0);
1444   _dbus_assert (start <= real->len);
1445   _dbus_assert (len <= real->len - start);
1446   
1447   delete (real, start, len);
1448 }
1449
1450 static dbus_bool_t
1451 copy (DBusRealString *source,
1452       int             start,
1453       int             len,
1454       DBusRealString *dest,
1455       int             insert_at)
1456 {
1457   if (len == 0)
1458     return TRUE;
1459
1460   if (!open_gap (len, dest, insert_at))
1461     return FALSE;
1462   
1463   memmove (dest->str + insert_at,
1464            source->str + start,
1465            len);
1466
1467   return TRUE;
1468 }
1469
1470 /**
1471  * Checks assertions for two strings we're copying a segment between,
1472  * and declares real_source/real_dest variables.
1473  *
1474  * @param source the source string
1475  * @param start the starting offset
1476  * @param dest the dest string
1477  * @param insert_at where the copied segment is inserted
1478  */
1479 #define DBUS_STRING_COPY_PREAMBLE(source, start, dest, insert_at)       \
1480   DBusRealString *real_source = (DBusRealString*) source;               \
1481   DBusRealString *real_dest = (DBusRealString*) dest;                   \
1482   _dbus_assert ((source) != (dest));                                    \
1483   DBUS_GENERIC_STRING_PREAMBLE (real_source);                           \
1484   DBUS_GENERIC_STRING_PREAMBLE (real_dest);                             \
1485   _dbus_assert (!real_dest->constant);                                  \
1486   _dbus_assert (!real_dest->locked);                                    \
1487   _dbus_assert ((start) >= 0);                                          \
1488   _dbus_assert ((start) <= real_source->len);                           \
1489   _dbus_assert ((insert_at) >= 0);                                      \
1490   _dbus_assert ((insert_at) <= real_dest->len)
1491
1492 /**
1493  * Moves the end of one string into another string. Both strings
1494  * must be initialized, valid strings.
1495  *
1496  * @param source the source string
1497  * @param start where to chop off the source string
1498  * @param dest the destination string
1499  * @param insert_at where to move the chopped-off part of source string
1500  * @returns #FALSE if not enough memory
1501  */
1502 dbus_bool_t
1503 _dbus_string_move (DBusString       *source,
1504                    int               start,
1505                    DBusString       *dest,
1506                    int               insert_at)
1507 {
1508   DBusRealString *real_source = (DBusRealString*) source;
1509   _dbus_assert (start <= real_source->len);
1510   
1511   return _dbus_string_move_len (source, start,
1512                                 real_source->len - start,
1513                                 dest, insert_at);
1514 }
1515
1516 /**
1517  * Like _dbus_string_move(), but does not delete the section
1518  * of the source string that's copied to the dest string.
1519  *
1520  * @param source the source string
1521  * @param start where to start copying the source string
1522  * @param dest the destination string
1523  * @param insert_at where to place the copied part of source string
1524  * @returns #FALSE if not enough memory
1525  */
1526 dbus_bool_t
1527 _dbus_string_copy (const DBusString *source,
1528                    int               start,
1529                    DBusString       *dest,
1530                    int               insert_at)
1531 {
1532   DBUS_STRING_COPY_PREAMBLE (source, start, dest, insert_at);
1533
1534   return copy (real_source, start,
1535                real_source->len - start,
1536                real_dest,
1537                insert_at);
1538 }
1539
1540 /**
1541  * Like _dbus_string_move(), but can move a segment from
1542  * the middle of the source string.
1543  *
1544  * @todo this doesn't do anything with max_length field.
1545  * we should probably just kill the max_length field though.
1546  * 
1547  * @param source the source string
1548  * @param start first byte of source string to move
1549  * @param len length of segment to move
1550  * @param dest the destination string
1551  * @param insert_at where to move the bytes from the source string
1552  * @returns #FALSE if not enough memory
1553  */
1554 dbus_bool_t
1555 _dbus_string_move_len (DBusString       *source,
1556                        int               start,
1557                        int               len,
1558                        DBusString       *dest,
1559                        int               insert_at)
1560
1561 {
1562   DBUS_STRING_COPY_PREAMBLE (source, start, dest, insert_at);
1563   _dbus_assert (len >= 0);
1564   _dbus_assert ((start + len) <= real_source->len);
1565
1566
1567   if (len == 0)
1568     {
1569       return TRUE;
1570     }
1571   else if (start == 0 &&
1572            len == real_source->len &&
1573            real_dest->len == 0)
1574     {
1575       /* Short-circuit moving an entire existing string to an empty string
1576        * by just swapping the buffers.
1577        */
1578       /* we assume ->constant doesn't matter as you can't have
1579        * a constant string involved in a move.
1580        */
1581 #define ASSIGN_DATA(a, b) do {                  \
1582         (a)->str = (b)->str;                    \
1583         (a)->len = (b)->len;                    \
1584         (a)->allocated = (b)->allocated;        \
1585         (a)->align_offset = (b)->align_offset;  \
1586       } while (0)
1587       
1588       DBusRealString tmp;
1589
1590       ASSIGN_DATA (&tmp, real_source);
1591       ASSIGN_DATA (real_source, real_dest);
1592       ASSIGN_DATA (real_dest, &tmp);
1593
1594       return TRUE;
1595     }
1596   else
1597     {
1598       if (!copy (real_source, start, len,
1599                  real_dest,
1600                  insert_at))
1601         return FALSE;
1602       
1603       delete (real_source, start,
1604               len);
1605       
1606       return TRUE;
1607     }
1608 }
1609
1610 /**
1611  * Like _dbus_string_copy(), but can copy a segment from the middle of
1612  * the source string.
1613  *
1614  * @param source the source string
1615  * @param start where to start copying the source string
1616  * @param len length of segment to copy
1617  * @param dest the destination string
1618  * @param insert_at where to place the copied segment of source string
1619  * @returns #FALSE if not enough memory
1620  */
1621 dbus_bool_t
1622 _dbus_string_copy_len (const DBusString *source,
1623                        int               start,
1624                        int               len,
1625                        DBusString       *dest,
1626                        int               insert_at)
1627 {
1628   DBUS_STRING_COPY_PREAMBLE (source, start, dest, insert_at);
1629   _dbus_assert (len >= 0);
1630   _dbus_assert (start <= real_source->len);
1631   _dbus_assert (len <= real_source->len - start);
1632   
1633   return copy (real_source, start, len,
1634                real_dest,
1635                insert_at);
1636 }
1637
1638 /**
1639  * Replaces a segment of dest string with a segment of source string.
1640  *
1641  * @todo optimize the case where the two lengths are the same, and
1642  * avoid memmoving the data in the trailing part of the string twice.
1643  *
1644  * @todo avoid inserting the source into dest, then deleting
1645  * the replaced chunk of dest (which creates a potentially large
1646  * intermediate string). Instead, extend the replaced chunk
1647  * of dest with padding to the same size as the source chunk,
1648  * then copy in the source bytes.
1649  * 
1650  * @param source the source string
1651  * @param start where to start copying the source string
1652  * @param len length of segment to copy
1653  * @param dest the destination string
1654  * @param replace_at start of segment of dest string to replace
1655  * @param replace_len length of segment of dest string to replace
1656  * @returns #FALSE if not enough memory
1657  *
1658  */
1659 dbus_bool_t
1660 _dbus_string_replace_len (const DBusString *source,
1661                           int               start,
1662                           int               len,
1663                           DBusString       *dest,
1664                           int               replace_at,
1665                           int               replace_len)
1666 {
1667   DBUS_STRING_COPY_PREAMBLE (source, start, dest, replace_at);
1668   _dbus_assert (len >= 0);
1669   _dbus_assert (start <= real_source->len);
1670   _dbus_assert (len <= real_source->len - start);
1671   _dbus_assert (replace_at >= 0);
1672   _dbus_assert (replace_at <= real_dest->len);
1673   _dbus_assert (replace_len <= real_dest->len - replace_at);
1674
1675   if (!copy (real_source, start, len,
1676              real_dest, replace_at))
1677     return FALSE;
1678
1679   delete (real_dest, replace_at + len, replace_len);
1680
1681   return TRUE;
1682 }
1683
1684 /**
1685  * Looks for the first occurance of a byte, deletes that byte,
1686  * and moves everything after the byte to the beginning of a
1687  * separate string.  Both strings must be initialized, valid
1688  * strings.
1689  *
1690  * @param source the source string
1691  * @param byte the byte to remove and split the string at
1692  * @param tail the split off string
1693  * @returns #FALSE if not enough memory or if byte could not be found
1694  *
1695  */
1696 dbus_bool_t
1697 _dbus_string_split_on_byte (DBusString        *source,
1698                             unsigned char      byte,
1699                             DBusString        *tail)
1700 {
1701   int byte_position;
1702   char byte_string[2] = "";
1703   int head_length;
1704   int tail_length;
1705
1706   byte_string[0] = (char) byte;
1707
1708   if (!_dbus_string_find (source, 0, byte_string, &byte_position))
1709     return FALSE;
1710
1711   head_length = byte_position;
1712   tail_length = _dbus_string_get_length (source) - head_length - 1;
1713
1714   if (!_dbus_string_move_len (source, byte_position + 1, tail_length,
1715                               tail, 0))
1716     return FALSE;
1717
1718   /* remove the trailing delimiter byte from the head now.
1719    */
1720   if (!_dbus_string_set_length (source, head_length))
1721     return FALSE;
1722
1723   return TRUE;
1724 }
1725
1726 /* Unicode macros and utf8_validate() from GLib Owen Taylor, Havoc
1727  * Pennington, and Tom Tromey are the authors and authorized relicense.
1728  */
1729
1730 /** computes length and mask of a unicode character
1731  * @param Char the char
1732  * @param Mask the mask variable to assign to
1733  * @param Len the length variable to assign to
1734  */
1735 #define UTF8_COMPUTE(Char, Mask, Len)                                         \
1736   if (Char < 128)                                                             \
1737     {                                                                         \
1738       Len = 1;                                                                \
1739       Mask = 0x7f;                                                            \
1740     }                                                                         \
1741   else if ((Char & 0xe0) == 0xc0)                                             \
1742     {                                                                         \
1743       Len = 2;                                                                \
1744       Mask = 0x1f;                                                            \
1745     }                                                                         \
1746   else if ((Char & 0xf0) == 0xe0)                                             \
1747     {                                                                         \
1748       Len = 3;                                                                \
1749       Mask = 0x0f;                                                            \
1750     }                                                                         \
1751   else if ((Char & 0xf8) == 0xf0)                                             \
1752     {                                                                         \
1753       Len = 4;                                                                \
1754       Mask = 0x07;                                                            \
1755     }                                                                         \
1756   else if ((Char & 0xfc) == 0xf8)                                             \
1757     {                                                                         \
1758       Len = 5;                                                                \
1759       Mask = 0x03;                                                            \
1760     }                                                                         \
1761   else if ((Char & 0xfe) == 0xfc)                                             \
1762     {                                                                         \
1763       Len = 6;                                                                \
1764       Mask = 0x01;                                                            \
1765     }                                                                         \
1766   else                                                                        \
1767     {                                                                         \
1768       Len = 0;                                                               \
1769       Mask = 0;                                                               \
1770     }
1771
1772 /**
1773  * computes length of a unicode character in UTF-8
1774  * @param Char the char
1775  */
1776 #define UTF8_LENGTH(Char)              \
1777   ((Char) < 0x80 ? 1 :                 \
1778    ((Char) < 0x800 ? 2 :               \
1779     ((Char) < 0x10000 ? 3 :            \
1780      ((Char) < 0x200000 ? 4 :          \
1781       ((Char) < 0x4000000 ? 5 : 6)))))
1782    
1783 /**
1784  * Gets a UTF-8 value.
1785  *
1786  * @param Result variable for extracted unicode char.
1787  * @param Chars the bytes to decode
1788  * @param Count counter variable
1789  * @param Mask mask for this char
1790  * @param Len length for this char in bytes
1791  */
1792 #define UTF8_GET(Result, Chars, Count, Mask, Len)                             \
1793   (Result) = (Chars)[0] & (Mask);                                             \
1794   for ((Count) = 1; (Count) < (Len); ++(Count))                               \
1795     {                                                                         \
1796       if (((Chars)[(Count)] & 0xc0) != 0x80)                                  \
1797         {                                                                     \
1798           (Result) = -1;                                                      \
1799           break;                                                              \
1800         }                                                                     \
1801       (Result) <<= 6;                                                         \
1802       (Result) |= ((Chars)[(Count)] & 0x3f);                                  \
1803     }
1804
1805 /**
1806  * Check whether a Unicode (5.2) char is in a valid range.
1807  *
1808  * The first check comes from the Unicode guarantee to never encode
1809  * a point above 0x0010ffff, since UTF-16 couldn't represent it.
1810  *
1811  * The second check covers surrogate pairs (category Cs).
1812  *
1813  * The last two checks cover "Noncharacter": defined as:
1814  *   "A code point that is permanently reserved for
1815  *    internal use, and that should never be interchanged. In
1816  *    Unicode 3.1, these consist of the values U+nFFFE and U+nFFFF
1817  *    (where n is from 0 to 10_16) and the values U+FDD0..U+FDEF."
1818  *
1819  * @param Char the character
1820  */
1821 #define UNICODE_VALID(Char)                   \
1822     ((Char) < 0x110000 &&                     \
1823      (((Char) & 0xFFFFF800) != 0xD800) &&     \
1824      ((Char) < 0xFDD0 || (Char) > 0xFDEF) &&  \
1825      ((Char) & 0xFFFE) != 0xFFFE)
1826
1827 #ifdef DBUS_BUILD_TESTS
1828 /**
1829  * Gets a unicode character from a UTF-8 string. Does no validation;
1830  * you must verify that the string is valid UTF-8 in advance and must
1831  * pass in the start of a character.
1832  *
1833  * @param str the string
1834  * @param start the start of the UTF-8 character.
1835  * @param ch_return location to return the character
1836  * @param end_return location to return the byte index of next character
1837  */
1838 void
1839 _dbus_string_get_unichar (const DBusString *str,
1840                           int               start,
1841                           dbus_unichar_t   *ch_return,
1842                           int              *end_return)
1843 {
1844   int i, mask, len;
1845   dbus_unichar_t result;
1846   unsigned char c;
1847   unsigned char *p;
1848   DBUS_CONST_STRING_PREAMBLE (str);
1849   _dbus_assert (start >= 0);
1850   _dbus_assert (start <= real->len);
1851   
1852   if (ch_return)
1853     *ch_return = 0;
1854   if (end_return)
1855     *end_return = real->len;
1856   
1857   mask = 0;
1858   p = real->str + start;
1859   c = *p;
1860   
1861   UTF8_COMPUTE (c, mask, len);
1862   if (len == 0)
1863     return;
1864   UTF8_GET (result, p, i, mask, len);
1865
1866   if (result == (dbus_unichar_t)-1)
1867     return;
1868
1869   if (ch_return)
1870     *ch_return = result;
1871   if (end_return)
1872     *end_return = start + len;
1873 }
1874 #endif /* DBUS_BUILD_TESTS */
1875
1876 /**
1877  * Finds the given substring in the string,
1878  * returning #TRUE and filling in the byte index
1879  * where the substring was found, if it was found.
1880  * Returns #FALSE if the substring wasn't found.
1881  * Sets *start to the length of the string if the substring
1882  * is not found.
1883  *
1884  * @param str the string
1885  * @param start where to start looking
1886  * @param substr the substring
1887  * @param found return location for where it was found, or #NULL
1888  * @returns #TRUE if found
1889  */
1890 dbus_bool_t
1891 _dbus_string_find (const DBusString *str,
1892                    int               start,
1893                    const char       *substr,
1894                    int              *found)
1895 {
1896   return _dbus_string_find_to (str, start,
1897                                ((const DBusRealString*)str)->len,
1898                                substr, found);
1899 }
1900
1901 /**
1902  * Finds end of line ("\r\n" or "\n") in the string,
1903  * returning #TRUE and filling in the byte index
1904  * where the eol string was found, if it was found.
1905  * Returns #FALSE if eol wasn't found.
1906  *
1907  * @param str the string
1908  * @param start where to start looking
1909  * @param found return location for where eol was found or string length otherwise
1910  * @param found_len return length of found eol string or zero otherwise
1911  * @returns #TRUE if found
1912  */
1913 dbus_bool_t
1914 _dbus_string_find_eol (const DBusString *str,
1915                        int               start,
1916                        int              *found,
1917                        int              *found_len)
1918 {
1919   int i;
1920
1921   DBUS_CONST_STRING_PREAMBLE (str);
1922   _dbus_assert (start <= real->len);
1923   _dbus_assert (start >= 0);
1924   
1925   i = start;
1926   while (i < real->len)
1927     {
1928       if (real->str[i] == '\r') 
1929         {
1930           if ((i+1) < real->len && real->str[i+1] == '\n') /* "\r\n" */
1931             {
1932               if (found) 
1933                 *found = i;
1934               if (found_len)
1935                 *found_len = 2;
1936               return TRUE;
1937             } 
1938           else /* only "\r" */
1939             {
1940               if (found) 
1941                 *found = i;
1942               if (found_len)
1943                 *found_len = 1;
1944               return TRUE;
1945             }
1946         } 
1947       else if (real->str[i] == '\n')  /* only "\n" */
1948         {
1949           if (found) 
1950             *found = i;
1951           if (found_len)
1952             *found_len = 1;
1953           return TRUE;
1954         }
1955       ++i;
1956     }
1957
1958   if (found)
1959     *found = real->len;
1960
1961   if (found_len)
1962     *found_len = 0;
1963   
1964   return FALSE;
1965 }
1966
1967 /**
1968  * Finds the given substring in the string,
1969  * up to a certain position,
1970  * returning #TRUE and filling in the byte index
1971  * where the substring was found, if it was found.
1972  * Returns #FALSE if the substring wasn't found.
1973  * Sets *start to the length of the string if the substring
1974  * is not found.
1975  *
1976  * @param str the string
1977  * @param start where to start looking
1978  * @param end where to stop looking
1979  * @param substr the substring
1980  * @param found return location for where it was found, or #NULL
1981  * @returns #TRUE if found
1982  */
1983 dbus_bool_t
1984 _dbus_string_find_to (const DBusString *str,
1985                       int               start,
1986                       int               end,
1987                       const char       *substr,
1988                       int              *found)
1989 {
1990   int i;
1991   DBUS_CONST_STRING_PREAMBLE (str);
1992   _dbus_assert (substr != NULL);
1993   _dbus_assert (start <= real->len);
1994   _dbus_assert (start >= 0);
1995   _dbus_assert (substr != NULL);
1996   _dbus_assert (end <= real->len);
1997   _dbus_assert (start <= end);
1998
1999   /* we always "find" an empty string */
2000   if (*substr == '\0')
2001     {
2002       if (found)
2003         *found = start;
2004       return TRUE;
2005     }
2006
2007   i = start;
2008   while (i < end)
2009     {
2010       if (real->str[i] == substr[0])
2011         {
2012           int j = i + 1;
2013           
2014           while (j < end)
2015             {
2016               if (substr[j - i] == '\0')
2017                 break;
2018               else if (real->str[j] != substr[j - i])
2019                 break;
2020               
2021               ++j;
2022             }
2023
2024           if (substr[j - i] == '\0')
2025             {
2026               if (found)
2027                 *found = i;
2028               return TRUE;
2029             }
2030         }
2031       
2032       ++i;
2033     }
2034
2035   if (found)
2036     *found = end;
2037   
2038   return FALSE;  
2039 }
2040
2041 /**
2042  * Finds a blank (space or tab) in the string. Returns #TRUE
2043  * if found, #FALSE otherwise. If a blank is not found sets
2044  * *found to the length of the string.
2045  *
2046  * @param str the string
2047  * @param start byte index to start looking
2048  * @param found place to store the location of the first blank
2049  * @returns #TRUE if a blank was found
2050  */
2051 dbus_bool_t
2052 _dbus_string_find_blank (const DBusString *str,
2053                          int               start,
2054                          int              *found)
2055 {
2056   int i;
2057   DBUS_CONST_STRING_PREAMBLE (str);
2058   _dbus_assert (start <= real->len);
2059   _dbus_assert (start >= 0);
2060   
2061   i = start;
2062   while (i < real->len)
2063     {
2064       if (real->str[i] == ' ' ||
2065           real->str[i] == '\t')
2066         {
2067           if (found)
2068             *found = i;
2069           return TRUE;
2070         }
2071       
2072       ++i;
2073     }
2074
2075   if (found)
2076     *found = real->len;
2077   
2078   return FALSE;
2079 }
2080
2081 /**
2082  * Skips blanks from start, storing the first non-blank in *end
2083  * (blank is space or tab).
2084  *
2085  * @param str the string
2086  * @param start where to start
2087  * @param end where to store the first non-blank byte index
2088  */
2089 void
2090 _dbus_string_skip_blank (const DBusString *str,
2091                          int               start,
2092                          int              *end)
2093 {
2094   int i;
2095   DBUS_CONST_STRING_PREAMBLE (str);
2096   _dbus_assert (start <= real->len);
2097   _dbus_assert (start >= 0);
2098   
2099   i = start;
2100   while (i < real->len)
2101     {
2102       if (!DBUS_IS_ASCII_BLANK (real->str[i]))
2103         break;
2104       
2105       ++i;
2106     }
2107
2108   _dbus_assert (i == real->len || !DBUS_IS_ASCII_WHITE (real->str[i]));
2109   
2110   if (end)
2111     *end = i;
2112 }
2113
2114
2115 /**
2116  * Skips whitespace from start, storing the first non-whitespace in *end.
2117  * (whitespace is space, tab, newline, CR).
2118  *
2119  * @param str the string
2120  * @param start where to start
2121  * @param end where to store the first non-whitespace byte index
2122  */
2123 void
2124 _dbus_string_skip_white (const DBusString *str,
2125                          int               start,
2126                          int              *end)
2127 {
2128   int i;
2129   DBUS_CONST_STRING_PREAMBLE (str);
2130   _dbus_assert (start <= real->len);
2131   _dbus_assert (start >= 0);
2132   
2133   i = start;
2134   while (i < real->len)
2135     {
2136       if (!DBUS_IS_ASCII_WHITE (real->str[i]))
2137         break;
2138       
2139       ++i;
2140     }
2141
2142   _dbus_assert (i == real->len || !(DBUS_IS_ASCII_WHITE (real->str[i])));
2143   
2144   if (end)
2145     *end = i;
2146 }
2147
2148 /**
2149  * Skips whitespace from end, storing the start index of the trailing
2150  * whitespace in *start. (whitespace is space, tab, newline, CR).
2151  *
2152  * @param str the string
2153  * @param end where to start scanning backward
2154  * @param start where to store the start of whitespace chars
2155  */
2156 void
2157 _dbus_string_skip_white_reverse (const DBusString *str,
2158                                  int               end,
2159                                  int              *start)
2160 {
2161   int i;
2162   DBUS_CONST_STRING_PREAMBLE (str);
2163   _dbus_assert (end <= real->len);
2164   _dbus_assert (end >= 0);
2165   
2166   i = end;
2167   while (i > 0)
2168     {
2169       if (!DBUS_IS_ASCII_WHITE (real->str[i-1]))
2170         break;
2171       --i;
2172     }
2173
2174   _dbus_assert (i >= 0 && (i == 0 || !(DBUS_IS_ASCII_WHITE (real->str[i-1]))));
2175   
2176   if (start)
2177     *start = i;
2178 }
2179
2180 /**
2181  * Assigns a newline-terminated or \\r\\n-terminated line from the front
2182  * of the string to the given dest string. The dest string's previous
2183  * contents are deleted. If the source string contains no newline,
2184  * moves the entire source string to the dest string.
2185  *
2186  * @todo owen correctly notes that this is a stupid function (it was
2187  * written purely for test code,
2188  * e.g. dbus-message-builder.c). Probably should be enforced as test
2189  * code only with ifdef DBUS_BUILD_TESTS
2190  * 
2191  * @param source the source string
2192  * @param dest the destination string (contents are replaced)
2193  * @returns #FALSE if no memory, or source has length 0
2194  */
2195 dbus_bool_t
2196 _dbus_string_pop_line (DBusString *source,
2197                        DBusString *dest)
2198 {
2199   int eol, eol_len;
2200   
2201   _dbus_string_set_length (dest, 0);
2202   
2203   eol = 0;
2204   eol_len = 0;
2205   if (!_dbus_string_find_eol (source, 0, &eol, &eol_len))
2206     {
2207       _dbus_assert (eol == _dbus_string_get_length (source));
2208       if (eol == 0)
2209         {
2210           /* If there's no newline and source has zero length, we're done */
2211           return FALSE;
2212         }
2213       /* otherwise, the last line of the file has no eol characters */
2214     }
2215
2216   /* remember eol can be 0 if it's an empty line, but eol_len should not be zero also
2217    * since find_eol returned TRUE
2218    */
2219   
2220   if (!_dbus_string_move_len (source, 0, eol + eol_len, dest, 0))
2221     return FALSE;
2222   
2223   /* remove line ending */
2224   if (!_dbus_string_set_length (dest, eol))
2225     {
2226       _dbus_assert_not_reached ("out of memory when shortening a string");
2227       return FALSE;
2228     }
2229
2230   return TRUE;
2231 }
2232
2233 #ifdef DBUS_BUILD_TESTS
2234 /**
2235  * Deletes up to and including the first blank space
2236  * in the string.
2237  *
2238  * @param str the string
2239  */
2240 void
2241 _dbus_string_delete_first_word (DBusString *str)
2242 {
2243   int i;
2244   
2245   if (_dbus_string_find_blank (str, 0, &i))
2246     _dbus_string_skip_blank (str, i, &i);
2247
2248   _dbus_string_delete (str, 0, i);
2249 }
2250 #endif
2251
2252 #ifdef DBUS_BUILD_TESTS
2253 /**
2254  * Deletes any leading blanks in the string
2255  *
2256  * @param str the string
2257  */
2258 void
2259 _dbus_string_delete_leading_blanks (DBusString *str)
2260 {
2261   int i;
2262   
2263   _dbus_string_skip_blank (str, 0, &i);
2264
2265   if (i > 0)
2266     _dbus_string_delete (str, 0, i);
2267 }
2268 #endif
2269
2270 /**
2271  * Deletes leading and trailing whitespace
2272  * 
2273  * @param str the string
2274  */
2275 void
2276 _dbus_string_chop_white(DBusString *str)
2277 {
2278   int i;
2279   
2280   _dbus_string_skip_white (str, 0, &i);
2281
2282   if (i > 0)
2283     _dbus_string_delete (str, 0, i);
2284   
2285   _dbus_string_skip_white_reverse (str, _dbus_string_get_length (str), &i);
2286
2287   _dbus_string_set_length (str, i);
2288 }
2289
2290 /**
2291  * Tests two DBusString for equality.
2292  *
2293  * @todo memcmp is probably faster
2294  *
2295  * @param a first string
2296  * @param b second string
2297  * @returns #TRUE if equal
2298  */
2299 dbus_bool_t
2300 _dbus_string_equal (const DBusString *a,
2301                     const DBusString *b)
2302 {
2303   const unsigned char *ap;
2304   const unsigned char *bp;
2305   const unsigned char *a_end;
2306   const DBusRealString *real_a = (const DBusRealString*) a;
2307   const DBusRealString *real_b = (const DBusRealString*) b;
2308   DBUS_GENERIC_STRING_PREAMBLE (real_a);
2309   DBUS_GENERIC_STRING_PREAMBLE (real_b);
2310
2311   if (real_a->len != real_b->len)
2312     return FALSE;
2313
2314   ap = real_a->str;
2315   bp = real_b->str;
2316   a_end = real_a->str + real_a->len;
2317   while (ap != a_end)
2318     {
2319       if (*ap != *bp)
2320         return FALSE;
2321       
2322       ++ap;
2323       ++bp;
2324     }
2325
2326   return TRUE;
2327 }
2328
2329 /**
2330  * Tests two DBusString for equality up to the given length.
2331  * The strings may be shorter than the given length.
2332  *
2333  * @todo write a unit test
2334  *
2335  * @todo memcmp is probably faster
2336  *
2337  * @param a first string
2338  * @param b second string
2339  * @param len the maximum length to look at
2340  * @returns #TRUE if equal for the given number of bytes
2341  */
2342 dbus_bool_t
2343 _dbus_string_equal_len (const DBusString *a,
2344                         const DBusString *b,
2345                         int               len)
2346 {
2347   const unsigned char *ap;
2348   const unsigned char *bp;
2349   const unsigned char *a_end;
2350   const DBusRealString *real_a = (const DBusRealString*) a;
2351   const DBusRealString *real_b = (const DBusRealString*) b;
2352   DBUS_GENERIC_STRING_PREAMBLE (real_a);
2353   DBUS_GENERIC_STRING_PREAMBLE (real_b);
2354
2355   if (real_a->len != real_b->len &&
2356       (real_a->len < len || real_b->len < len))
2357     return FALSE;
2358
2359   ap = real_a->str;
2360   bp = real_b->str;
2361   a_end = real_a->str + MIN (real_a->len, len);
2362   while (ap != a_end)
2363     {
2364       if (*ap != *bp)
2365         return FALSE;
2366       
2367       ++ap;
2368       ++bp;
2369     }
2370
2371   return TRUE;
2372 }
2373
2374 /**
2375  * Tests two sub-parts of two DBusString for equality.  The specified
2376  * range of the first string must exist; the specified start position
2377  * of the second string must exist.
2378  *
2379  * @todo write a unit test
2380  *
2381  * @todo memcmp is probably faster
2382  *
2383  * @param a first string
2384  * @param a_start where to start substring in first string
2385  * @param a_len length of substring in first string
2386  * @param b second string
2387  * @param b_start where to start substring in second string
2388  * @returns #TRUE if the two substrings are equal
2389  */
2390 dbus_bool_t
2391 _dbus_string_equal_substring (const DBusString  *a,
2392                               int                a_start,
2393                               int                a_len,
2394                               const DBusString  *b,
2395                               int                b_start)
2396 {
2397   const unsigned char *ap;
2398   const unsigned char *bp;
2399   const unsigned char *a_end;
2400   const DBusRealString *real_a = (const DBusRealString*) a;
2401   const DBusRealString *real_b = (const DBusRealString*) b;
2402   DBUS_GENERIC_STRING_PREAMBLE (real_a);
2403   DBUS_GENERIC_STRING_PREAMBLE (real_b);
2404   _dbus_assert (a_start >= 0);
2405   _dbus_assert (a_len >= 0);
2406   _dbus_assert (a_start <= real_a->len);
2407   _dbus_assert (a_len <= real_a->len - a_start);
2408   _dbus_assert (b_start >= 0);
2409   _dbus_assert (b_start <= real_b->len);
2410   
2411   if (a_len > real_b->len - b_start)
2412     return FALSE;
2413
2414   ap = real_a->str + a_start;
2415   bp = real_b->str + b_start;
2416   a_end = ap + a_len;
2417   while (ap != a_end)
2418     {
2419       if (*ap != *bp)
2420         return FALSE;
2421       
2422       ++ap;
2423       ++bp;
2424     }
2425
2426   _dbus_assert (bp <= (real_b->str + real_b->len));
2427   
2428   return TRUE;
2429 }
2430
2431 /**
2432  * Checks whether a string is equal to a C string.
2433  *
2434  * @param a the string
2435  * @param c_str the C string
2436  * @returns #TRUE if equal
2437  */
2438 dbus_bool_t
2439 _dbus_string_equal_c_str (const DBusString *a,
2440                           const char       *c_str)
2441 {
2442   const unsigned char *ap;
2443   const unsigned char *bp;
2444   const unsigned char *a_end;
2445   const DBusRealString *real_a = (const DBusRealString*) a;
2446   DBUS_GENERIC_STRING_PREAMBLE (real_a);
2447   _dbus_assert (c_str != NULL);
2448   
2449   ap = real_a->str;
2450   bp = (const unsigned char*) c_str;
2451   a_end = real_a->str + real_a->len;
2452   while (ap != a_end && *bp)
2453     {
2454       if (*ap != *bp)
2455         return FALSE;
2456       
2457       ++ap;
2458       ++bp;
2459     }
2460
2461   if (ap != a_end || *bp)
2462     return FALSE;
2463   
2464   return TRUE;
2465 }
2466
2467 #ifdef DBUS_BUILD_TESTS
2468 /**
2469  * Checks whether a string starts with the given C string.
2470  *
2471  * @param a the string
2472  * @param c_str the C string
2473  * @returns #TRUE if string starts with it
2474  */
2475 dbus_bool_t
2476 _dbus_string_starts_with_c_str (const DBusString *a,
2477                                 const char       *c_str)
2478 {
2479   const unsigned char *ap;
2480   const unsigned char *bp;
2481   const unsigned char *a_end;
2482   const DBusRealString *real_a = (const DBusRealString*) a;
2483   DBUS_GENERIC_STRING_PREAMBLE (real_a);
2484   _dbus_assert (c_str != NULL);
2485   
2486   ap = real_a->str;
2487   bp = (const unsigned char*) c_str;
2488   a_end = real_a->str + real_a->len;
2489   while (ap != a_end && *bp)
2490     {
2491       if (*ap != *bp)
2492         return FALSE;
2493       
2494       ++ap;
2495       ++bp;
2496     }
2497
2498   if (*bp == '\0')
2499     return TRUE;
2500   else
2501     return FALSE;
2502 }
2503 #endif /* DBUS_BUILD_TESTS */
2504
2505 /**
2506  * Appends a two-character hex digit to a string, where the hex digit
2507  * has the value of the given byte.
2508  *
2509  * @param str the string
2510  * @param byte the byte
2511  * @returns #FALSE if no memory
2512  */
2513 dbus_bool_t
2514 _dbus_string_append_byte_as_hex (DBusString *str,
2515                                  int         byte)
2516 {
2517   const char hexdigits[16] = {
2518     '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
2519     'a', 'b', 'c', 'd', 'e', 'f'
2520   };
2521
2522   if (!_dbus_string_append_byte (str,
2523                                  hexdigits[(byte >> 4)]))
2524     return FALSE;
2525   
2526   if (!_dbus_string_append_byte (str,
2527                                  hexdigits[(byte & 0x0f)]))
2528     {
2529       _dbus_string_set_length (str,
2530                                _dbus_string_get_length (str) - 1);
2531       return FALSE;
2532     }
2533
2534   return TRUE;
2535 }
2536
2537 /**
2538  * Encodes a string in hex, the way MD5 and SHA-1 are usually
2539  * encoded. (Each byte is two hex digits.)
2540  *
2541  * @param source the string to encode
2542  * @param start byte index to start encoding
2543  * @param dest string where encoded data should be placed
2544  * @param insert_at where to place encoded data
2545  * @returns #TRUE if encoding was successful, #FALSE if no memory etc.
2546  */
2547 dbus_bool_t
2548 _dbus_string_hex_encode (const DBusString *source,
2549                          int               start,
2550                          DBusString       *dest,
2551                          int               insert_at)
2552 {
2553   DBusString result;
2554   const unsigned char *p;
2555   const unsigned char *end;
2556   dbus_bool_t retval;
2557   
2558   _dbus_assert (start <= _dbus_string_get_length (source));
2559
2560   if (!_dbus_string_init (&result))
2561     return FALSE;
2562
2563   retval = FALSE;
2564   
2565   p = (const unsigned char*) _dbus_string_get_const_data (source);
2566   end = p + _dbus_string_get_length (source);
2567   p += start;
2568   
2569   while (p != end)
2570     {
2571       if (!_dbus_string_append_byte_as_hex (&result, *p))
2572         goto out;
2573       
2574       ++p;
2575     }
2576
2577   if (!_dbus_string_move (&result, 0, dest, insert_at))
2578     goto out;
2579
2580   retval = TRUE;
2581
2582  out:
2583   _dbus_string_free (&result);
2584   return retval;
2585 }
2586
2587 /**
2588  * Decodes a string from hex encoding.
2589  *
2590  * @param source the string to decode
2591  * @param start byte index to start decode
2592  * @param end_return return location of the end of the hex data, or #NULL
2593  * @param dest string where decoded data should be placed
2594  * @param insert_at where to place decoded data
2595  * @returns #TRUE if decoding was successful, #FALSE if no memory.
2596  */
2597 dbus_bool_t
2598 _dbus_string_hex_decode (const DBusString *source,
2599                          int               start,
2600                          int              *end_return,
2601                          DBusString       *dest,
2602                          int               insert_at)
2603 {
2604   DBusString result;
2605   const unsigned char *p;
2606   const unsigned char *end;
2607   dbus_bool_t retval;
2608   dbus_bool_t high_bits;
2609   
2610   _dbus_assert (start <= _dbus_string_get_length (source));
2611
2612   if (!_dbus_string_init (&result))
2613     return FALSE;
2614
2615   retval = FALSE;
2616
2617   high_bits = TRUE;
2618   p = (const unsigned char*) _dbus_string_get_const_data (source);
2619   end = p + _dbus_string_get_length (source);
2620   p += start;
2621   
2622   while (p != end)
2623     {
2624       unsigned int val;
2625
2626       switch (*p)
2627         {
2628         case '0':
2629           val = 0;
2630           break;
2631         case '1':
2632           val = 1;
2633           break;
2634         case '2':
2635           val = 2;
2636           break;
2637         case '3':
2638           val = 3;
2639           break;
2640         case '4':
2641           val = 4;
2642           break;
2643         case '5':
2644           val = 5;
2645           break;
2646         case '6':
2647           val = 6;
2648           break;
2649         case '7':
2650           val = 7;
2651           break;
2652         case '8':
2653           val = 8;
2654           break;
2655         case '9':
2656           val = 9;
2657           break;
2658         case 'a':
2659         case 'A':
2660           val = 10;
2661           break;
2662         case 'b':
2663         case 'B':
2664           val = 11;
2665           break;
2666         case 'c':
2667         case 'C':
2668           val = 12;
2669           break;
2670         case 'd':
2671         case 'D':
2672           val = 13;
2673           break;
2674         case 'e':
2675         case 'E':
2676           val = 14;
2677           break;
2678         case 'f':
2679         case 'F':
2680           val = 15;
2681           break;
2682         default:
2683           goto done;
2684         }
2685
2686       if (high_bits)
2687         {
2688           if (!_dbus_string_append_byte (&result,
2689                                          val << 4))
2690             goto out;
2691         }
2692       else
2693         {
2694           int len;
2695           unsigned char b;
2696
2697           len = _dbus_string_get_length (&result);
2698           
2699           b = _dbus_string_get_byte (&result, len - 1);
2700
2701           b |= val;
2702
2703           _dbus_string_set_byte (&result, len - 1, b);
2704         }
2705
2706       high_bits = !high_bits;
2707
2708       ++p;
2709     }
2710
2711  done:
2712   if (!_dbus_string_move (&result, 0, dest, insert_at))
2713     goto out;
2714
2715   if (end_return)
2716     *end_return = p - (const unsigned char*) _dbus_string_get_const_data (source);
2717
2718   retval = TRUE;
2719   
2720  out:
2721   _dbus_string_free (&result);  
2722   return retval;
2723 }
2724
2725 /**
2726  * Checks that the given range of the string is valid ASCII with no
2727  * nul bytes. If the given range is not entirely contained in the
2728  * string, returns #FALSE.
2729  *
2730  * @todo this is inconsistent with most of DBusString in that
2731  * it allows a start,len range that extends past the string end.
2732  * 
2733  * @param str the string
2734  * @param start first byte index to check
2735  * @param len number of bytes to check
2736  * @returns #TRUE if the byte range exists and is all valid ASCII
2737  */
2738 dbus_bool_t
2739 _dbus_string_validate_ascii (const DBusString *str,
2740                              int               start,
2741                              int               len)
2742 {
2743   const unsigned char *s;
2744   const unsigned char *end;
2745   DBUS_CONST_STRING_PREAMBLE (str);
2746   _dbus_assert (start >= 0);
2747   _dbus_assert (start <= real->len);
2748   _dbus_assert (len >= 0);
2749   
2750   if (len > real->len - start)
2751     return FALSE;
2752   
2753   s = real->str + start;
2754   end = s + len;
2755   while (s != end)
2756     {
2757       if (_DBUS_UNLIKELY (!_DBUS_ISASCII (*s)))
2758         return FALSE;
2759         
2760       ++s;
2761     }
2762   
2763   return TRUE;
2764 }
2765
2766 /**
2767  * Converts the given range of the string to lower case.
2768  *
2769  * @param str the string
2770  * @param start first byte index to convert
2771  * @param len number of bytes to convert
2772  */
2773 void
2774 _dbus_string_tolower_ascii (const DBusString *str,
2775                             int               start,
2776                             int               len)
2777 {
2778   unsigned char *s;
2779   unsigned char *end;
2780   DBUS_STRING_PREAMBLE (str);
2781   _dbus_assert (start >= 0);
2782   _dbus_assert (start <= real->len);
2783   _dbus_assert (len >= 0);
2784   _dbus_assert (len <= real->len - start);
2785
2786   s = real->str + start;
2787   end = s + len;
2788
2789   while (s != end)
2790     {
2791       if (*s >= 'A' && *s <= 'Z')
2792           *s += 'a' - 'A';
2793       ++s;
2794     }
2795 }
2796
2797 /**
2798  * Converts the given range of the string to upper case.
2799  *
2800  * @param str the string
2801  * @param start first byte index to convert
2802  * @param len number of bytes to convert
2803  */
2804 void
2805 _dbus_string_toupper_ascii (const DBusString *str,
2806                             int               start,
2807                             int               len)
2808 {
2809   unsigned char *s;
2810   unsigned char *end;
2811   DBUS_STRING_PREAMBLE (str);
2812   _dbus_assert (start >= 0);
2813   _dbus_assert (start <= real->len);
2814   _dbus_assert (len >= 0);
2815   _dbus_assert (len <= real->len - start);
2816
2817   s = real->str + start;
2818   end = s + len;
2819
2820   while (s != end)
2821     {
2822       if (*s >= 'a' && *s <= 'z')
2823           *s += 'A' - 'a';
2824       ++s;
2825     }
2826 }
2827
2828 /**
2829  * Checks that the given range of the string is valid UTF-8. If the
2830  * given range is not entirely contained in the string, returns
2831  * #FALSE. If the string contains any nul bytes in the given range,
2832  * returns #FALSE. If the start and start+len are not on character
2833  * boundaries, returns #FALSE.
2834  *
2835  * @todo this is inconsistent with most of DBusString in that
2836  * it allows a start,len range that extends past the string end.
2837  * 
2838  * @param str the string
2839  * @param start first byte index to check
2840  * @param len number of bytes to check
2841  * @returns #TRUE if the byte range exists and is all valid UTF-8
2842  */
2843 dbus_bool_t
2844 _dbus_string_validate_utf8  (const DBusString *str,
2845                              int               start,
2846                              int               len)
2847 {
2848   const unsigned char *p;
2849   const unsigned char *end;
2850   DBUS_CONST_STRING_PREAMBLE (str);
2851   _dbus_assert (start >= 0);
2852   _dbus_assert (start <= real->len);
2853   _dbus_assert (len >= 0);
2854
2855   /* we are doing _DBUS_UNLIKELY() here which might be
2856    * dubious in a generic library like GLib, but in D-Bus
2857    * we know we're validating messages and that it would
2858    * only be evil/broken apps that would have invalid
2859    * UTF-8. Also, this function seems to be a performance
2860    * bottleneck in profiles.
2861    */
2862   
2863   if (_DBUS_UNLIKELY (len > real->len - start))
2864     return FALSE;
2865   
2866   p = real->str + start;
2867   end = p + len;
2868   
2869   while (p < end)
2870     {
2871       int i, mask, char_len;
2872       dbus_unichar_t result;
2873
2874       /* nul bytes considered invalid */
2875       if (*p == '\0')
2876         break;
2877       
2878       /* Special-case ASCII; this makes us go a lot faster in
2879        * D-Bus profiles where we are typically validating
2880        * function names and such. We have to know that
2881        * all following checks will pass for ASCII though,
2882        * comments follow ...
2883        */      
2884       if (*p < 128)
2885         {
2886           ++p;
2887           continue;
2888         }
2889       
2890       UTF8_COMPUTE (*p, mask, char_len);
2891
2892       if (_DBUS_UNLIKELY (char_len == 0))  /* ASCII: char_len == 1 */
2893         break;
2894
2895       /* check that the expected number of bytes exists in the remaining length */
2896       if (_DBUS_UNLIKELY ((end - p) < char_len)) /* ASCII: p < end and char_len == 1 */
2897         break;
2898         
2899       UTF8_GET (result, p, i, mask, char_len);
2900
2901       /* Check for overlong UTF-8 */
2902       if (_DBUS_UNLIKELY (UTF8_LENGTH (result) != char_len)) /* ASCII: UTF8_LENGTH == 1 */
2903         break;
2904 #if 0
2905       /* The UNICODE_VALID check below will catch this */
2906       if (_DBUS_UNLIKELY (result == (dbus_unichar_t)-1)) /* ASCII: result = ascii value */
2907         break;
2908 #endif
2909
2910       if (_DBUS_UNLIKELY (!UNICODE_VALID (result))) /* ASCII: always valid */
2911         break;
2912
2913       /* UNICODE_VALID should have caught it */
2914       _dbus_assert (result != (dbus_unichar_t)-1);
2915       
2916       p += char_len;
2917     }
2918
2919   /* See that we covered the entire length if a length was
2920    * passed in
2921    */
2922   if (_DBUS_UNLIKELY (p != end))
2923     return FALSE;
2924   else
2925     return TRUE;
2926 }
2927
2928 /**
2929  * Checks that the given range of the string is all nul bytes. If the
2930  * given range is not entirely contained in the string, returns
2931  * #FALSE.
2932  *
2933  * @todo this is inconsistent with most of DBusString in that
2934  * it allows a start,len range that extends past the string end.
2935  * 
2936  * @param str the string
2937  * @param start first byte index to check
2938  * @param len number of bytes to check
2939  * @returns #TRUE if the byte range exists and is all nul bytes
2940  */
2941 dbus_bool_t
2942 _dbus_string_validate_nul (const DBusString *str,
2943                            int               start,
2944                            int               len)
2945 {
2946   const unsigned char *s;
2947   const unsigned char *end;
2948   DBUS_CONST_STRING_PREAMBLE (str);
2949   _dbus_assert (start >= 0);
2950   _dbus_assert (len >= 0);
2951   _dbus_assert (start <= real->len);
2952   
2953   if (len > real->len - start)
2954     return FALSE;
2955   
2956   s = real->str + start;
2957   end = s + len;
2958   while (s != end)
2959     {
2960       if (_DBUS_UNLIKELY (*s != '\0'))
2961         return FALSE;
2962       ++s;
2963     }
2964   
2965   return TRUE;
2966 }
2967
2968 /**
2969  * Clears all allocated bytes in the string to zero.
2970  *
2971  * @param str the string
2972  */
2973 void
2974 _dbus_string_zero (DBusString *str)
2975 {
2976   DBUS_STRING_PREAMBLE (str);
2977
2978   memset (real->str - real->align_offset, '\0', real->allocated);
2979 }
2980 /** @} */
2981
2982 /* tests are in dbus-string-util.c */