Imported Upstream version 0.9.4
[platform/upstream/libunistring.git] / tests / test-mbrtowc.c
1 /* Test of conversion of multibyte character to wide character.
2    Copyright (C) 2008-2014 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation; either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>.  */
16
17 /* Written by Bruno Haible <bruno@clisp.org>, 2008.  */
18
19 #include <config.h>
20
21 #include <wchar.h>
22
23 #include "signature.h"
24 SIGNATURE_CHECK (mbrtowc, size_t, (wchar_t *, char const *, size_t,
25                                    mbstate_t *));
26
27 #include <locale.h>
28 #include <stdio.h>
29 #include <string.h>
30
31 #include "macros.h"
32
33 int
34 main (int argc, char *argv[])
35 {
36   mbstate_t state;
37   wchar_t wc;
38   size_t ret;
39
40   /* configure should already have checked that the locale is supported.  */
41   if (setlocale (LC_ALL, "") == NULL)
42     return 1;
43
44   /* Test zero-length input.  */
45   {
46     memset (&state, '\0', sizeof (mbstate_t));
47     wc = (wchar_t) 0xBADFACE;
48     ret = mbrtowc (&wc, "x", 0, &state);
49     ASSERT (ret == (size_t)(-2));
50     ASSERT (mbsinit (&state));
51   }
52
53   /* Test NUL byte input.  */
54   {
55     memset (&state, '\0', sizeof (mbstate_t));
56     wc = (wchar_t) 0xBADFACE;
57     ret = mbrtowc (&wc, "", 1, &state);
58     ASSERT (ret == 0);
59     ASSERT (wc == 0);
60     ASSERT (mbsinit (&state));
61     ret = mbrtowc (NULL, "", 1, &state);
62     ASSERT (ret == 0);
63     ASSERT (mbsinit (&state));
64   }
65
66   /* Test single-byte input.  */
67   {
68     int c;
69     char buf[1];
70
71     memset (&state, '\0', sizeof (mbstate_t));
72     for (c = 0; c < 0x100; c++)
73       switch (c)
74         {
75         case '\t': case '\v': case '\f':
76         case ' ': case '!': case '"': case '#': case '%':
77         case '&': case '\'': case '(': case ')': case '*':
78         case '+': case ',': case '-': case '.': case '/':
79         case '0': case '1': case '2': case '3': case '4':
80         case '5': case '6': case '7': case '8': case '9':
81         case ':': case ';': case '<': case '=': case '>':
82         case '?':
83         case 'A': case 'B': case 'C': case 'D': case 'E':
84         case 'F': case 'G': case 'H': case 'I': case 'J':
85         case 'K': case 'L': case 'M': case 'N': case 'O':
86         case 'P': case 'Q': case 'R': case 'S': case 'T':
87         case 'U': case 'V': case 'W': case 'X': case 'Y':
88         case 'Z':
89         case '[': case '\\': case ']': case '^': case '_':
90         case 'a': case 'b': case 'c': case 'd': case 'e':
91         case 'f': case 'g': case 'h': case 'i': case 'j':
92         case 'k': case 'l': case 'm': case 'n': case 'o':
93         case 'p': case 'q': case 'r': case 's': case 't':
94         case 'u': case 'v': case 'w': case 'x': case 'y':
95         case 'z': case '{': case '|': case '}': case '~':
96           /* c is in the ISO C "basic character set".  */
97           buf[0] = c;
98           wc = (wchar_t) 0xBADFACE;
99           ret = mbrtowc (&wc, buf, 1, &state);
100           ASSERT (ret == 1);
101           ASSERT (wc == c);
102           ASSERT (mbsinit (&state));
103           ret = mbrtowc (NULL, buf, 1, &state);
104           ASSERT (ret == 1);
105           ASSERT (mbsinit (&state));
106           break;
107         }
108   }
109
110   /* Test special calling convention, passing a NULL pointer.  */
111   {
112     memset (&state, '\0', sizeof (mbstate_t));
113     wc = (wchar_t) 0xBADFACE;
114     ret = mbrtowc (&wc, NULL, 5, &state);
115     ASSERT (ret == 0);
116     ASSERT (wc == (wchar_t) 0xBADFACE);
117     ASSERT (mbsinit (&state));
118   }
119
120   if (argc > 1)
121     switch (argv[1][0])
122       {
123       case '1':
124         /* Locale encoding is ISO-8859-1 or ISO-8859-15.  */
125         {
126           char input[] = "B\374\337er"; /* "Büßer" */
127           memset (&state, '\0', sizeof (mbstate_t));
128
129           wc = (wchar_t) 0xBADFACE;
130           ret = mbrtowc (&wc, input, 1, &state);
131           ASSERT (ret == 1);
132           ASSERT (wc == 'B');
133           ASSERT (mbsinit (&state));
134           input[0] = '\0';
135
136           wc = (wchar_t) 0xBADFACE;
137           ret = mbrtowc (&wc, input + 1, 1, &state);
138           ASSERT (ret == 1);
139           ASSERT (wctob (wc) == (unsigned char) '\374');
140           ASSERT (mbsinit (&state));
141           input[1] = '\0';
142
143           /* Test support of NULL first argument.  */
144           ret = mbrtowc (NULL, input + 2, 3, &state);
145           ASSERT (ret == 1);
146           ASSERT (mbsinit (&state));
147
148           wc = (wchar_t) 0xBADFACE;
149           ret = mbrtowc (&wc, input + 2, 3, &state);
150           ASSERT (ret == 1);
151           ASSERT (wctob (wc) == (unsigned char) '\337');
152           ASSERT (mbsinit (&state));
153           input[2] = '\0';
154
155           wc = (wchar_t) 0xBADFACE;
156           ret = mbrtowc (&wc, input + 3, 2, &state);
157           ASSERT (ret == 1);
158           ASSERT (wc == 'e');
159           ASSERT (mbsinit (&state));
160           input[3] = '\0';
161
162           wc = (wchar_t) 0xBADFACE;
163           ret = mbrtowc (&wc, input + 4, 1, &state);
164           ASSERT (ret == 1);
165           ASSERT (wc == 'r');
166           ASSERT (mbsinit (&state));
167         }
168         return 0;
169
170       case '2':
171         /* Locale encoding is UTF-8.  */
172         {
173           char input[] = "B\303\274\303\237er"; /* "Büßer" */
174           memset (&state, '\0', sizeof (mbstate_t));
175
176           wc = (wchar_t) 0xBADFACE;
177           ret = mbrtowc (&wc, input, 1, &state);
178           ASSERT (ret == 1);
179           ASSERT (wc == 'B');
180           ASSERT (mbsinit (&state));
181           input[0] = '\0';
182
183           wc = (wchar_t) 0xBADFACE;
184           ret = mbrtowc (&wc, input + 1, 1, &state);
185           ASSERT (ret == (size_t)(-2));
186           ASSERT (wc == (wchar_t) 0xBADFACE);
187           ASSERT (!mbsinit (&state));
188           input[1] = '\0';
189
190           wc = (wchar_t) 0xBADFACE;
191           ret = mbrtowc (&wc, input + 2, 5, &state);
192           ASSERT (ret == 1);
193           ASSERT (wctob (wc) == EOF);
194           ASSERT (mbsinit (&state));
195           input[2] = '\0';
196
197           /* Test support of NULL first argument.  */
198           ret = mbrtowc (NULL, input + 3, 4, &state);
199           ASSERT (ret == 2);
200           ASSERT (mbsinit (&state));
201
202           wc = (wchar_t) 0xBADFACE;
203           ret = mbrtowc (&wc, input + 3, 4, &state);
204           ASSERT (ret == 2);
205           ASSERT (wctob (wc) == EOF);
206           ASSERT (mbsinit (&state));
207           input[3] = '\0';
208           input[4] = '\0';
209
210           wc = (wchar_t) 0xBADFACE;
211           ret = mbrtowc (&wc, input + 5, 2, &state);
212           ASSERT (ret == 1);
213           ASSERT (wc == 'e');
214           ASSERT (mbsinit (&state));
215           input[5] = '\0';
216
217           wc = (wchar_t) 0xBADFACE;
218           ret = mbrtowc (&wc, input + 6, 1, &state);
219           ASSERT (ret == 1);
220           ASSERT (wc == 'r');
221           ASSERT (mbsinit (&state));
222         }
223         return 0;
224
225       case '3':
226         /* Locale encoding is EUC-JP.  */
227         {
228           char input[] = "<\306\374\313\334\270\354>"; /* "<日本語>" */
229           memset (&state, '\0', sizeof (mbstate_t));
230
231           wc = (wchar_t) 0xBADFACE;
232           ret = mbrtowc (&wc, input, 1, &state);
233           ASSERT (ret == 1);
234           ASSERT (wc == '<');
235           ASSERT (mbsinit (&state));
236           input[0] = '\0';
237
238           wc = (wchar_t) 0xBADFACE;
239           ret = mbrtowc (&wc, input + 1, 2, &state);
240           ASSERT (ret == 2);
241           ASSERT (wctob (wc) == EOF);
242           ASSERT (mbsinit (&state));
243           input[1] = '\0';
244           input[2] = '\0';
245
246           wc = (wchar_t) 0xBADFACE;
247           ret = mbrtowc (&wc, input + 3, 1, &state);
248           ASSERT (ret == (size_t)(-2));
249           ASSERT (wc == (wchar_t) 0xBADFACE);
250           ASSERT (!mbsinit (&state));
251           input[3] = '\0';
252
253           wc = (wchar_t) 0xBADFACE;
254           ret = mbrtowc (&wc, input + 4, 4, &state);
255           ASSERT (ret == 1);
256           ASSERT (wctob (wc) == EOF);
257           ASSERT (mbsinit (&state));
258           input[4] = '\0';
259
260           /* Test support of NULL first argument.  */
261           ret = mbrtowc (NULL, input + 5, 3, &state);
262           ASSERT (ret == 2);
263           ASSERT (mbsinit (&state));
264
265           wc = (wchar_t) 0xBADFACE;
266           ret = mbrtowc (&wc, input + 5, 3, &state);
267           ASSERT (ret == 2);
268           ASSERT (wctob (wc) == EOF);
269           ASSERT (mbsinit (&state));
270           input[5] = '\0';
271           input[6] = '\0';
272
273           wc = (wchar_t) 0xBADFACE;
274           ret = mbrtowc (&wc, input + 7, 1, &state);
275           ASSERT (ret == 1);
276           ASSERT (wc == '>');
277           ASSERT (mbsinit (&state));
278         }
279         return 0;
280
281       case '4':
282         /* Locale encoding is GB18030.  */
283         {
284           char input[] = "B\250\271\201\060\211\070er"; /* "Büßer" */
285           memset (&state, '\0', sizeof (mbstate_t));
286
287           wc = (wchar_t) 0xBADFACE;
288           ret = mbrtowc (&wc, input, 1, &state);
289           ASSERT (ret == 1);
290           ASSERT (wc == 'B');
291           ASSERT (mbsinit (&state));
292           input[0] = '\0';
293
294           wc = (wchar_t) 0xBADFACE;
295           ret = mbrtowc (&wc, input + 1, 1, &state);
296           ASSERT (ret == (size_t)(-2));
297           ASSERT (wc == (wchar_t) 0xBADFACE);
298           ASSERT (!mbsinit (&state));
299           input[1] = '\0';
300
301           wc = (wchar_t) 0xBADFACE;
302           ret = mbrtowc (&wc, input + 2, 7, &state);
303           ASSERT (ret == 1);
304           ASSERT (wctob (wc) == EOF);
305           ASSERT (mbsinit (&state));
306           input[2] = '\0';
307
308           /* Test support of NULL first argument.  */
309           ret = mbrtowc (NULL, input + 3, 6, &state);
310           ASSERT (ret == 4);
311           ASSERT (mbsinit (&state));
312
313           wc = (wchar_t) 0xBADFACE;
314           ret = mbrtowc (&wc, input + 3, 6, &state);
315           ASSERT (ret == 4);
316           ASSERT (wctob (wc) == EOF);
317           ASSERT (mbsinit (&state));
318           input[3] = '\0';
319           input[4] = '\0';
320           input[5] = '\0';
321           input[6] = '\0';
322
323           wc = (wchar_t) 0xBADFACE;
324           ret = mbrtowc (&wc, input + 7, 2, &state);
325           ASSERT (ret == 1);
326           ASSERT (wc == 'e');
327           ASSERT (mbsinit (&state));
328           input[5] = '\0';
329
330           wc = (wchar_t) 0xBADFACE;
331           ret = mbrtowc (&wc, input + 8, 1, &state);
332           ASSERT (ret == 1);
333           ASSERT (wc == 'r');
334           ASSERT (mbsinit (&state));
335         }
336         return 0;
337       }
338
339   return 1;
340 }