Tizen 2.0 Release
[external/tizen-coreutils.git] / lib / mbswidth.c
1 /* Determine the number of screen columns needed for a string.
2    Copyright (C) 2000-2007 Free Software Foundation, Inc.
3
4    This program is free software; you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation; either version 2, or (at your option)
7    any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program; if not, write to the Free Software Foundation,
16    Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.  */
17
18 /* Written by Bruno Haible <haible@clisp.cons.org>.  */
19
20 #include <config.h>
21
22 /* Specification.  */
23 #include "mbswidth.h"
24
25 /* Get MB_CUR_MAX.  */
26 #include <stdlib.h>
27
28 #include <string.h>
29
30 /* Get isprint().  */
31 #include <ctype.h>
32
33 /* Get mbstate_t, mbrtowc(), mbsinit().  */
34 #include <wchar.h>
35
36 /* Get wcwidth().  */
37 #include "wcwidth.h"
38
39 /* Get iswcntrl().  */
40 #include <wctype.h>
41
42 #ifndef mbsinit
43 # if !HAVE_MBSINIT
44 #  define mbsinit(ps) 1
45 # endif
46 #endif
47
48 /* Returns the number of columns needed to represent the multibyte
49    character string pointed to by STRING.  If a non-printable character
50    occurs, and MBSW_REJECT_UNPRINTABLE is specified, -1 is returned.
51    With flags = MBSW_REJECT_INVALID | MBSW_REJECT_UNPRINTABLE, this is
52    the multibyte analogue of the wcswidth function.
53    If STRING is not of length < INT_MAX / 2, integer overflow can occur.  */
54 int
55 mbswidth (const char *string, int flags)
56 {
57   return mbsnwidth (string, strlen (string), flags);
58 }
59
60 /* Returns the number of columns needed to represent the multibyte
61    character string pointed to by STRING of length NBYTES.  If a
62    non-printable character occurs, and MBSW_REJECT_UNPRINTABLE is
63    specified, -1 is returned.
64    If NBYTES is not < INT_MAX / 2, integer overflow can occur.  */
65 int
66 mbsnwidth (const char *string, size_t nbytes, int flags)
67 {
68   const char *p = string;
69   const char *plimit = p + nbytes;
70   int width;
71
72   width = 0;
73 #if HAVE_MBRTOWC
74   if (MB_CUR_MAX > 1)
75     {
76       while (p < plimit)
77         switch (*p)
78           {
79             case ' ': case '!': case '"': case '#': case '%':
80             case '&': case '\'': case '(': case ')': case '*':
81             case '+': case ',': case '-': case '.': case '/':
82             case '0': case '1': case '2': case '3': case '4':
83             case '5': case '6': case '7': case '8': case '9':
84             case ':': case ';': case '<': case '=': case '>':
85             case '?':
86             case 'A': case 'B': case 'C': case 'D': case 'E':
87             case 'F': case 'G': case 'H': case 'I': case 'J':
88             case 'K': case 'L': case 'M': case 'N': case 'O':
89             case 'P': case 'Q': case 'R': case 'S': case 'T':
90             case 'U': case 'V': case 'W': case 'X': case 'Y':
91             case 'Z':
92             case '[': case '\\': case ']': case '^': case '_':
93             case 'a': case 'b': case 'c': case 'd': case 'e':
94             case 'f': case 'g': case 'h': case 'i': case 'j':
95             case 'k': case 'l': case 'm': case 'n': case 'o':
96             case 'p': case 'q': case 'r': case 's': case 't':
97             case 'u': case 'v': case 'w': case 'x': case 'y':
98             case 'z': case '{': case '|': case '}': case '~':
99               /* These characters are printable ASCII characters.  */
100               p++;
101               width++;
102               break;
103             default:
104               /* If we have a multibyte sequence, scan it up to its end.  */
105               {
106                 mbstate_t mbstate;
107                 memset (&mbstate, 0, sizeof mbstate);
108                 do
109                   {
110                     wchar_t wc;
111                     size_t bytes;
112                     int w;
113
114                     bytes = mbrtowc (&wc, p, plimit - p, &mbstate);
115
116                     if (bytes == (size_t) -1)
117                       /* An invalid multibyte sequence was encountered.  */
118                       {
119                         if (!(flags & MBSW_REJECT_INVALID))
120                           {
121                             p++;
122                             width++;
123                             break;
124                           }
125                         else
126                           return -1;
127                       }
128
129                     if (bytes == (size_t) -2)
130                       /* An incomplete multibyte character at the end.  */
131                       {
132                         if (!(flags & MBSW_REJECT_INVALID))
133                           {
134                             p = plimit;
135                             width++;
136                             break;
137                           }
138                         else
139                           return -1;
140                       }
141
142                     if (bytes == 0)
143                       /* A null wide character was encountered.  */
144                       bytes = 1;
145
146                     w = wcwidth (wc);
147                     if (w >= 0)
148                       /* A printable multibyte character.  */
149                       width += w;
150                     else
151                       /* An unprintable multibyte character.  */
152                       if (!(flags & MBSW_REJECT_UNPRINTABLE))
153                         width += (iswcntrl (wc) ? 0 : 1);
154                       else
155                         return -1;
156
157                     p += bytes;
158                   }
159                 while (! mbsinit (&mbstate));
160               }
161               break;
162           }
163       return width;
164     }
165 #endif
166
167   while (p < plimit)
168     {
169       unsigned char c = (unsigned char) *p++;
170
171       if (isprint (c))
172         width++;
173       else if (!(flags & MBSW_REJECT_UNPRINTABLE))
174         width += (iscntrl (c) ? 0 : 1);
175       else
176         return -1;
177     }
178   return width;
179 }