7e31e03f6182ca91e1a313edf24644075f27d477
[platform/upstream/coreutils.git] / src / expand.c
1 /* expand - convert tabs to spaces
2    Copyright (C) 89, 91, 95, 96, 1997, 1998 Free Software Foundation, Inc.
3
4    This program is free software; you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation; either version 2, or (at your option)
7    any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program; if not, write to the Free Software Foundation,
16    Inc., 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.  */
17
18 /* By default, convert all tabs to spaces.
19    Preserves backspace characters in the output; they decrement the
20    column count for tab calculations.
21    The default action is equivalent to -8.
22
23    Options:
24    --tabs=tab1[,tab2[,...]]
25    -t tab1[,tab2[,...]]
26    -tab1[,tab2[,...]]   If only one tab stop is given, set the tabs tab1
27                         spaces apart instead of the default 8.  Otherwise,
28                         set the tabs at columns tab1, tab2, etc. (numbered from
29                         0); replace any tabs beyond the tabstops given with
30                         single spaces.
31    --initial
32    -i                   Only convert initial tabs on each line to spaces.
33
34    David MacKenzie <djm@gnu.ai.mit.edu> */
35
36 #include <config.h>
37
38 #include <stdio.h>
39 #include <getopt.h>
40 #include <sys/types.h>
41 #include "system.h"
42 #include "error.h"
43
44 /* The number of bytes added at a time to the amount of memory
45    allocated for the output line. */
46 #define OUTPUT_BLOCK 256
47
48 /* The number of bytes added at a time to the amount of memory
49    allocated for the list of tabstops. */
50 #define TABLIST_BLOCK 256
51
52 /* The name this program was run with. */
53 char *program_name;
54
55 /* If nonzero, convert blanks even after nonblank characters have been
56    read on the line. */
57 static int convert_entire_line;
58
59 /* If nonzero, the size of all tab stops.  If zero, use `tab_list' instead. */
60 static int tab_size;
61
62 /* Array of the explicit column numbers of the tab stops;
63    after `tab_list' is exhausted, each additional tab is replaced
64    by a space.  The first column is column 0. */
65 static int *tab_list;
66
67 /* The index of the first invalid element of `tab_list',
68    where the next element can be added. */
69 static int first_free_tab;
70
71 /* Null-terminated array of input filenames. */
72 static char **file_list;
73
74 /* Default for `file_list' if no files are given on the command line. */
75 static char *stdin_argv[] =
76 {
77   "-", NULL
78 };
79
80 /* Nonzero if we have ever read standard input. */
81 static int have_read_stdin;
82
83 /* Status to return to the system. */
84 static int exit_status;
85
86 /* If nonzero, display usage information and exit.  */
87 static int show_help;
88
89 /* If nonzero, print the version on standard output then exit.  */
90 static int show_version;
91
92 static struct option const longopts[] =
93 {
94   {"tabs", required_argument, NULL, 't'},
95   {"initial", no_argument, NULL, 'i'},
96   {"help", no_argument, &show_help, 1},
97   {"version", no_argument, &show_version, 1},
98   {NULL, 0, NULL, 0}
99 };
100
101 static void
102 usage (int status)
103 {
104   if (status != 0)
105     fprintf (stderr, _("Try `%s --help' for more information.\n"),
106              program_name);
107   else
108     {
109       printf (_("\
110 Usage: %s [OPTION]... [FILE]...\n\
111 "),
112               program_name);
113       printf (_("\
114 Convert tabs in each FILE to spaces, writing to standard output.\n\
115 With no FILE, or when FILE is -, read standard input.\n\
116 \n\
117   -i, --initial       do not convert TABs after non whitespace\n\
118   -t, --tabs=NUMBER   have tabs NUMBER characters apart, not 8\n\
119   -t, --tabs=LIST     use comma separated list of explicit tab positions\n\
120       --help          display this help and exit\n\
121       --version       output version information and exit\n\
122 \n\
123 Instead of -t NUMBER or -t LIST, -NUMBER or -LIST may be used.\n\
124 "));
125       puts (_("\nReport bugs to <bug-textutils@gnu.org>."));
126     }
127   exit (status == 0 ? EXIT_SUCCESS : EXIT_FAILURE);
128 }
129
130 /* Add tab stop TABVAL to the end of `tab_list', except
131    if TABVAL is -1, do nothing. */
132
133 static void
134 add_tabstop (int tabval)
135 {
136   if (tabval == -1)
137     return;
138   if (first_free_tab % TABLIST_BLOCK == 0)
139     tab_list = (int *) xrealloc ((char *) tab_list,
140                                  (first_free_tab
141                                   + TABLIST_BLOCK * sizeof (tab_list[0])));
142   tab_list[first_free_tab++] = tabval;
143 }
144
145 /* Add the comma or blank separated list of tabstops STOPS
146    to the list of tabstops. */
147
148 static void
149 parse_tabstops (char *stops)
150 {
151   int tabval = -1;
152
153   for (; *stops; stops++)
154     {
155       if (*stops == ',' || ISBLANK (*stops))
156         {
157           add_tabstop (tabval);
158           tabval = -1;
159         }
160       else if (ISDIGIT (*stops))
161         {
162           if (tabval == -1)
163             tabval = 0;
164           tabval = tabval * 10 + *stops - '0';
165         }
166       else
167         error (EXIT_FAILURE, 0, _("tab size contains an invalid character"));
168     }
169
170   add_tabstop (tabval);
171 }
172
173 /* Check that the list of tabstops TABS, with ENTRIES entries,
174    contains only nonzero, ascending values. */
175
176 static void
177 validate_tabstops (int *tabs, int entries)
178 {
179   int prev_tab = 0;
180   int i;
181
182   for (i = 0; i < entries; i++)
183     {
184       if (tabs[i] == 0)
185         error (EXIT_FAILURE, 0, _("tab size cannot be 0"));
186       if (tabs[i] <= prev_tab)
187         error (EXIT_FAILURE, 0, _("tab sizes must be ascending"));
188       prev_tab = tabs[i];
189     }
190 }
191
192 /* Close the old stream pointer FP if it is non-NULL,
193    and return a new one opened to read the next input file.
194    Open a filename of `-' as the standard input.
195    Return NULL if there are no more input files.  */
196
197 static FILE *
198 next_file (FILE *fp)
199 {
200   static char *prev_file;
201   char *file;
202
203   if (fp)
204     {
205       if (ferror (fp))
206         {
207           error (0, errno, "%s", prev_file);
208           exit_status = 1;
209         }
210       if (fp == stdin)
211         clearerr (fp);          /* Also clear EOF. */
212       else if (fclose (fp) == EOF)
213         {
214           error (0, errno, "%s", prev_file);
215           exit_status = 1;
216         }
217     }
218
219   while ((file = *file_list++) != NULL)
220     {
221       if (file[0] == '-' && file[1] == '\0')
222         {
223           have_read_stdin = 1;
224           prev_file = file;
225           return stdin;
226         }
227       fp = fopen (file, "r");
228       if (fp)
229         {
230           prev_file = file;
231           return fp;
232         }
233       error (0, errno, "%s", file);
234       exit_status = 1;
235     }
236   return NULL;
237 }
238
239 /* Change tabs to spaces, writing to stdout.
240    Read each file in `file_list', in order. */
241
242 static void
243 expand (void)
244 {
245   FILE *fp;                     /* Input stream. */
246   int c;                        /* Each input character. */
247   int tab_index = 0;            /* Index in `tab_list' of next tabstop. */
248   int column = 0;               /* Column on screen of the next char. */
249   int next_tab_column;          /* Column the next tab stop is on. */
250   int convert = 1;              /* If nonzero, perform translations. */
251
252   fp = next_file ((FILE *) NULL);
253   if (fp == NULL)
254     return;
255   for (;;)
256     {
257       c = getc (fp);
258       if (c == EOF)
259         {
260           fp = next_file (fp);
261           if (fp == NULL)
262             break;              /* No more files. */
263           else
264             continue;
265         }
266
267       if (c == '\n')
268         {
269           putchar (c);
270           tab_index = 0;
271           column = 0;
272           convert = 1;
273         }
274       else if (c == '\t' && convert)
275         {
276           if (tab_size == 0)
277             {
278               /* Do not let tab_index == first_free_tab;
279                  stop when it is 1 less. */
280               while (tab_index < first_free_tab - 1
281                      && column >= tab_list[tab_index])
282                 tab_index++;
283               next_tab_column = tab_list[tab_index];
284               if (tab_index < first_free_tab - 1)
285                 tab_index++;
286               if (column >= next_tab_column)
287                 next_tab_column = column + 1; /* Ran out of tab stops. */
288             }
289           else
290             {
291               next_tab_column = column + tab_size - column % tab_size;
292             }
293           while (column < next_tab_column)
294             {
295               putchar (' ');
296               ++column;
297             }
298         }
299       else
300         {
301           if (convert)
302             {
303               if (c == '\b')
304                 {
305                   if (column > 0)
306                     --column;
307                 }
308               else
309                 {
310                   ++column;
311                   if (convert_entire_line == 0)
312                     convert = 0;
313                 }
314             }
315           putchar (c);
316         }
317     }
318 }
319
320 int
321 main (int argc, char **argv)
322 {
323   int tabval = -1;              /* Value of tabstop being read, or -1. */
324   int c;                        /* Option character. */
325
326   have_read_stdin = 0;
327   exit_status = 0;
328   convert_entire_line = 1;
329   tab_list = NULL;
330   first_free_tab = 0;
331   program_name = argv[0];
332   setlocale (LC_ALL, "");
333   bindtextdomain (PACKAGE, LOCALEDIR);
334   textdomain (PACKAGE);
335
336   while ((c = getopt_long (argc, argv, "it:,0123456789", longopts, NULL)) != -1)
337     {
338       switch (c)
339         {
340         case 0:
341           break;
342
343         case '?':
344           usage (1);
345         case 'i':
346           convert_entire_line = 0;
347           break;
348         case 't':
349           parse_tabstops (optarg);
350           break;
351         case ',':
352           add_tabstop (tabval);
353           tabval = -1;
354           break;
355         default:
356           if (tabval == -1)
357             tabval = 0;
358           tabval = tabval * 10 + c - '0';
359           break;
360         }
361     }
362
363   if (show_version)
364     {
365       printf ("expand (%s) %s\n", GNU_PACKAGE, VERSION);
366       exit (EXIT_SUCCESS);
367     }
368
369   if (show_help)
370     usage (0);
371
372   add_tabstop (tabval);
373
374   validate_tabstops (tab_list, first_free_tab);
375
376   if (first_free_tab == 0)
377     tab_size = 8;
378   else if (first_free_tab == 1)
379     tab_size = tab_list[0];
380   else
381     tab_size = 0;
382
383   if (optind == argc)
384     file_list = stdin_argv;
385   else
386     file_list = &argv[optind];
387
388   expand ();
389
390   if (have_read_stdin && fclose (stdin) == EOF)
391     error (EXIT_FAILURE, errno, "-");
392   if (ferror (stdout) || fclose (stdout) == EOF)
393     error (EXIT_FAILURE, errno, _("write error"));
394
395   exit (exit_status == 0 ? EXIT_SUCCESS : EXIT_FAILURE);
396 }