TODO: add an item for a chmod optimization
[platform/upstream/coreutils.git] / src / du.c
1 /* du -- summarize disk usage
2    Copyright (C) 1988-1991, 1995-2008 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation, either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>.  */
16
17 /* Differences from the Unix du:
18    * Doesn't simply ignore the names of regular files given as arguments
19      when -a is given.
20
21    By tege@sics.se, Torbjorn Granlund,
22    and djm@ai.mit.edu, David MacKenzie.
23    Variable blocks added by lm@sgi.com and eggert@twinsun.com.
24    Rewritten to use nftw, then to use fts by Jim Meyering.  */
25
26 #include <config.h>
27 #include <stdio.h>
28 #include <getopt.h>
29 #include <sys/types.h>
30 #include <assert.h>
31 #include "system.h"
32 #include "argmatch.h"
33 #include "error.h"
34 #include "exclude.h"
35 #include "fprintftime.h"
36 #include "hash.h"
37 #include "human.h"
38 #include "quote.h"
39 #include "quotearg.h"
40 #include "readtokens0.h"
41 #include "same.h"
42 #include "stat-time.h"
43 #include "xfts.h"
44 #include "xstrtol.h"
45
46 extern bool fts_debug;
47
48 /* The official name of this program (e.g., no `g' prefix).  */
49 #define PROGRAM_NAME "du"
50
51 #define AUTHORS \
52   proper_name_utf8 ("Torbjorn Granlund", "Torbj\303\266rn Granlund"), \
53   proper_name ("David MacKenzie"), \
54   proper_name ("Paul Eggert"), \
55   proper_name ("Jim Meyering")
56
57 #if DU_DEBUG
58 # define FTS_CROSS_CHECK(Fts) fts_cross_check (Fts)
59 # define DEBUG_OPT "d"
60 #else
61 # define FTS_CROSS_CHECK(Fts)
62 # define DEBUG_OPT
63 #endif
64
65 /* Initial size of the hash table.  */
66 #define INITIAL_TABLE_SIZE 103
67
68 /* Hash structure for inode and device numbers.  The separate entry
69    structure makes it easier to rehash "in place".  */
70
71 struct entry
72 {
73   ino_t st_ino;
74   dev_t st_dev;
75 };
76
77 /* A set of dev/ino pairs.  */
78 static Hash_table *htab;
79
80 /* Define a class for collecting directory information. */
81
82 struct duinfo
83 {
84   /* Size of files in directory.  */
85   uintmax_t size;
86
87   /* Latest time stamp found.  If tmax.tv_sec == TYPE_MINIMUM (time_t)
88      && tmax.tv_nsec < 0, no time stamp has been found.  */
89   struct timespec tmax;
90 };
91
92 /* Initialize directory data.  */
93 static inline void
94 duinfo_init (struct duinfo *a)
95 {
96   a->size = 0;
97   a->tmax.tv_sec = TYPE_MINIMUM (time_t);
98   a->tmax.tv_nsec = -1;
99 }
100
101 /* Set directory data.  */
102 static inline void
103 duinfo_set (struct duinfo *a, uintmax_t size, struct timespec tmax)
104 {
105   a->size = size;
106   a->tmax = tmax;
107 }
108
109 /* Accumulate directory data.  */
110 static inline void
111 duinfo_add (struct duinfo *a, struct duinfo const *b)
112 {
113   a->size += b->size;
114   if (timespec_cmp (a->tmax, b->tmax) < 0)
115     a->tmax = b->tmax;
116 }
117
118 /* A structure for per-directory level information.  */
119 struct dulevel
120 {
121   /* Entries in this directory.  */
122   struct duinfo ent;
123
124   /* Total for subdirectories.  */
125   struct duinfo subdir;
126 };
127
128 /* If true, display counts for all files, not just directories.  */
129 static bool opt_all = false;
130
131 /* If true, rather than using the disk usage of each file,
132    use the apparent size (a la stat.st_size).  */
133 static bool apparent_size = false;
134
135 /* If true, count each hard link of files with multiple links.  */
136 static bool opt_count_all = false;
137
138 /* If true, output the NUL byte instead of a newline at the end of each line. */
139 static bool opt_nul_terminate_output = false;
140
141 /* If true, print a grand total at the end.  */
142 static bool print_grand_total = false;
143
144 /* If nonzero, do not add sizes of subdirectories.  */
145 static bool opt_separate_dirs = false;
146
147 /* Show the total for each directory (and file if --all) that is at
148    most MAX_DEPTH levels down from the root of the hierarchy.  The root
149    is at level 0, so `du --max-depth=0' is equivalent to `du -s'.  */
150 static size_t max_depth = SIZE_MAX;
151
152 /* Human-readable options for output.  */
153 static int human_output_opts;
154
155 /* If true, print most recently modified date, using the specified format.  */
156 static bool opt_time = false;
157
158 /* Type of time to display. controlled by --time.  */
159
160 enum time_type
161   {
162     time_mtime,                 /* default */
163     time_ctime,
164     time_atime
165   };
166
167 static enum time_type time_type = time_mtime;
168
169 /* User specified date / time style */
170 static char const *time_style = NULL;
171
172 /* Format used to display date / time. Controlled by --time-style */
173 static char const *time_format = NULL;
174
175 /* The units to use when printing sizes.  */
176 static uintmax_t output_block_size;
177
178 /* File name patterns to exclude.  */
179 static struct exclude *exclude;
180
181 /* Grand total size of all args, in bytes. Also latest modified date. */
182 static struct duinfo tot_dui;
183
184 #define IS_DIR_TYPE(Type)       \
185   ((Type) == FTS_DP             \
186    || (Type) == FTS_DNR)
187
188 /* For long options that have no equivalent short option, use a
189    non-character as a pseudo short option, starting with CHAR_MAX + 1.  */
190 enum
191 {
192   APPARENT_SIZE_OPTION = CHAR_MAX + 1,
193   EXCLUDE_OPTION,
194   FILES0_FROM_OPTION,
195   HUMAN_SI_OPTION,
196   MAX_DEPTH_OPTION,
197   MEGABYTES_LONG_OPTION,
198   TIME_OPTION,
199   TIME_STYLE_OPTION
200 };
201
202 static struct option const long_options[] =
203 {
204   {"all", no_argument, NULL, 'a'},
205   {"apparent-size", no_argument, NULL, APPARENT_SIZE_OPTION},
206   {"block-size", required_argument, NULL, 'B'},
207   {"bytes", no_argument, NULL, 'b'},
208   {"count-links", no_argument, NULL, 'l'},
209   {"dereference", no_argument, NULL, 'L'},
210   {"dereference-args", no_argument, NULL, 'D'},
211   {"exclude", required_argument, NULL, EXCLUDE_OPTION},
212   {"exclude-from", required_argument, NULL, 'X'},
213   {"files0-from", required_argument, NULL, FILES0_FROM_OPTION},
214   {"human-readable", no_argument, NULL, 'h'},
215   {"si", no_argument, NULL, HUMAN_SI_OPTION},
216   {"max-depth", required_argument, NULL, MAX_DEPTH_OPTION},
217   {"null", no_argument, NULL, '0'},
218   {"no-dereference", no_argument, NULL, 'P'},
219   {"one-file-system", no_argument, NULL, 'x'},
220   {"separate-dirs", no_argument, NULL, 'S'},
221   {"summarize", no_argument, NULL, 's'},
222   {"total", no_argument, NULL, 'c'},
223   {"time", optional_argument, NULL, TIME_OPTION},
224   {"time-style", required_argument, NULL, TIME_STYLE_OPTION},
225   {GETOPT_HELP_OPTION_DECL},
226   {GETOPT_VERSION_OPTION_DECL},
227   {NULL, 0, NULL, 0}
228 };
229
230 static char const *const time_args[] =
231 {
232   "atime", "access", "use", "ctime", "status", NULL
233 };
234 static enum time_type const time_types[] =
235 {
236   time_atime, time_atime, time_atime, time_ctime, time_ctime
237 };
238 ARGMATCH_VERIFY (time_args, time_types);
239
240 /* `full-iso' uses full ISO-style dates and times.  `long-iso' uses longer
241    ISO-style time stamps, though shorter than `full-iso'.  `iso' uses shorter
242    ISO-style time stamps.  */
243 enum time_style
244   {
245     full_iso_time_style,       /* --time-style=full-iso */
246     long_iso_time_style,       /* --time-style=long-iso */
247     iso_time_style             /* --time-style=iso */
248   };
249
250 static char const *const time_style_args[] =
251 {
252   "full-iso", "long-iso", "iso", NULL
253 };
254 static enum time_style const time_style_types[] =
255 {
256   full_iso_time_style, long_iso_time_style, iso_time_style
257 };
258 ARGMATCH_VERIFY (time_style_args, time_style_types);
259
260 void
261 usage (int status)
262 {
263   if (status != EXIT_SUCCESS)
264     fprintf (stderr, _("Try `%s --help' for more information.\n"),
265              program_name);
266   else
267     {
268       printf (_("\
269 Usage: %s [OPTION]... [FILE]...\n\
270   or:  %s [OPTION]... --files0-from=F\n\
271 "), program_name, program_name);
272       fputs (_("\
273 Summarize disk usage of each FILE, recursively for directories.\n\
274 \n\
275 "), stdout);
276       fputs (_("\
277 Mandatory arguments to long options are mandatory for short options too.\n\
278 "), stdout);
279       fputs (_("\
280   -a, --all             write counts for all files, not just directories\n\
281       --apparent-size   print apparent sizes, rather than disk usage; although\n\
282                           the apparent size is usually smaller, it may be\n\
283                           larger due to holes in (`sparse') files, internal\n\
284                           fragmentation, indirect blocks, and the like\n\
285 "), stdout);
286       fputs (_("\
287   -B, --block-size=SIZE  use SIZE-byte blocks\n\
288   -b, --bytes           equivalent to `--apparent-size --block-size=1'\n\
289   -c, --total           produce a grand total\n\
290   -D, --dereference-args  dereference only symlinks that are listed on the\n\
291                           command line\n\
292 "), stdout);
293       fputs (_("\
294       --files0-from=F   summarize disk usage of the NUL-terminated file\n\
295                           names specified in file F\n\
296   -H                    like --si, but also evokes a warning; will soon\n\
297                           change to be equivalent to --dereference-args (-D)\n\
298   -h, --human-readable  print sizes in human readable format (e.g., 1K 234M 2G)\n\
299       --si              like -h, but use powers of 1000 not 1024\n\
300 "), stdout);
301       fputs (_("\
302   -k                    like --block-size=1K\n\
303   -l, --count-links     count sizes many times if hard linked\n\
304   -m                    like --block-size=1M\n\
305 "), stdout);
306       fputs (_("\
307   -L, --dereference     dereference all symbolic links\n\
308   -P, --no-dereference  don't follow any symbolic links (this is the default)\n\
309   -0, --null            end each output line with 0 byte rather than newline\n\
310   -S, --separate-dirs   do not include size of subdirectories\n\
311   -s, --summarize       display only a total for each argument\n\
312 "), stdout);
313       fputs (_("\
314   -x, --one-file-system    skip directories on different file systems\n\
315   -X, --exclude-from=FILE  exclude files that match any pattern in FILE\n\
316       --exclude=PATTERN    exclude files that match PATTERN\n\
317       --max-depth=N     print the total for a directory (or file, with --all)\n\
318                           only if it is N or fewer levels below the command\n\
319                           line argument;  --max-depth=0 is the same as\n\
320                           --summarize\n\
321 "), stdout);
322       fputs (_("\
323       --time            show time of the last modification of any file in the\n\
324                           directory, or any of its subdirectories\n\
325       --time=WORD       show time as WORD instead of modification time:\n\
326                           atime, access, use, ctime or status\n\
327       --time-style=STYLE  show times using style STYLE:\n\
328                           full-iso, long-iso, iso, +FORMAT\n\
329                           FORMAT is interpreted like `date'\n\
330 "), stdout);
331       fputs (HELP_OPTION_DESCRIPTION, stdout);
332       fputs (VERSION_OPTION_DESCRIPTION, stdout);
333       fputs (_("\n\
334 SIZE may be (or may be an integer optionally followed by) one of following:\n\
335 kB 1000, K 1024, MB 1000*1000, M 1024*1024, and so on for G, T, P, E, Z, Y.\n\
336 "), stdout);
337       emit_bug_reporting_address ();
338     }
339   exit (status);
340 }
341
342 static size_t
343 entry_hash (void const *x, size_t table_size)
344 {
345   struct entry const *p = x;
346
347   /* Ignoring the device number here should be fine.  */
348   /* The cast to uintmax_t prevents negative remainders
349      if st_ino is negative.  */
350   return (uintmax_t) p->st_ino % table_size;
351 }
352
353 /* Compare two dev/ino pairs.  Return true if they are the same.  */
354 static bool
355 entry_compare (void const *x, void const *y)
356 {
357   struct entry const *a = x;
358   struct entry const *b = y;
359   return SAME_INODE (*a, *b) ? true : false;
360 }
361
362 /* Try to insert the INO/DEV pair into the global table, HTAB.
363    Return true if the pair is successfully inserted,
364    false if the pair is already in the table.  */
365 static bool
366 hash_ins (ino_t ino, dev_t dev)
367 {
368   struct entry *ent;
369   struct entry *ent_from_table;
370
371   ent = xmalloc (sizeof *ent);
372   ent->st_ino = ino;
373   ent->st_dev = dev;
374
375   ent_from_table = hash_insert (htab, ent);
376   if (ent_from_table == NULL)
377     {
378       /* Insertion failed due to lack of memory.  */
379       xalloc_die ();
380     }
381
382   if (ent_from_table == ent)
383     {
384       /* Insertion succeeded.  */
385       return true;
386     }
387
388   /* That pair is already in the table, so ENT was not inserted.  Free it.  */
389   free (ent);
390
391   return false;
392 }
393
394 /* Initialize the hash table.  */
395 static void
396 hash_init (void)
397 {
398   htab = hash_initialize (INITIAL_TABLE_SIZE, NULL,
399                           entry_hash, entry_compare, free);
400   if (htab == NULL)
401     xalloc_die ();
402 }
403
404 /* FIXME: this code is nearly identical to code in date.c  */
405 /* Display the date and time in WHEN according to the format specified
406    in FORMAT.  */
407
408 static void
409 show_date (const char *format, struct timespec when)
410 {
411   struct tm *tm = localtime (&when.tv_sec);
412   if (! tm)
413     {
414       char buf[INT_BUFSIZE_BOUND (intmax_t)];
415       error (0, 0, _("time %s is out of range"), timetostr (when.tv_sec, buf));
416       fputs (buf, stdout);
417       return;
418     }
419
420   fprintftime (stdout, format, tm, 0, when.tv_nsec);
421 }
422
423 /* Print N_BYTES.  Convert it to a readable value before printing.  */
424
425 static void
426 print_only_size (uintmax_t n_bytes)
427 {
428   char buf[LONGEST_HUMAN_READABLE + 1];
429   fputs (human_readable (n_bytes, buf, human_output_opts,
430                          1, output_block_size), stdout);
431 }
432
433 /* Print size (and optionally time) indicated by *PDUI, followed by STRING.  */
434
435 static void
436 print_size (const struct duinfo *pdui, const char *string)
437 {
438   print_only_size (pdui->size);
439   if (opt_time)
440     {
441       putchar ('\t');
442       show_date (time_format, pdui->tmax);
443     }
444   printf ("\t%s%c", string, opt_nul_terminate_output ? '\0' : '\n');
445   fflush (stdout);
446 }
447
448 /* This function is called once for every file system object that fts
449    encounters.  fts does a depth-first traversal.  This function knows
450    that and accumulates per-directory totals based on changes in
451    the depth of the current entry.  It returns true on success.  */
452
453 static bool
454 process_file (FTS *fts, FTSENT *ent)
455 {
456   bool ok;
457   struct duinfo dui;
458   struct duinfo dui_to_print;
459   size_t level;
460   static size_t prev_level;
461   static size_t n_alloc;
462   /* First element of the structure contains:
463      The sum of the st_size values of all entries in the single directory
464      at the corresponding level.  Although this does include the st_size
465      corresponding to each subdirectory, it does not include the size of
466      any file in a subdirectory. Also corresponding last modified date.
467      Second element of the structure contains:
468      The sum of the sizes of all entries in the hierarchy at or below the
469      directory at the specified level.  */
470   static struct dulevel *dulvl;
471   bool print = true;
472
473   const char *file = ent->fts_path;
474   const struct stat *sb = ent->fts_statp;
475   bool skip;
476
477   /* If necessary, set FTS_SKIP before returning.  */
478   skip = excluded_file_name (exclude, file);
479   if (skip)
480     fts_set (fts, ent, FTS_SKIP);
481
482   switch (ent->fts_info)
483     {
484     case FTS_NS:
485       error (0, ent->fts_errno, _("cannot access %s"), quote (file));
486       return false;
487
488     case FTS_ERR:
489       /* if (S_ISDIR (ent->fts_statp->st_mode) && FIXME */
490       error (0, ent->fts_errno, _("%s"), quote (file));
491       return false;
492
493     case FTS_DNR:
494       /* Don't return just yet, since although the directory is not readable,
495          we were able to stat it, so we do have a size.  */
496       error (0, ent->fts_errno, _("cannot read directory %s"), quote (file));
497       ok = false;
498       break;
499
500     default:
501       ok = true;
502       break;
503     }
504
505   /* If this is the first (pre-order) encounter with a directory,
506      or if it's the second encounter for a skipped directory, then
507      return right away.  */
508   if (ent->fts_info == FTS_D || skip)
509     return ok;
510
511   /* If the file is being excluded or if it has already been counted
512      via a hard link, then don't let it contribute to the sums.  */
513   if (skip
514       || (!opt_count_all
515           && ! S_ISDIR (sb->st_mode)
516           && 1 < sb->st_nlink
517           && ! hash_ins (sb->st_ino, sb->st_dev)))
518     {
519       /* Note that we must not simply return here.
520          We still have to update prev_level and maybe propagate
521          some sums up the hierarchy.  */
522       duinfo_init (&dui);
523       print = false;
524     }
525   else
526     {
527       duinfo_set (&dui,
528                   (apparent_size
529                    ? sb->st_size
530                    : (uintmax_t) ST_NBLOCKS (*sb) * ST_NBLOCKSIZE),
531                   (time_type == time_mtime ? get_stat_mtime (sb)
532                    : time_type == time_atime ? get_stat_atime (sb)
533                    : get_stat_ctime (sb)));
534     }
535
536   level = ent->fts_level;
537   dui_to_print = dui;
538
539   if (n_alloc == 0)
540     {
541       n_alloc = level + 10;
542       dulvl = xcalloc (n_alloc, sizeof *dulvl);
543     }
544   else
545     {
546       if (level == prev_level)
547         {
548           /* This is usually the most common case.  Do nothing.  */
549         }
550       else if (level > prev_level)
551         {
552           /* Descending the hierarchy.
553              Clear the accumulators for *all* levels between prev_level
554              and the current one.  The depth may change dramatically,
555              e.g., from 1 to 10.  */
556           size_t i;
557
558           if (n_alloc <= level)
559             {
560               dulvl = xnrealloc (dulvl, level, 2 * sizeof *dulvl);
561               n_alloc = level * 2;
562             }
563
564           for (i = prev_level + 1; i <= level; i++)
565             {
566               duinfo_init (&dulvl[i].ent);
567               duinfo_init (&dulvl[i].subdir);
568             }
569         }
570       else /* level < prev_level */
571         {
572           /* Ascending the hierarchy.
573              Process a directory only after all entries in that
574              directory have been processed.  When the depth decreases,
575              propagate sums from the children (prev_level) to the parent.
576              Here, the current level is always one smaller than the
577              previous one.  */
578           assert (level == prev_level - 1);
579           duinfo_add (&dui_to_print, &dulvl[prev_level].ent);
580           if (!opt_separate_dirs)
581             duinfo_add (&dui_to_print, &dulvl[prev_level].subdir);
582           duinfo_add (&dulvl[level].subdir, &dulvl[prev_level].ent);
583           duinfo_add (&dulvl[level].subdir, &dulvl[prev_level].subdir);
584         }
585     }
586
587   prev_level = level;
588
589   /* Let the size of a directory entry contribute to the total for the
590      containing directory, unless --separate-dirs (-S) is specified.  */
591   if ( ! (opt_separate_dirs && IS_DIR_TYPE (ent->fts_info)))
592     duinfo_add (&dulvl[level].ent, &dui);
593
594   /* Even if this directory is unreadable or we can't chdir into it,
595      do let its size contribute to the total. */
596   duinfo_add (&tot_dui, &dui);
597
598   /* If we're not counting an entry, e.g., because it's a hard link
599      to a file we've already counted (and --count-links), then don't
600      print a line for it.  */
601   if (!print)
602     return ok;
603
604   if ((IS_DIR_TYPE (ent->fts_info) && level <= max_depth)
605       || ((opt_all && level <= max_depth) || level == 0))
606     print_size (&dui_to_print, file);
607
608   return ok;
609 }
610
611 /* Recursively print the sizes of the directories (and, if selected, files)
612    named in FILES, the last entry of which is NULL.
613    BIT_FLAGS controls how fts works.
614    Return true if successful.  */
615
616 static bool
617 du_files (char **files, int bit_flags)
618 {
619   bool ok = true;
620
621   if (*files)
622     {
623       FTS *fts = xfts_open (files, bit_flags, NULL);
624
625       while (1)
626         {
627           FTSENT *ent;
628
629           ent = fts_read (fts);
630           if (ent == NULL)
631             {
632               if (errno != 0)
633                 {
634                   /* FIXME: try to give a better message  */
635                   error (0, errno, _("fts_read failed"));
636                   ok = false;
637                 }
638               break;
639             }
640           FTS_CROSS_CHECK (fts);
641
642           ok &= process_file (fts, ent);
643         }
644
645       /* Ignore failure, since the only way it can do so is in failing to
646          return to the original directory, and since we're about to exit,
647          that doesn't matter.  */
648       fts_close (fts);
649     }
650
651   if (print_grand_total)
652     print_size (&tot_dui, _("total"));
653
654   return ok;
655 }
656
657 int
658 main (int argc, char **argv)
659 {
660   char *cwd_only[2];
661   bool max_depth_specified = false;
662   char **files;
663   bool ok = true;
664   char *files_from = NULL;
665   struct Tokens tok;
666
667   /* Bit flags that control how fts works.  */
668   int bit_flags = FTS_TIGHT_CYCLE_CHECK;
669
670   /* Select one of the three FTS_ options that control if/when
671      to follow a symlink.  */
672   int symlink_deref_bits = FTS_PHYSICAL;
673
674   /* If true, display only a total for each argument. */
675   bool opt_summarize_only = false;
676
677   cwd_only[0] = ".";
678   cwd_only[1] = NULL;
679
680   initialize_main (&argc, &argv);
681   set_program_name (argv[0]);
682   setlocale (LC_ALL, "");
683   bindtextdomain (PACKAGE, LOCALEDIR);
684   textdomain (PACKAGE);
685
686   atexit (close_stdout);
687
688   exclude = new_exclude ();
689
690   human_options (getenv ("DU_BLOCK_SIZE"),
691                  &human_output_opts, &output_block_size);
692
693   for (;;)
694     {
695       int oi = -1;
696       int c = getopt_long (argc, argv, DEBUG_OPT "0abchHklmsxB:DLPSX:",
697                            long_options, &oi);
698       if (c == -1)
699         break;
700
701       switch (c)
702         {
703 #if DU_DEBUG
704         case 'd':
705           fts_debug = true;
706           break;
707 #endif
708
709         case '0':
710           opt_nul_terminate_output = true;
711           break;
712
713         case 'a':
714           opt_all = true;
715           break;
716
717         case APPARENT_SIZE_OPTION:
718           apparent_size = true;
719           break;
720
721         case 'b':
722           apparent_size = true;
723           human_output_opts = 0;
724           output_block_size = 1;
725           break;
726
727         case 'c':
728           print_grand_total = true;
729           break;
730
731         case 'h':
732           human_output_opts = human_autoscale | human_SI | human_base_1024;
733           output_block_size = 1;
734           break;
735
736         case 'H':  /* FIXME: remove warning and move this "case 'H'" to
737                       precede --dereference-args in late 2006.  */
738           error (0, 0, _("WARNING: use --si, not -H; the meaning of the -H\
739  option will soon\nchange to be the same as that of --dereference-args (-D)"));
740           /* fall through */
741         case HUMAN_SI_OPTION:
742           human_output_opts = human_autoscale | human_SI;
743           output_block_size = 1;
744           break;
745
746         case 'k':
747           human_output_opts = 0;
748           output_block_size = 1024;
749           break;
750
751         case MAX_DEPTH_OPTION:          /* --max-depth=N */
752           {
753             unsigned long int tmp_ulong;
754             if (xstrtoul (optarg, NULL, 0, &tmp_ulong, NULL) == LONGINT_OK
755                 && tmp_ulong <= SIZE_MAX)
756               {
757                 max_depth_specified = true;
758                 max_depth = tmp_ulong;
759               }
760             else
761               {
762                 error (0, 0, _("invalid maximum depth %s"),
763                        quote (optarg));
764                 ok = false;
765               }
766           }
767           break;
768
769         case MEGABYTES_LONG_OPTION:
770           error (0, 0,
771                  _("the --megabytes option is deprecated; use -m instead"));
772           /* fall through */
773         case 'm':
774           human_output_opts = 0;
775           output_block_size = 1024 * 1024;
776           break;
777
778         case 'l':
779           opt_count_all = true;
780           break;
781
782         case 's':
783           opt_summarize_only = true;
784           break;
785
786         case 'x':
787           bit_flags |= FTS_XDEV;
788           break;
789
790         case 'B':
791           {
792             enum strtol_error e = human_options (optarg, &human_output_opts,
793                                                  &output_block_size);
794             if (e != LONGINT_OK)
795               xstrtol_fatal (e, oi, c, long_options, optarg);
796           }
797           break;
798
799         case 'D': /* This will eventually be 'H' (-H), too.  */
800           symlink_deref_bits = FTS_COMFOLLOW | FTS_PHYSICAL;
801           break;
802
803         case 'L': /* --dereference */
804           symlink_deref_bits = FTS_LOGICAL;
805           break;
806
807         case 'P': /* --no-dereference */
808           symlink_deref_bits = FTS_PHYSICAL;
809           break;
810
811         case 'S':
812           opt_separate_dirs = true;
813           break;
814
815         case 'X':
816           if (add_exclude_file (add_exclude, exclude, optarg,
817                                 EXCLUDE_WILDCARDS, '\n'))
818             {
819               error (0, errno, "%s", quotearg_colon (optarg));
820               ok = false;
821             }
822           break;
823
824         case FILES0_FROM_OPTION:
825           files_from = optarg;
826           break;
827
828         case EXCLUDE_OPTION:
829           add_exclude (exclude, optarg, EXCLUDE_WILDCARDS);
830           break;
831
832         case TIME_OPTION:
833           opt_time = true;
834           time_type =
835             (optarg
836              ? XARGMATCH ("--time", optarg, time_args, time_types)
837              : time_mtime);
838           break;
839
840         case TIME_STYLE_OPTION:
841           time_style = optarg;
842           break;
843
844         case_GETOPT_HELP_CHAR;
845
846         case_GETOPT_VERSION_CHAR (PROGRAM_NAME, AUTHORS);
847
848         default:
849           ok = false;
850         }
851     }
852
853   if (!ok)
854     usage (EXIT_FAILURE);
855
856   if (opt_all & opt_summarize_only)
857     {
858       error (0, 0, _("cannot both summarize and show all entries"));
859       usage (EXIT_FAILURE);
860     }
861
862   if (opt_summarize_only && max_depth_specified && max_depth == 0)
863     {
864       error (0, 0,
865              _("warning: summarizing is the same as using --max-depth=0"));
866     }
867
868   if (opt_summarize_only && max_depth_specified && max_depth != 0)
869     {
870       unsigned long int d = max_depth;
871       error (0, 0, _("warning: summarizing conflicts with --max-depth=%lu"), d);
872       usage (EXIT_FAILURE);
873     }
874
875   if (opt_summarize_only)
876     max_depth = 0;
877
878   /* Process time style if printing last times.  */
879   if (opt_time)
880     {
881       if (! time_style)
882         {
883           time_style = getenv ("TIME_STYLE");
884
885           /* Ignore TIMESTYLE="locale", for compatibility with ls.  */
886           if (! time_style || STREQ (time_style, "locale"))
887             time_style = "long-iso";
888           else if (*time_style == '+')
889             {
890               /* Ignore anything after a newline, for compatibility
891                  with ls.  */
892               char *p = strchr (time_style, '\n');
893               if (p)
894                 *p = '\0';
895             }
896           else
897             {
898               /* Ignore "posix-" prefix, for compatibility with ls.  */
899               static char const posix_prefix[] = "posix-";
900               while (strncmp (time_style, posix_prefix, sizeof posix_prefix - 1)
901                      == 0)
902                 time_style += sizeof posix_prefix - 1;
903             }
904         }
905
906       if (*time_style == '+')
907         time_format = time_style + 1;
908       else
909         {
910           switch (XARGMATCH ("time style", time_style,
911                              time_style_args, time_style_types))
912             {
913             case full_iso_time_style:
914               time_format = "%Y-%m-%d %H:%M:%S.%N %z";
915               break;
916
917             case long_iso_time_style:
918               time_format = "%Y-%m-%d %H:%M";
919               break;
920
921             case iso_time_style:
922               time_format = "%Y-%m-%d";
923               break;
924             }
925         }
926     }
927
928   if (files_from)
929     {
930       /* When using --files0-from=F, you may not specify any files
931          on the command-line.  */
932       if (optind < argc)
933         {
934           error (0, 0, _("extra operand %s"), quote (argv[optind]));
935           fprintf (stderr, "%s\n",
936                    _("file operands cannot be combined with --files0-from"));
937           usage (EXIT_FAILURE);
938         }
939
940       if (! (STREQ (files_from, "-") || freopen (files_from, "r", stdin)))
941         error (EXIT_FAILURE, errno, _("cannot open %s for reading"),
942                quote (files_from));
943
944       readtokens0_init (&tok);
945
946       if (! readtokens0 (stdin, &tok) || fclose (stdin) != 0)
947         error (EXIT_FAILURE, 0, _("cannot read file names from %s"),
948                quote (files_from));
949
950       files = tok.tok;
951     }
952   else
953     {
954       files = (optind < argc ? argv + optind : cwd_only);
955     }
956
957   /* Initialize the hash structure for inode numbers.  */
958   hash_init ();
959
960   /* Report and filter out any empty file names before invoking fts.
961      This works around a glitch in fts, which fails immediately
962      (without looking at the other file names) when given an empty
963      file name.  */
964   {
965     size_t i = 0;
966     size_t j;
967
968     for (j = 0; ; j++)
969       {
970         if (i != j)
971           files[i] = files[j];
972
973         if ( ! files[i])
974           break;
975
976         if (files_from && STREQ (files_from, "-") && STREQ (files[i], "-"))
977           {
978             /* Give a better diagnostic in an unusual case:
979                printf - | du --files0-from=- */
980             error (0, 0, _("when reading file names from stdin, "
981                            "no file name of %s allowed"),
982                    quote ("-"));
983             continue;
984           }
985
986         if (files[i][0])
987           i++;
988         else
989           {
990             /* Diagnose a zero-length file name.  When it's one
991                among many, knowing the record number may help.  */
992             if (files_from)
993               {
994                 /* Using the standard `filename:line-number:' prefix here is
995                    not totally appropriate, since NUL is the separator, not NL,
996                    but it might be better than nothing.  */
997                 unsigned long int file_number = j + 1;
998                 error (0, 0, "%s:%lu: %s", quotearg_colon (files_from),
999                        file_number, _("invalid zero-length file name"));
1000               }
1001             else
1002               error (0, 0, "%s", _("invalid zero-length file name"));
1003           }
1004       }
1005
1006     ok = (i == j);
1007   }
1008
1009   bit_flags |= symlink_deref_bits;
1010   ok &= du_files (files, bit_flags);
1011
1012   /* This isn't really necessary, but it does ensure we
1013      exercise this function.  */
1014   if (files_from)
1015     readtokens0_free (&tok);
1016
1017   hash_free (htab);
1018
1019   exit (ok ? EXIT_SUCCESS : EXIT_FAILURE);
1020 }