init: make comment more understandable. no code changes
[platform/upstream/busybox.git] / init / init.c
1 /* vi: set sw=4 ts=4: */
2 /*
3  * Mini init implementation for busybox
4  *
5  * Copyright (C) 1995, 1996 by Bruce Perens <bruce@pixar.com>.
6  * Copyright (C) 1999-2004 by Erik Andersen <andersen@codepoet.org>
7  * Adjusted by so many folks, it's impossible to keep track.
8  *
9  * Licensed under GPLv2 or later, see file LICENSE in this tarball for details.
10  */
11
12 #include "libbb.h"
13 #include <syslog.h>
14 #include <paths.h>
15 #include <sys/reboot.h>
16 #include <sys/resource.h>
17 #include <linux/vt.h>
18
19
20 /* Was a CONFIG_xxx option. A lot of people were building
21  * not fully functional init by switching it on! */
22 #define DEBUG_INIT 0
23
24 #define COMMAND_SIZE      256
25 #define CONSOLE_NAME_SIZE 32
26
27 /* Default sysinit script. */
28 #ifndef INIT_SCRIPT
29 #define INIT_SCRIPT  "/etc/init.d/rcS"
30 #endif
31
32 /* Each type of actions can appear many times. They will be
33  * handled in order. RESTART is an exception, only 1st is used.
34  */
35 /* Start these actions first and wait for completion */
36 #define SYSINIT     0x01
37 /* Start these after SYSINIT and wait for completion */
38 #define WAIT        0x02
39 /* Start these after WAIT and *dont* wait for completion */
40 #define ONCE        0x04
41 /*
42  * NB: while SYSINIT/WAIT/ONCE are being processed,
43  * SIGHUP ("reread /etc/inittab") will be ignored.
44  * Rationale: it would be ambiguous whether SYSINIT/WAIT/ONCE
45  * need to be rerun or not.
46  */
47 /* Start these after ONCE are started, restart on exit */
48 #define RESPAWN     0x08
49 /* Like RESPAWN, but wait for <Enter> to be pressed on tty */
50 #define ASKFIRST    0x10
51 /*
52  * Start these on SIGINT, and wait for completion.
53  * Then go back to respawning RESPAWN and ASKFIRST actions.
54  * NB: kernel sends SIGINT to us if Ctrl-Alt-Del was pressed.
55  */
56 #define CTRLALTDEL  0x20
57 /*
58  * Start these before killing all processes in preparation for
59  * running RESTART actions or doing low-level halt/reboot/poweroff
60  * (initiated by SIGUSR1/SIGTERM/SIGUSR2).
61  * Wait for completion before proceeding.
62  */
63 #define SHUTDOWN    0x40
64 /*
65  * exec() on SIGQUIT. SHUTDOWN actions are started and waited for,
66  * then all processes are killed, then init exec's 1st RESTART action,
67  * replacing itself by it. If no RESTART action specified,
68  * SIGQUIT has no effect.
69  */
70 #define RESTART     0x80
71
72
73 /* A linked list of init_actions, to be read from inittab */
74 struct init_action {
75         struct init_action *next;
76         pid_t pid;
77         uint8_t action_type;
78         char terminal[CONSOLE_NAME_SIZE];
79         char command[COMMAND_SIZE];
80 };
81
82 static struct init_action *init_action_list = NULL;
83
84 static const char *log_console = VC_5;
85
86 enum {
87         L_LOG = 0x1,
88         L_CONSOLE = 0x2,
89         MAYBE_CONSOLE = L_CONSOLE * !ENABLE_FEATURE_EXTRA_QUIET,
90 #ifndef RB_HALT_SYSTEM
91         RB_HALT_SYSTEM = 0xcdef0123, /* FIXME: this overflows enum */
92         RB_ENABLE_CAD = 0x89abcdef,
93         RB_DISABLE_CAD = 0,
94         RB_POWER_OFF = 0x4321fedc,
95         RB_AUTOBOOT = 0x01234567,
96 #endif
97 };
98
99 /* Print a message to the specified device.
100  * "where" may be bitwise-or'd from L_LOG | L_CONSOLE
101  * NB: careful, we can be called after vfork!
102  */
103 #define dbg_message(...) do { if (DEBUG_INIT) message(__VA_ARGS__); } while (0)
104 static void message(int where, const char *fmt, ...)
105         __attribute__ ((format(printf, 2, 3)));
106 static void message(int where, const char *fmt, ...)
107 {
108         va_list arguments;
109         unsigned l;
110         char msg[128];
111
112         msg[0] = '\r';
113         va_start(arguments, fmt);
114         l = 1 + vsnprintf(msg + 1, sizeof(msg) - 2, fmt, arguments);
115         if (l > sizeof(msg) - 1)
116                 l = sizeof(msg) - 1;
117         va_end(arguments);
118
119 #if ENABLE_FEATURE_INIT_SYSLOG
120         msg[l] = '\0';
121         if (where & L_LOG) {
122                 /* Log the message to syslogd */
123                 openlog("init", 0, LOG_DAEMON);
124                 /* don't print "\r" */
125                 syslog(LOG_INFO, "%s", msg + 1);
126                 closelog();
127         }
128         msg[l++] = '\n';
129         msg[l] = '\0';
130 #else
131         {
132                 static int log_fd = -1;
133
134                 msg[l++] = '\n';
135                 msg[l] = '\0';
136                 /* Take full control of the log tty, and never close it.
137                  * It's mine, all mine!  Muhahahaha! */
138                 if (log_fd < 0) {
139                         if (!log_console) {
140                                 log_fd = STDERR_FILENO;
141                         } else {
142                                 log_fd = device_open(log_console, O_WRONLY | O_NONBLOCK | O_NOCTTY);
143                                 if (log_fd < 0) {
144                                         bb_error_msg("can't log to %s", log_console);
145                                         where = L_CONSOLE;
146                                 } else {
147                                         close_on_exec_on(log_fd);
148                                 }
149                         }
150                 }
151                 if (where & L_LOG) {
152                         full_write(log_fd, msg, l);
153                         if (log_fd == STDERR_FILENO)
154                                 return; /* don't print dup messages */
155                 }
156         }
157 #endif
158
159         if (where & L_CONSOLE) {
160                 /* Send console messages to console so people will see them. */
161                 full_write(STDERR_FILENO, msg, l);
162         }
163 }
164
165 static void console_init(void)
166 {
167         int vtno;
168         char *s;
169
170         s = getenv("CONSOLE");
171         if (!s)
172                 s = getenv("console");
173         if (s) {
174                 int fd = open(s, O_RDWR | O_NONBLOCK | O_NOCTTY);
175                 if (fd >= 0) {
176                         dup2(fd, STDIN_FILENO);
177                         dup2(fd, STDOUT_FILENO);
178                         xmove_fd(fd, STDERR_FILENO);
179                 }
180                 dbg_message(L_LOG, "console='%s'", s);
181         } else {
182                 /* Make sure fd 0,1,2 are not closed
183                  * (so that they won't be used by future opens) */
184                 bb_sanitize_stdio();
185 // Users report problems
186 //              /* Make sure init can't be blocked by writing to stderr */
187 //              fcntl(STDERR_FILENO, F_SETFL, fcntl(STDERR_FILENO, F_GETFL) | O_NONBLOCK);
188         }
189
190         s = getenv("TERM");
191         if (ioctl(STDIN_FILENO, VT_OPENQRY, &vtno) != 0) {
192                 /* Not a linux terminal, probably serial console.
193                  * Force the TERM setting to vt102
194                  * if TERM is set to linux (the default) */
195                 if (!s || strcmp(s, "linux") == 0)
196                         putenv((char*)"TERM=vt102");
197                 if (!ENABLE_FEATURE_INIT_SYSLOG)
198                         log_console = NULL;
199         } else if (!s)
200                 putenv((char*)"TERM=linux");
201 }
202
203 /* Set terminal settings to reasonable defaults.
204  * NB: careful, we can be called after vfork! */
205 static void set_sane_term(void)
206 {
207         struct termios tty;
208
209         tcgetattr(STDIN_FILENO, &tty);
210
211         /* set control chars */
212         tty.c_cc[VINTR] = 3;    /* C-c */
213         tty.c_cc[VQUIT] = 28;   /* C-\ */
214         tty.c_cc[VERASE] = 127; /* C-? */
215         tty.c_cc[VKILL] = 21;   /* C-u */
216         tty.c_cc[VEOF] = 4;     /* C-d */
217         tty.c_cc[VSTART] = 17;  /* C-q */
218         tty.c_cc[VSTOP] = 19;   /* C-s */
219         tty.c_cc[VSUSP] = 26;   /* C-z */
220
221         /* use line discipline 0 */
222         tty.c_line = 0;
223
224         /* Make it be sane */
225         tty.c_cflag &= CBAUD | CBAUDEX | CSIZE | CSTOPB | PARENB | PARODD;
226         tty.c_cflag |= CREAD | HUPCL | CLOCAL;
227
228         /* input modes */
229         tty.c_iflag = ICRNL | IXON | IXOFF;
230
231         /* output modes */
232         tty.c_oflag = OPOST | ONLCR;
233
234         /* local modes */
235         tty.c_lflag =
236                 ISIG | ICANON | ECHO | ECHOE | ECHOK | ECHOCTL | ECHOKE | IEXTEN;
237
238         tcsetattr_stdin_TCSANOW(&tty);
239 }
240
241 /* Open the new terminal device.
242  * NB: careful, we can be called after vfork! */
243 static int open_stdio_to_tty(const char* tty_name)
244 {
245         /* empty tty_name means "use init's tty", else... */
246         if (tty_name[0]) {
247                 int fd;
248
249                 close(STDIN_FILENO);
250                 /* fd can be only < 0 or 0: */
251                 fd = device_open(tty_name, O_RDWR);
252                 if (fd) {
253                         message(L_LOG | L_CONSOLE, "can't open %s: %s",
254                                 tty_name, strerror(errno));
255                         return 0; /* failure */
256                 }
257                 dup2(STDIN_FILENO, STDOUT_FILENO);
258                 dup2(STDIN_FILENO, STDERR_FILENO);
259         }
260         set_sane_term();
261         return 1; /* success */
262 }
263
264 /* Wrapper around exec:
265  * Takes string (max COMMAND_SIZE chars).
266  * If chars like '>' detected, execs '[-]/bin/sh -c "exec ......."'.
267  * Otherwise splits words on whitespace, deals with leading dash,
268  * and uses plain exec().
269  * NB: careful, we can be called after vfork!
270  */
271 static void init_exec(const char *command)
272 {
273         char *cmd[COMMAND_SIZE / 2];
274         char buf[COMMAND_SIZE + 6];  /* COMMAND_SIZE+strlen("exec ")+1 */
275         int dash = (command[0] == '-' /* maybe? && command[1] == '/' */);
276
277         /* See if any special /bin/sh requiring characters are present */
278         if (strpbrk(command, "~`!$^&*()=|\\{}[];\"'<>?") != NULL) {
279                 strcpy(buf, "exec ");
280                 strcpy(buf + 5, command + dash); /* excluding "-" */
281                 /* NB: LIBBB_DEFAULT_LOGIN_SHELL define has leading dash */
282                 cmd[0] = (char*)(LIBBB_DEFAULT_LOGIN_SHELL + !dash);
283                 cmd[1] = (char*)"-c";
284                 cmd[2] = buf;
285                 cmd[3] = NULL;
286         } else {
287                 /* Convert command (char*) into cmd (char**, one word per string) */
288                 char *word, *next;
289                 int i = 0;
290                 next = strcpy(buf, command); /* including "-" */
291                 while ((word = strsep(&next, " \t")) != NULL) {
292                         if (*word != '\0') { /* not two spaces/tabs together? */
293                                 cmd[i] = word;
294                                 i++;
295                         }
296                 }
297                 cmd[i] = NULL;
298         }
299         /* If we saw leading "-", it is interactive shell.
300          * Try harder to give it a controlling tty.
301          * And skip "-" in actual exec call. */
302         if (dash) {
303                 /* _Attempt_ to make stdin a controlling tty. */
304                 if (ENABLE_FEATURE_INIT_SCTTY)
305                         ioctl(STDIN_FILENO, TIOCSCTTY, 0 /*only try, don't steal*/);
306         }
307         BB_EXECVP(cmd[0] + dash, cmd);
308         message(L_LOG | L_CONSOLE, "cannot run '%s': %s", cmd[0], strerror(errno));
309         /* returns if execvp fails */
310 }
311
312 /* Used only by run_actions */
313 static pid_t run(const struct init_action *a)
314 {
315         pid_t pid;
316
317         /* Careful: don't be affected by a signal in vforked child */
318         sigprocmask_allsigs(SIG_BLOCK);
319         if (BB_MMU && (a->action_type & ASKFIRST))
320                 pid = fork();
321         else
322                 pid = vfork();
323         if (pid < 0)
324                 message(L_LOG | L_CONSOLE, "can't fork");
325         if (pid) {
326                 sigprocmask_allsigs(SIG_UNBLOCK);
327                 return pid; /* Parent or error */
328         }
329
330         /* Child */
331
332         /* Reset signal handlers that were set by the parent process */
333         bb_signals(0
334                 + (1 << SIGUSR1)
335                 + (1 << SIGUSR2)
336                 + (1 << SIGTERM)
337                 + (1 << SIGQUIT)
338                 + (1 << SIGINT)
339                 + (1 << SIGHUP)
340                 + (1 << SIGTSTP)
341                 , SIG_DFL);
342         sigprocmask_allsigs(SIG_UNBLOCK);
343
344         /* Create a new session and make ourself the process group leader */
345         setsid();
346
347         /* Open the new terminal device */
348         if (!open_stdio_to_tty(a->terminal))
349                 _exit(EXIT_FAILURE);
350
351         /* NB: on NOMMU we can't wait for input in child, so
352          * "askfirst" will work the same as "respawn". */
353         if (BB_MMU && (a->action_type & ASKFIRST)) {
354                 static const char press_enter[] ALIGN1 =
355 #ifdef CUSTOMIZED_BANNER
356 #include CUSTOMIZED_BANNER
357 #endif
358                         "\nPlease press Enter to activate this console. ";
359                 char c;
360                 /*
361                  * Save memory by not exec-ing anything large (like a shell)
362                  * before the user wants it. This is critical if swap is not
363                  * enabled and the system has low memory. Generally this will
364                  * be run on the second virtual console, and the first will
365                  * be allowed to start a shell or whatever an init script
366                  * specifies.
367                  */
368                 dbg_message(L_LOG, "waiting for enter to start '%s'"
369                                         "(pid %d, tty '%s')\n",
370                                 a->command, getpid(), a->terminal);
371                 full_write(STDOUT_FILENO, press_enter, sizeof(press_enter) - 1);
372                 while (safe_read(STDIN_FILENO, &c, 1) == 1 && c != '\n')
373                         continue;
374         }
375
376         /*
377          * When a file named /.init_enable_core exists, setrlimit is called
378          * before processes are spawned to set core file size as unlimited.
379          * This is for debugging only.  Don't use this is production, unless
380          * you want core dumps lying about....
381          */
382         if (ENABLE_FEATURE_INIT_COREDUMPS) {
383                 if (access("/.init_enable_core", F_OK) == 0) {
384                         struct rlimit limit;
385                         limit.rlim_cur = RLIM_INFINITY;
386                         limit.rlim_max = RLIM_INFINITY;
387                         setrlimit(RLIMIT_CORE, &limit);
388                 }
389         }
390
391         /* Log the process name and args */
392         message(L_LOG, "starting pid %d, tty '%s': '%s'",
393                           getpid(), a->terminal, a->command);
394
395         /* Now run it.  The new program will take over this PID,
396          * so nothing further in init.c should be run. */
397         init_exec(a->command);
398         /* We're still here?  Some error happened. */
399         _exit(-1);
400 }
401
402 static struct init_action *mark_terminated(pid_t pid)
403 {
404         struct init_action *a;
405
406         if (pid > 0) {
407                 for (a = init_action_list; a; a = a->next) {
408                         if (a->pid == pid) {
409                                 a->pid = 0;
410                                 return a;
411                         }
412                 }
413         }
414         return NULL;
415 }
416
417 static void waitfor(pid_t pid)
418 {
419         /* waitfor(run(x)): protect against failed fork inside run() */
420         if (pid <= 0)
421                 return;
422
423         /* Wait for any child (prevent zombies from exiting orphaned processes)
424          * but exit the loop only when specified one has exited. */
425         while (1) {
426                 pid_t wpid = wait(NULL);
427                 mark_terminated(wpid);
428                 /* Unsafe. SIGTSTP handler might have wait'ed it already */
429                 /*if (wpid == pid) break;*/
430                 /* More reliable: */
431                 if (kill(pid, 0))
432                         break;
433         }
434 }
435
436 /* Run all commands of a particular type */
437 static void run_actions(int action_type)
438 {
439         struct init_action *a;
440
441         for (a = init_action_list; a; a = a->next) {
442                 if (!(a->action_type & action_type))
443                         continue;
444
445                 if (a->action_type & (SYSINIT | WAIT | ONCE | CTRLALTDEL | SHUTDOWN)) {
446                         pid_t pid = run(a);
447                         if (a->action_type & (SYSINIT | WAIT | CTRLALTDEL | SHUTDOWN))
448                                 waitfor(pid);
449                 }
450                 if (a->action_type & (RESPAWN | ASKFIRST)) {
451                         /* Only run stuff with pid == 0. If pid != 0,
452                          * it is already running
453                          */
454                         if (a->pid == 0)
455                                 a->pid = run(a);
456                 }
457         }
458 }
459
460 static void new_init_action(uint8_t action_type, const char *command, const char *cons)
461 {
462         struct init_action *a, **nextp;
463
464         /* Scenario:
465          * old inittab:
466          * ::shutdown:umount -a -r
467          * ::shutdown:swapoff -a
468          * new inittab:
469          * ::shutdown:swapoff -a
470          * ::shutdown:umount -a -r
471          * On reload, we must ensure entries end up in correct order.
472          * To achieve that, if we find a matching entry, we move it
473          * to the end.
474          */
475         nextp = &init_action_list;
476         while ((a = *nextp) != NULL) {
477                 /* Don't enter action if it's already in the list,
478                  * This prevents losing running RESPAWNs.
479                  */
480                 if ((strcmp(a->command, command) == 0)
481                  && (strcmp(a->terminal, cons) == 0)
482                 ) {
483                         /* Remove from list */
484                         *nextp = a->next;
485                         /* Find the end of the list */
486                         while (*nextp != NULL)
487                                 nextp = &(*nextp)->next;
488                         a->next = NULL;
489                         break;
490                 }
491                 nextp = &a->next;
492         }
493
494         if (!a)
495                 a = xzalloc(sizeof(*a));
496         /* Append to the end of the list */
497         *nextp = a;
498         a->action_type = action_type;
499         safe_strncpy(a->command, command, sizeof(a->command));
500         safe_strncpy(a->terminal, cons, sizeof(a->terminal));
501         dbg_message(L_LOG | L_CONSOLE, "command='%s' action=%d tty='%s'\n",
502                 a->command, a->action_type, a->terminal);
503 }
504
505 /* NOTE that if CONFIG_FEATURE_USE_INITTAB is NOT defined,
506  * then parse_inittab() simply adds in some default
507  * actions(i.e., runs INIT_SCRIPT and then starts a pair
508  * of "askfirst" shells).  If CONFIG_FEATURE_USE_INITTAB
509  * _is_ defined, but /etc/inittab is missing, this
510  * results in the same set of default behaviors.
511  */
512 static void parse_inittab(void)
513 {
514 #if ENABLE_FEATURE_USE_INITTAB
515         char *token[4];
516         parser_t *parser = config_open2("/etc/inittab", fopen_for_read);
517
518         if (parser == NULL)
519 #endif
520         {
521                 /* No inittab file - set up some default behavior */
522                 /* Reboot on Ctrl-Alt-Del */
523                 new_init_action(CTRLALTDEL, "reboot", "");
524                 /* Umount all filesystems on halt/reboot */
525                 new_init_action(SHUTDOWN, "umount -a -r", "");
526                 /* Swapoff on halt/reboot */
527                 if (ENABLE_SWAPONOFF)
528                         new_init_action(SHUTDOWN, "swapoff -a", "");
529                 /* Prepare to restart init when a QUIT is received */
530                 new_init_action(RESTART, "init", "");
531                 /* Askfirst shell on tty1-4 */
532                 new_init_action(ASKFIRST, bb_default_login_shell, "");
533 //TODO: VC_1 instead of ""? "" is console -> ctty problems -> angry users
534                 new_init_action(ASKFIRST, bb_default_login_shell, VC_2);
535                 new_init_action(ASKFIRST, bb_default_login_shell, VC_3);
536                 new_init_action(ASKFIRST, bb_default_login_shell, VC_4);
537                 /* sysinit */
538                 new_init_action(SYSINIT, INIT_SCRIPT, "");
539                 return;
540         }
541
542 #if ENABLE_FEATURE_USE_INITTAB
543         /* optional_tty:ignored_runlevel:action:command
544          * Delims are not to be collapsed and need exactly 4 tokens
545          */
546         while (config_read(parser, token, 4, 0, "#:",
547                                 PARSE_NORMAL & ~(PARSE_TRIM | PARSE_COLLAPSE))) {
548                 /* order must correspond to SYSINIT..RESTART constants */
549                 static const char actions[] ALIGN1 =
550                         "sysinit\0""wait\0""once\0""respawn\0""askfirst\0"
551                         "ctrlaltdel\0""shutdown\0""restart\0";
552                 int action;
553                 char *tty = token[0];
554
555                 if (!token[3]) /* less than 4 tokens */
556                         goto bad_entry;
557                 action = index_in_strings(actions, token[2]);
558                 if (action < 0 || !token[3][0]) /* token[3]: command */
559                         goto bad_entry;
560                 /* turn .*TTY -> /dev/TTY */
561                 if (tty[0]) {
562                         if (strncmp(tty, "/dev/", 5) == 0)
563                                 tty += 5;
564                         tty = concat_path_file("/dev/", tty);
565                 }
566                 new_init_action(1 << action, token[3], tty);
567                 if (tty[0])
568                         free(tty);
569                 continue;
570  bad_entry:
571                 message(L_LOG | L_CONSOLE, "Bad inittab entry at line %d",
572                                 parser->lineno);
573         }
574         config_close(parser);
575 #endif
576 }
577
578 static void pause_and_low_level_reboot(unsigned magic) NORETURN;
579 static void pause_and_low_level_reboot(unsigned magic)
580 {
581         pid_t pid;
582
583         /* Allow time for last message to reach serial console, etc */
584         sleep(1);
585
586         /* We have to fork here, since the kernel calls do_exit(EXIT_SUCCESS)
587          * in linux/kernel/sys.c, which can cause the machine to panic when
588          * the init process exits... */
589         pid = vfork();
590         if (pid == 0) { /* child */
591                 reboot(magic);
592                 _exit(EXIT_SUCCESS);
593         }
594         while (1)
595                 sleep(1);
596 }
597
598 static void run_shutdown_and_kill_processes(void)
599 {
600         /* Run everything to be run at "shutdown".  This is done _prior_
601          * to killing everything, in case people wish to use scripts to
602          * shut things down gracefully... */
603         run_actions(SHUTDOWN);
604
605         message(L_CONSOLE | L_LOG, "The system is going down NOW!");
606
607         /* Send signals to every process _except_ pid 1 */
608         kill(-1, SIGTERM);
609         message(L_CONSOLE | L_LOG, "Sent SIG%s to all processes", "TERM");
610         sync();
611         sleep(1);
612
613         kill(-1, SIGKILL);
614         message(L_CONSOLE, "Sent SIG%s to all processes", "KILL");
615         sync();
616         /*sleep(1); - callers take care about making a pause */
617 }
618
619 /* Signal handling by init:
620  *
621  * For process with PID==1, on entry kernel sets all signals to SIG_DFL
622  * and unmasks all signals. However, for process with PID==1,
623  * default action (SIG_DFL) on any signal is to ignore it,
624  * even for special signals SIGKILL and SIGCONT.
625  * Also, any signal can be caught or blocked.
626  * (but SIGSTOP is still handled specially, at least in 2.6.20)
627  *
628  * We install two kinds of handlers, "immediate" and "delayed".
629  *
630  * Immediate handlers execute at any time, even while, say, sysinit
631  * is running.
632  *
633  * Delayed handlers just set a flag variable. The variable is checked
634  * in the main loop and acted upon.
635  *
636  * halt/poweroff/reboot and restart have immediate handlers.
637  * They only traverse linked list of struct action's, never modify it,
638  * this should be safe to do even in signal handler. Also they
639  * never return.
640  *
641  * SIGSTOP and SIGTSTP have immediate handlers. They just wait
642  * for SIGCONT to happen.
643  *
644  * SIGHUP has a delayed handler, because modifying linked list
645  * of struct action's from a signal handler while it is manipulated
646  * by the program may be disastrous.
647  *
648  * Ctrl-Alt-Del has a delayed handler. Not a must, but allowing
649  * it to happen even somewhere inside "sysinit" would be a bit awkward.
650  *
651  * There is a tiny probability that SIGHUP and Ctrl-Alt-Del will collide
652  * and only one will be remembered and acted upon.
653  */
654
655 static void halt_reboot_pwoff(int sig) NORETURN;
656 static void halt_reboot_pwoff(int sig)
657 {
658         const char *m;
659         unsigned rb;
660
661         run_shutdown_and_kill_processes();
662
663         m = "halt";
664         rb = RB_HALT_SYSTEM;
665         if (sig == SIGTERM) {
666                 m = "reboot";
667                 rb = RB_AUTOBOOT;
668         } else if (sig == SIGUSR2) {
669                 m = "poweroff";
670                 rb = RB_POWER_OFF;
671         }
672         message(L_CONSOLE, "Requesting system %s", m);
673         pause_and_low_level_reboot(rb);
674         /* not reached */
675 }
676
677 /* The SIGSTOP/SIGTSTP handler
678  * NB: inside it, all signals except SIGCONT are masked
679  * via appropriate setup in sigaction().
680  */
681 static void stop_handler(int sig UNUSED_PARAM)
682 {
683         smallint saved_bb_got_signal;
684         int saved_errno;
685
686         saved_bb_got_signal = bb_got_signal;
687         saved_errno = errno;
688         signal(SIGCONT, record_signo);
689
690         while (1) {
691                 pid_t wpid;
692
693                 if (bb_got_signal == SIGCONT)
694                         break;
695                 /* NB: this can accidentally wait() for a process
696                  * which we waitfor() elsewhere! waitfor() must have
697                  * code which is resilient against this.
698                  */
699                 wpid = wait_any_nohang(NULL);
700                 mark_terminated(wpid);
701                 sleep(1);
702         }
703
704         signal(SIGCONT, SIG_DFL);
705         errno = saved_errno;
706         bb_got_signal = saved_bb_got_signal;
707 }
708
709 /* Handler for QUIT - exec "restart" action,
710  * else (no such action defined) do nothing */
711 static void restart_handler(int sig UNUSED_PARAM)
712 {
713         struct init_action *a;
714
715         for (a = init_action_list; a; a = a->next) {
716                 if (!(a->action_type & RESTART))
717                         continue;
718
719                 /* Starting from here, we won't return.
720                  * Thus don't need to worry about preserving errno
721                  * and such.
722                  */
723                 run_shutdown_and_kill_processes();
724
725                 /* Allow Ctrl-Alt-Del to reboot the system.
726                  * This is how kernel sets it up for init, we follow suit.
727                  */
728                 reboot(RB_ENABLE_CAD); /* misnomer */
729
730                 if (open_stdio_to_tty(a->terminal)) {
731                         dbg_message(L_CONSOLE, "Trying to re-exec %s", a->command);
732                         /* Theoretically should be safe.
733                          * But in practice, kernel bugs may leave
734                          * unkillable processes, and wait() may block forever.
735                          * Oh well. Hoping "new" init won't be too surprised
736                          * by having children it didn't create.
737                          */
738                         //while (wait(NULL) > 0)
739                         //      continue;
740                         init_exec(a->command);
741                 }
742                 /* Open or exec failed */
743                 pause_and_low_level_reboot(RB_HALT_SYSTEM);
744                 /* not reached */
745         }
746 }
747
748 #if ENABLE_FEATURE_USE_INITTAB
749 static void reload_inittab(void)
750 {
751         struct init_action *a, **nextp;
752
753         message(L_LOG, "reloading /etc/inittab");
754
755         /* Disable old entries */
756         for (a = init_action_list; a; a = a->next)
757                 a->action_type = ONCE;
758
759         /* Append new entries, or modify existing entries
760          * (set a->action_type) if cmd and device name
761          * match new ones. End result: only entries with
762          * a->action_type == ONCE are stale.
763          */
764         parse_inittab();
765
766 #if ENABLE_FEATURE_KILL_REMOVED
767         /* Kill stale entries */
768         /* Be nice and send SIGTERM first */
769         for (a = init_action_list; a; a = a->next)
770                 if (a->action_type == ONCE && a->pid != 0)
771                         kill(a->pid, SIGTERM);
772         if (CONFIG_FEATURE_KILL_DELAY) {
773                 /* NB: parent will wait in NOMMU case */
774                 if ((BB_MMU ? fork() : vfork()) == 0) { /* child */
775                         sleep(CONFIG_FEATURE_KILL_DELAY);
776                         for (a = init_action_list; a; a = a->next)
777                                 if (a->action_type == ONCE && a->pid != 0)
778                                         kill(a->pid, SIGKILL);
779                         _exit(EXIT_SUCCESS);
780                 }
781         }
782 #endif
783
784         /* Remove stale (ONCE) and not useful (SYSINIT,WAIT) entries */
785         nextp = &init_action_list;
786         while ((a = *nextp) != NULL) {
787                 if (a->action_type & (ONCE | SYSINIT | WAIT)) {
788                         *nextp = a->next;
789                         free(a);
790                 } else {
791                         nextp = &a->next;
792                 }
793         }
794
795         /* Not needed: */
796         /* run_actions(RESPAWN | ASKFIRST); */
797         /* - we return to main loop, which does this automagically */
798 }
799 #endif
800
801 static int check_delayed_sigs(void)
802 {
803         int sigs_seen = 0;
804
805         while (1) {
806                 smallint sig = bb_got_signal;
807
808                 if (!sig)
809                         return sigs_seen;
810                 bb_got_signal = 0;
811                 sigs_seen = 1;
812 #if ENABLE_FEATURE_USE_INITTAB
813                 if (sig == SIGHUP)
814                         reload_inittab();
815 #endif
816                 if (sig == SIGINT)
817                         run_actions(CTRLALTDEL);
818         }
819 }
820
821 int init_main(int argc, char **argv) MAIN_EXTERNALLY_VISIBLE;
822 int init_main(int argc UNUSED_PARAM, char **argv)
823 {
824         die_sleep = 30 * 24*60*60; /* if xmalloc would ever die... */
825
826         if (argv[1] && !strcmp(argv[1], "-q")) {
827                 return kill(1, SIGHUP);
828         }
829
830         if (!DEBUG_INIT) {
831                 /* Expect to be invoked as init with PID=1 or be invoked as linuxrc */
832                 if (getpid() != 1
833                  && (!ENABLE_FEATURE_INITRD || !strstr(applet_name, "linuxrc"))
834                 ) {
835                         bb_show_usage();
836                 }
837                 /* Turn off rebooting via CTL-ALT-DEL - we get a
838                  * SIGINT on CAD so we can shut things down gracefully... */
839                 reboot(RB_DISABLE_CAD); /* misnomer */
840         }
841
842         /* Figure out where the default console should be */
843         console_init();
844         set_sane_term();
845         xchdir("/");
846         setsid();
847
848         /* Make sure environs is set to something sane */
849         putenv((char *) "HOME=/");
850         putenv((char *) bb_PATH_root_path);
851         putenv((char *) "SHELL=/bin/sh");
852         putenv((char *) "USER=root"); /* needed? why? */
853
854         if (argv[1])
855                 xsetenv("RUNLEVEL", argv[1]);
856
857         /* Hello world */
858         message(MAYBE_CONSOLE | L_LOG, "init started: %s", bb_banner);
859
860         /* Make sure there is enough memory to do something useful. */
861         if (ENABLE_SWAPONOFF) {
862                 struct sysinfo info;
863
864                 if (sysinfo(&info) == 0
865                  && (info.mem_unit ? : 1) * (long long)info.totalram < 1024*1024
866                 ) {
867                         message(L_CONSOLE, "Low memory, forcing swapon");
868                         /* swapon -a requires /proc typically */
869                         new_init_action(SYSINIT, "mount -t proc proc /proc", "");
870                         /* Try to turn on swap */
871                         new_init_action(SYSINIT, "swapon -a", "");
872                         run_actions(SYSINIT);   /* wait and removing */
873                 }
874         }
875
876         /* Check if we are supposed to be in single user mode */
877         if (argv[1]
878          && (!strcmp(argv[1], "single") || !strcmp(argv[1], "-s") || LONE_CHAR(argv[1], '1'))
879         ) {
880                 /* ??? shouldn't we set RUNLEVEL="b" here? */
881                 /* Start a shell on console */
882                 new_init_action(RESPAWN, bb_default_login_shell, "");
883         } else {
884                 /* Not in single user mode - see what inittab says */
885
886                 /* NOTE that if CONFIG_FEATURE_USE_INITTAB is NOT defined,
887                  * then parse_inittab() simply adds in some default
888                  * actions(i.e., INIT_SCRIPT and a pair
889                  * of "askfirst" shells */
890                 parse_inittab();
891         }
892
893 #if ENABLE_SELINUX
894         if (getenv("SELINUX_INIT") == NULL) {
895                 int enforce = 0;
896
897                 putenv((char*)"SELINUX_INIT=YES");
898                 if (selinux_init_load_policy(&enforce) == 0) {
899                         BB_EXECVP(argv[0], argv);
900                 } else if (enforce > 0) {
901                         /* SELinux in enforcing mode but load_policy failed */
902                         message(L_CONSOLE, "cannot load SELinux Policy. "
903                                 "Machine is in enforcing mode. Halting now.");
904                         exit(EXIT_FAILURE);
905                 }
906         }
907 #endif
908
909         /* Make the command line just say "init"  - thats all, nothing else */
910         strncpy(argv[0], "init", strlen(argv[0]));
911         /* Wipe argv[1]-argv[N] so they don't clutter the ps listing */
912         while (*++argv)
913                 memset(*argv, 0, strlen(*argv));
914
915         /* Set up signal handlers */
916         if (!DEBUG_INIT) {
917                 struct sigaction sa;
918
919                 bb_signals(0
920                         + (1 << SIGUSR1) /* halt */
921                         + (1 << SIGTERM) /* reboot */
922                         + (1 << SIGUSR2) /* poweroff */
923                         , halt_reboot_pwoff);
924                 signal(SIGQUIT, restart_handler); /* re-exec another init */
925
926                 /* Stop handler must allow only SIGCONT inside itself */
927                 memset(&sa, 0, sizeof(sa));
928                 sigfillset(&sa.sa_mask);
929                 sigdelset(&sa.sa_mask, SIGCONT);
930                 sa.sa_handler = stop_handler;
931                 /* NB: sa_flags doesn't have SA_RESTART.
932                  * It must be able to interrupt wait().
933                  */
934                 sigaction_set(SIGTSTP, &sa); /* pause */
935                 /* Does not work as intended, at least in 2.6.20.
936                  * SIGSTOP is simply ignored by init:
937                  */
938                 sigaction_set(SIGSTOP, &sa); /* pause */
939
940                 /* SIGINT (Ctrl-Alt-Del) must interrupt wait(),
941                  * setting handler without SA_RESTART flag.
942                  */
943                 bb_signals_recursive_norestart((1 << SIGINT), record_signo);
944         }
945
946         /* Now run everything that needs to be run */
947         /* First run the sysinit command */
948         run_actions(SYSINIT);
949         check_delayed_sigs();
950         /* Next run anything that wants to block */
951         run_actions(WAIT);
952         check_delayed_sigs();
953         /* Next run anything to be run only once */
954         run_actions(ONCE);
955
956         /* Set up "reread /etc/inittab" handler.
957          * Handler is set up without SA_RESTART, it will interrupt syscalls.
958          */
959         if (!DEBUG_INIT && ENABLE_FEATURE_USE_INITTAB)
960                 bb_signals_recursive_norestart((1 << SIGHUP), record_signo);
961
962         /* Now run the looping stuff for the rest of forever.
963          */
964         while (1) {
965                 int maybe_WNOHANG;
966
967                 maybe_WNOHANG = check_delayed_sigs();
968
969                 /* (Re)run the respawn/askfirst stuff */
970                 run_actions(RESPAWN | ASKFIRST);
971                 maybe_WNOHANG |= check_delayed_sigs();
972
973                 /* Don't consume all CPU time - sleep a bit */
974                 sleep(1);
975                 maybe_WNOHANG |= check_delayed_sigs();
976
977                 /* Wait for any child process(es) to exit.
978                  *
979                  * If check_delayed_sigs above reported that a signal
980                  * was caught, wait will be nonblocking. This ensures
981                  * that if SIGHUP has reloaded inittab, respawn and askfirst
982                  * actions will not be delayed until next child death.
983                  */
984                 if (maybe_WNOHANG)
985                         maybe_WNOHANG = WNOHANG;
986                 while (1) {
987                         pid_t wpid;
988                         struct init_action *a;
989
990                         /* If signals happen _in_ the wait, they interrupt it,
991                          * bb_signals_recursive_norestart set them up that way
992                          */
993                         wpid = waitpid(-1, NULL, maybe_WNOHANG);
994                         if (wpid <= 0)
995                                 break;
996
997                         a = mark_terminated(wpid);
998                         if (a) {
999                                 message(L_LOG, "process '%s' (pid %d) exited. "
1000                                                 "Scheduling for restart.",
1001                                                 a->command, wpid);
1002                         }
1003                         /* See if anyone else is waiting to be reaped */
1004                         maybe_WNOHANG = WNOHANG;
1005                 }
1006         } /* while (1) */
1007 }