2007-07-24 Richard Hughes <richard@hughsie.com>
[platform/upstream/dbus.git] / dbus / dbus-spawn.c
1 /* -*- mode: C; c-file-style: "gnu"; indent-tabs-mode: nil; -*- */
2 /* dbus-spawn.c Wrapper around fork/exec
3  * 
4  * Copyright (C) 2002, 2003, 2004  Red Hat, Inc.
5  * Copyright (C) 2003 CodeFactory AB
6  *
7  * Licensed under the Academic Free License version 2.1
8  * 
9  * This program is free software; you can redistribute it and/or modify
10  * it under the terms of the GNU General Public License as published by
11  * the Free Software Foundation; either version 2 of the License, or
12  * (at your option) any later version.
13  *
14  * This program is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17  * GNU General Public License for more details.
18  * 
19  * You should have received a copy of the GNU General Public License
20  * along with this program; if not, write to the Free Software
21  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
22  *
23  */
24 #include "dbus-spawn.h"
25 #include "dbus-sysdeps-unix.h"
26 #include "dbus-internals.h"
27 #include "dbus-test.h"
28 #include "dbus-protocol.h"
29
30 #include <unistd.h>
31 #include <fcntl.h>
32 #include <signal.h>
33 #include <sys/wait.h>
34 #include <stdlib.h>
35 #ifdef HAVE_ERRNO_H
36 #include <errno.h>
37 #endif
38
39 /**
40  * @addtogroup DBusInternalsUtils
41  * @{
42  */
43
44 /*
45  * I'm pretty sure this whole spawn file could be made simpler,
46  * if you thought about it a bit.
47  */
48
49 /**
50  * Enumeration for status of a read()
51  */
52 typedef enum
53 {
54   READ_STATUS_OK,    /**< Read succeeded */
55   READ_STATUS_ERROR, /**< Some kind of error */
56   READ_STATUS_EOF    /**< EOF returned */
57 } ReadStatus;
58
59 static ReadStatus
60 read_ints (int        fd,
61            int       *buf,
62            int        n_ints_in_buf,
63            int       *n_ints_read,
64            DBusError *error)
65 {
66   size_t bytes = 0;    
67   ReadStatus retval;
68   
69   _DBUS_ASSERT_ERROR_IS_CLEAR (error);
70
71   retval = READ_STATUS_OK;
72   
73   while (TRUE)
74     {
75       size_t chunk;
76       size_t to_read;
77
78       to_read = sizeof (int) * n_ints_in_buf - bytes;
79
80       if (to_read == 0)
81         break;
82
83     again:
84       
85       chunk = read (fd,
86                     ((char*)buf) + bytes,
87                     to_read);
88       
89       if (chunk < 0 && errno == EINTR)
90         goto again;
91           
92       if (chunk < 0)
93         {
94           dbus_set_error (error,
95                           DBUS_ERROR_SPAWN_FAILED,
96                           "Failed to read from child pipe (%s)",
97                           _dbus_strerror (errno));
98
99           retval = READ_STATUS_ERROR;
100           break;
101         }
102       else if (chunk == 0)
103         {
104           retval = READ_STATUS_EOF;
105           break; /* EOF */
106         }
107       else /* chunk > 0 */
108         bytes += chunk;
109     }
110
111   *n_ints_read = (int)(bytes / sizeof(int));
112
113   return retval;
114 }
115
116 static ReadStatus
117 read_pid (int        fd,
118           pid_t     *buf,
119           DBusError *error)
120 {
121   size_t bytes = 0;    
122   ReadStatus retval;
123   
124   _DBUS_ASSERT_ERROR_IS_CLEAR (error);
125
126   retval = READ_STATUS_OK;
127   
128   while (TRUE)
129     {
130       size_t chunk;    
131       size_t to_read;
132       
133       to_read = sizeof (pid_t) - bytes;
134
135       if (to_read == 0)
136         break;
137
138     again:
139       
140       chunk = read (fd,
141                     ((char*)buf) + bytes,
142                     to_read);
143       if (chunk < 0 && errno == EINTR)
144         goto again;
145           
146       if (chunk < 0)
147         {
148           dbus_set_error (error,
149                           DBUS_ERROR_SPAWN_FAILED,
150                           "Failed to read from child pipe (%s)",
151                           _dbus_strerror (errno));
152
153           retval = READ_STATUS_ERROR;
154           break;
155         }
156       else if (chunk == 0)
157         {
158           retval = READ_STATUS_EOF;
159           break; /* EOF */
160         }
161       else /* chunk > 0 */
162         bytes += chunk;
163     }
164
165   return retval;
166 }
167
168 /* The implementation uses an intermediate child between the main process
169  * and the grandchild. The grandchild is our spawned process. The intermediate
170  * child is a babysitter process; it keeps track of when the grandchild
171  * exits/crashes, and reaps the grandchild.
172  */
173
174 /* Messages from children to parents */
175 enum
176 {
177   CHILD_EXITED,            /* This message is followed by the exit status int */
178   CHILD_FORK_FAILED,       /* Followed by errno */
179   CHILD_EXEC_FAILED,       /* Followed by errno */
180   CHILD_PID                /* Followed by pid_t */
181 };
182
183 /**
184  * Babysitter implementation details
185  */
186 struct DBusBabysitter
187 {
188   int refcount; /**< Reference count */
189
190   char *executable; /**< executable name to use in error messages */
191   
192   int socket_to_babysitter; /**< Connection to the babysitter process */
193   int error_pipe_from_child; /**< Connection to the process that does the exec() */
194   
195   pid_t sitter_pid;  /**< PID Of the babysitter */
196   pid_t grandchild_pid; /**< PID of the grandchild */
197
198   DBusWatchList *watches; /**< Watches */
199
200   DBusWatch *error_watch; /**< Error pipe watch */
201   DBusWatch *sitter_watch; /**< Sitter pipe watch */
202
203   int errnum; /**< Error number */
204   int status; /**< Exit status code */
205   unsigned int have_child_status : 1; /**< True if child status has been reaped */
206   unsigned int have_fork_errnum : 1; /**< True if we have an error code from fork() */
207   unsigned int have_exec_errnum : 1; /**< True if we have an error code from exec() */
208 };
209
210 static DBusBabysitter*
211 _dbus_babysitter_new (void)
212 {
213   DBusBabysitter *sitter;
214
215   sitter = dbus_new0 (DBusBabysitter, 1);
216   if (sitter == NULL)
217     return NULL;
218
219   sitter->refcount = 1;
220
221   sitter->socket_to_babysitter = -1;
222   sitter->error_pipe_from_child = -1;
223   
224   sitter->sitter_pid = -1;
225   sitter->grandchild_pid = -1;
226
227   sitter->watches = _dbus_watch_list_new ();
228   if (sitter->watches == NULL)
229     goto failed;
230   
231   return sitter;
232
233  failed:
234   _dbus_babysitter_unref (sitter);
235   return NULL;
236 }
237
238 /**
239  * Increment the reference count on the babysitter object.
240  *
241  * @param sitter the babysitter
242  * @returns the babysitter
243  */
244 DBusBabysitter *
245 _dbus_babysitter_ref (DBusBabysitter *sitter)
246 {
247   _dbus_assert (sitter != NULL);
248   _dbus_assert (sitter->refcount > 0);
249   
250   sitter->refcount += 1;
251
252   return sitter;
253 }
254
255 /**
256  * Decrement the reference count on the babysitter object.
257  * When the reference count of the babysitter object reaches
258  * zero, the babysitter is killed and the child that was being
259  * babysat gets emancipated.
260  *
261  * @param sitter the babysitter
262  */
263 void
264 _dbus_babysitter_unref (DBusBabysitter *sitter)
265 {
266   _dbus_assert (sitter != NULL);
267   _dbus_assert (sitter->refcount > 0);
268   
269   sitter->refcount -= 1;
270   if (sitter->refcount == 0)
271     {      
272       if (sitter->socket_to_babysitter >= 0)
273         {
274           /* If we haven't forked other babysitters
275            * since this babysitter and socket were
276            * created then this close will cause the
277            * babysitter to wake up from poll with
278            * a hangup and then the babysitter will
279            * quit itself.
280            */
281           _dbus_close_socket (sitter->socket_to_babysitter, NULL);
282           sitter->socket_to_babysitter = -1;
283         }
284
285       if (sitter->error_pipe_from_child >= 0)
286         {
287           _dbus_close_socket (sitter->error_pipe_from_child, NULL);
288           sitter->error_pipe_from_child = -1;
289         }
290
291       if (sitter->sitter_pid > 0)
292         {
293           int status;
294           int ret;
295
296           /* It's possible the babysitter died on its own above 
297            * from the close, or was killed randomly
298            * by some other process, so first try to reap it
299            */
300           ret = waitpid (sitter->sitter_pid, &status, WNOHANG);
301
302           /* If we couldn't reap the child then kill it, and
303            * try again
304            */
305           if (ret == 0)
306             kill (sitter->sitter_pid, SIGKILL);
307
308         again:
309           if (ret == 0)
310             ret = waitpid (sitter->sitter_pid, &status, 0);
311
312           if (ret < 0)
313             {
314               if (errno == EINTR)
315                 goto again;
316               else if (errno == ECHILD)
317                 _dbus_warn ("Babysitter process not available to be reaped; should not happen\n");
318               else
319                 _dbus_warn ("Unexpected error %d in waitpid() for babysitter: %s\n",
320                             errno, _dbus_strerror (errno));
321             }
322           else
323             {
324               _dbus_verbose ("Reaped %ld, waiting for babysitter %ld\n",
325                              (long) ret, (long) sitter->sitter_pid);
326               
327               if (WIFEXITED (sitter->status))
328                 _dbus_verbose ("Babysitter exited with status %d\n",
329                                WEXITSTATUS (sitter->status));
330               else if (WIFSIGNALED (sitter->status))
331                 _dbus_verbose ("Babysitter received signal %d\n",
332                                WTERMSIG (sitter->status));
333               else
334                 _dbus_verbose ("Babysitter exited abnormally\n");
335             }
336
337           sitter->sitter_pid = -1;
338         }
339       
340       if (sitter->error_watch)
341         {
342           _dbus_watch_invalidate (sitter->error_watch);
343           _dbus_watch_unref (sitter->error_watch);
344           sitter->error_watch = NULL;
345         }
346
347       if (sitter->sitter_watch)
348         {
349           _dbus_watch_invalidate (sitter->sitter_watch);
350           _dbus_watch_unref (sitter->sitter_watch);
351           sitter->sitter_watch = NULL;
352         }
353       
354       if (sitter->watches)
355         _dbus_watch_list_free (sitter->watches);
356
357       dbus_free (sitter->executable);
358       
359       dbus_free (sitter);
360     }
361 }
362
363 static ReadStatus
364 read_data (DBusBabysitter *sitter,
365            int             fd)
366 {
367   int what;
368   int got;
369   DBusError error;
370   ReadStatus r;
371   
372   dbus_error_init (&error);
373   
374   r = read_ints (fd, &what, 1, &got, &error);
375
376   switch (r)
377     {
378     case READ_STATUS_ERROR:
379       _dbus_warn ("Failed to read data from fd %d: %s\n", fd, error.message);
380       dbus_error_free (&error);
381       return r;
382
383     case READ_STATUS_EOF:
384       return r;
385
386     case READ_STATUS_OK:
387       break;
388     }
389   
390   if (got == 1)
391     {
392       switch (what)
393         {
394         case CHILD_EXITED:
395         case CHILD_FORK_FAILED:
396         case CHILD_EXEC_FAILED:
397           {
398             int arg;
399             
400             r = read_ints (fd, &arg, 1, &got, &error);
401
402             switch (r)
403               {
404               case READ_STATUS_ERROR:
405                 _dbus_warn ("Failed to read arg from fd %d: %s\n", fd, error.message);
406                 dbus_error_free (&error);
407                 return r;
408               case READ_STATUS_EOF:
409                 return r;
410               case READ_STATUS_OK:
411                 break;
412               }
413             
414             if (got == 1)
415               {
416                 if (what == CHILD_EXITED)
417                   {
418                     sitter->have_child_status = TRUE;
419                     sitter->status = arg;
420                     sitter->errnum = WEXITSTATUS (sitter->status);
421                     _dbus_verbose ("recorded child status exited = %d signaled = %d exitstatus = %d termsig = %d\n",
422                                    WIFEXITED (sitter->status), WIFSIGNALED (sitter->status),
423                                    WEXITSTATUS (sitter->status), WTERMSIG (sitter->status));
424                   }
425                 else if (what == CHILD_FORK_FAILED)
426                   {
427                     sitter->have_fork_errnum = TRUE;
428                     sitter->errnum = arg;
429                     _dbus_verbose ("recorded fork errnum %d\n", sitter->errnum);
430                   }
431                 else if (what == CHILD_EXEC_FAILED)
432                   {
433                     sitter->have_exec_errnum = TRUE;
434                     sitter->errnum = arg;
435                     _dbus_verbose ("recorded exec errnum %d\n", sitter->errnum);
436                   }
437               }
438           }
439           break;
440         case CHILD_PID:
441           {
442             pid_t pid = -1;
443
444             r = read_pid (fd, &pid, &error);
445             
446             switch (r)
447               {
448               case READ_STATUS_ERROR:
449                 _dbus_warn ("Failed to read PID from fd %d: %s\n", fd, error.message);
450                 dbus_error_free (&error);
451                 return r;
452               case READ_STATUS_EOF:
453                 return r;
454               case READ_STATUS_OK:
455                 break;
456               }
457             
458             sitter->grandchild_pid = pid;
459             
460             _dbus_verbose ("recorded grandchild pid %d\n", sitter->grandchild_pid);
461           }
462           break;
463         default:
464           _dbus_warn ("Unknown message received from babysitter process\n");
465           break;
466         }
467     }
468
469   return r;
470 }
471
472 static void
473 close_socket_to_babysitter (DBusBabysitter *sitter)
474 {
475   _dbus_verbose ("Closing babysitter\n");
476   _dbus_close_socket (sitter->socket_to_babysitter, NULL);
477   sitter->socket_to_babysitter = -1;
478 }
479
480 static void
481 close_error_pipe_from_child (DBusBabysitter *sitter)
482 {
483   _dbus_verbose ("Closing child error\n");
484   _dbus_close_socket (sitter->error_pipe_from_child, NULL);
485   sitter->error_pipe_from_child = -1;
486 }
487
488 static void
489 handle_babysitter_socket (DBusBabysitter *sitter,
490                           int             revents)
491 {
492   /* Even if we have POLLHUP, we want to keep reading
493    * data until POLLIN goes away; so this function only
494    * looks at HUP/ERR if no IN is set.
495    */
496   if (revents & _DBUS_POLLIN)
497     {
498       _dbus_verbose ("Reading data from babysitter\n");
499       if (read_data (sitter, sitter->socket_to_babysitter) != READ_STATUS_OK)
500         close_socket_to_babysitter (sitter);
501     }
502   else if (revents & (_DBUS_POLLERR | _DBUS_POLLHUP))
503     {
504       close_socket_to_babysitter (sitter);
505     }
506 }
507
508 static void
509 handle_error_pipe (DBusBabysitter *sitter,
510                    int             revents)
511 {
512   if (revents & _DBUS_POLLIN)
513     {
514       _dbus_verbose ("Reading data from child error\n");
515       if (read_data (sitter, sitter->error_pipe_from_child) != READ_STATUS_OK)
516         close_error_pipe_from_child (sitter);
517     }
518   else if (revents & (_DBUS_POLLERR | _DBUS_POLLHUP))
519     {
520       close_error_pipe_from_child (sitter);
521     }
522 }
523
524 /* returns whether there were any poll events handled */
525 static dbus_bool_t
526 babysitter_iteration (DBusBabysitter *sitter,
527                       dbus_bool_t     block)
528 {
529   DBusPollFD fds[2];
530   int i;
531   dbus_bool_t descriptors_ready;
532
533   descriptors_ready = FALSE;
534   
535   i = 0;
536
537   if (sitter->error_pipe_from_child >= 0)
538     {
539       fds[i].fd = sitter->error_pipe_from_child;
540       fds[i].events = _DBUS_POLLIN;
541       fds[i].revents = 0;
542       ++i;
543     }
544   
545   if (sitter->socket_to_babysitter >= 0)
546     {
547       fds[i].fd = sitter->socket_to_babysitter;
548       fds[i].events = _DBUS_POLLIN;
549       fds[i].revents = 0;
550       ++i;
551     }
552
553   if (i > 0)
554     {
555       int ret;
556
557       ret = _dbus_poll (fds, i, 0);
558       if (ret == 0 && block)
559         ret = _dbus_poll (fds, i, -1);
560       
561       if (ret > 0)
562         {
563           descriptors_ready = TRUE;
564           
565           while (i > 0)
566             {
567               --i;
568               if (fds[i].fd == sitter->error_pipe_from_child)
569                 handle_error_pipe (sitter, fds[i].revents);
570               else if (fds[i].fd == sitter->socket_to_babysitter)
571                 handle_babysitter_socket (sitter, fds[i].revents);
572             }
573         }
574     }
575
576   return descriptors_ready;
577 }
578
579 /**
580  * Macro returns #TRUE if the babysitter still has live sockets open to the
581  * babysitter child or the grandchild.
582  */
583 #define LIVE_CHILDREN(sitter) ((sitter)->socket_to_babysitter >= 0 || (sitter)->error_pipe_from_child >= 0)
584
585 /**
586  * Blocks until the babysitter process gives us the PID of the spawned grandchild,
587  * then kills the spawned grandchild.
588  *
589  * @param sitter the babysitter object
590  */
591 void
592 _dbus_babysitter_kill_child (DBusBabysitter *sitter)
593 {
594   /* be sure we have the PID of the child */
595   while (LIVE_CHILDREN (sitter) &&
596          sitter->grandchild_pid == -1)
597     babysitter_iteration (sitter, TRUE);
598
599   _dbus_verbose ("Got child PID %ld for killing\n",
600                  (long) sitter->grandchild_pid);
601   
602   if (sitter->grandchild_pid == -1)
603     return; /* child is already dead, or we're so hosed we'll never recover */
604
605   kill (sitter->grandchild_pid, SIGKILL);
606 }
607
608 /**
609  * Checks whether the child has exited, without blocking.
610  *
611  * @param sitter the babysitter
612  */
613 dbus_bool_t
614 _dbus_babysitter_get_child_exited (DBusBabysitter *sitter)
615 {
616
617   /* Be sure we're up-to-date */
618   while (LIVE_CHILDREN (sitter) &&
619          babysitter_iteration (sitter, FALSE))
620     ;
621
622   /* We will have exited the babysitter when the child has exited */
623   return sitter->socket_to_babysitter < 0;
624 }
625
626 /**
627  * Gets the exit status of the child. We do this so implimentation specific
628  * detail is not cluttering up dbus, for example the system laucher code.
629  *
630  * @param sitter the babysitter
631  * @param status the returned status code
632  * @returns #FALSE on failure
633  */
634 dbus_bool_t
635 _dbus_babysitter_get_child_exit_status (DBusBabysitter *sitter, int *status)
636 {
637   if (!_dbus_babysitter_get_child_exited (sitter))
638     _dbus_assert_not_reached ("Child has not exited");
639
640   if (sitter->errnum != WEXITSTATUS (sitter->status))
641     _dbus_assert_not_reached ("Status is not exit!");
642
643   if (!sitter->have_child_status)
644     _dbus_assert_not_reached ("Not a child!");
645
646   *status = sitter->status;
647   return TRUE;
648 }
649
650 /**
651  * Sets the #DBusError with an explanation of why the spawned
652  * child process exited (on a signal, or whatever). If
653  * the child process has not exited, does nothing (error
654  * will remain unset).
655  *
656  * @param sitter the babysitter
657  * @param error an error to fill in
658  */
659 void
660 _dbus_babysitter_set_child_exit_error (DBusBabysitter *sitter,
661                                        DBusError      *error)
662 {
663   if (!_dbus_babysitter_get_child_exited (sitter))
664     return;
665
666   /* Note that if exec fails, we will also get a child status
667    * from the babysitter saying the child exited,
668    * so we need to give priority to the exec error
669    */
670   if (sitter->have_exec_errnum)
671     {
672       dbus_set_error (error, DBUS_ERROR_SPAWN_EXEC_FAILED,
673                       "Failed to execute program %s: %s",
674                       sitter->executable, _dbus_strerror (sitter->errnum));
675     }
676   else if (sitter->have_fork_errnum)
677     {
678       dbus_set_error (error, DBUS_ERROR_NO_MEMORY,
679                       "Failed to fork a new process %s: %s",
680                       sitter->executable, _dbus_strerror (sitter->errnum));
681     }
682   else if (sitter->have_child_status)
683     {
684       if (WIFEXITED (sitter->status))
685         dbus_set_error (error, DBUS_ERROR_SPAWN_CHILD_EXITED,
686                         "Process %s exited with status %d",
687                         sitter->executable, WEXITSTATUS (sitter->status));
688       else if (WIFSIGNALED (sitter->status))
689         dbus_set_error (error, DBUS_ERROR_SPAWN_CHILD_SIGNALED,
690                         "Process %s received signal %d",
691                         sitter->executable, WTERMSIG (sitter->status));
692       else
693         dbus_set_error (error, DBUS_ERROR_FAILED,
694                         "Process %s exited abnormally",
695                         sitter->executable);
696     }
697   else
698     {
699       dbus_set_error (error, DBUS_ERROR_FAILED,
700                       "Process %s exited, reason unknown",
701                       sitter->executable);
702     }
703 }
704
705 /**
706  * Sets watch functions to notify us when the
707  * babysitter object needs to read/write file descriptors.
708  *
709  * @param sitter the babysitter
710  * @param add_function function to begin monitoring a new descriptor.
711  * @param remove_function function to stop monitoring a descriptor.
712  * @param toggled_function function to notify when the watch is enabled/disabled
713  * @param data data to pass to add_function and remove_function.
714  * @param free_data_function function to be called to free the data.
715  * @returns #FALSE on failure (no memory)
716  */
717 dbus_bool_t
718 _dbus_babysitter_set_watch_functions (DBusBabysitter            *sitter,
719                                       DBusAddWatchFunction       add_function,
720                                       DBusRemoveWatchFunction    remove_function,
721                                       DBusWatchToggledFunction   toggled_function,
722                                       void                      *data,
723                                       DBusFreeFunction           free_data_function)
724 {
725   return _dbus_watch_list_set_functions (sitter->watches,
726                                          add_function,
727                                          remove_function,
728                                          toggled_function,
729                                          data,
730                                          free_data_function);
731 }
732
733 static dbus_bool_t
734 handle_watch (DBusWatch       *watch,
735               unsigned int     condition,
736               void            *data)
737 {
738   DBusBabysitter *sitter = data;
739   int revents;
740   int fd;
741   
742   revents = 0;
743   if (condition & DBUS_WATCH_READABLE)
744     revents |= _DBUS_POLLIN;
745   if (condition & DBUS_WATCH_ERROR)
746     revents |= _DBUS_POLLERR;
747   if (condition & DBUS_WATCH_HANGUP)
748     revents |= _DBUS_POLLHUP;
749
750   fd = dbus_watch_get_socket (watch);
751
752   if (fd == sitter->error_pipe_from_child)
753     handle_error_pipe (sitter, revents);
754   else if (fd == sitter->socket_to_babysitter)
755     handle_babysitter_socket (sitter, revents);
756
757   while (LIVE_CHILDREN (sitter) &&
758          babysitter_iteration (sitter, FALSE))
759     ;
760   
761   return TRUE;
762 }
763
764 /** Helps remember which end of the pipe is which */
765 #define READ_END 0
766 /** Helps remember which end of the pipe is which */
767 #define WRITE_END 1
768
769
770 /* Avoids a danger in threaded situations (calling close()
771  * on a file descriptor twice, and another thread has
772  * re-opened it since the first close)
773  */
774 static int
775 close_and_invalidate (int *fd)
776 {
777   int ret;
778
779   if (*fd < 0)
780     return -1;
781   else
782     {
783       ret = _dbus_close_socket (*fd, NULL);
784       *fd = -1;
785     }
786
787   return ret;
788 }
789
790 static dbus_bool_t
791 make_pipe (int         p[2],
792            DBusError  *error)
793 {
794   _DBUS_ASSERT_ERROR_IS_CLEAR (error);
795   
796   if (pipe (p) < 0)
797     {
798       dbus_set_error (error,
799                       DBUS_ERROR_SPAWN_FAILED,
800                       "Failed to create pipe for communicating with child process (%s)",
801                       _dbus_strerror (errno));
802       return FALSE;
803     }
804
805   return TRUE;
806 }
807
808 static void
809 do_write (int fd, const void *buf, size_t count)
810 {
811   size_t bytes_written;
812   int ret;
813   
814   bytes_written = 0;
815   
816  again:
817   
818   ret = write (fd, ((const char*)buf) + bytes_written, count - bytes_written);
819
820   if (ret < 0)
821     {
822       if (errno == EINTR)
823         goto again;
824       else
825         {
826           _dbus_warn ("Failed to write data to pipe!\n");
827           exit (1); /* give up, we suck */
828         }
829     }
830   else
831     bytes_written += ret;
832   
833   if (bytes_written < count)
834     goto again;
835 }
836
837 static void
838 write_err_and_exit (int fd, int msg)
839 {
840   int en = errno;
841
842   do_write (fd, &msg, sizeof (msg));
843   do_write (fd, &en, sizeof (en));
844   
845   exit (1);
846 }
847
848 static void
849 write_pid (int fd, pid_t pid)
850 {
851   int msg = CHILD_PID;
852   
853   do_write (fd, &msg, sizeof (msg));
854   do_write (fd, &pid, sizeof (pid));
855 }
856
857 static void
858 write_status_and_exit (int fd, int status)
859 {
860   int msg = CHILD_EXITED;
861   
862   do_write (fd, &msg, sizeof (msg));
863   do_write (fd, &status, sizeof (status));
864   
865   exit (0);
866 }
867
868 static void
869 do_exec (int                       child_err_report_fd,
870          char                    **argv,
871          DBusSpawnChildSetupFunc   child_setup,
872          void                     *user_data)
873 {
874 #ifdef DBUS_BUILD_TESTS
875   int i, max_open;
876 #endif
877
878   _dbus_verbose_reset ();
879   _dbus_verbose ("Child process has PID " DBUS_PID_FORMAT "\n",
880                  _dbus_getpid ());
881   
882   if (child_setup)
883     (* child_setup) (user_data);
884
885 #ifdef DBUS_BUILD_TESTS
886   max_open = sysconf (_SC_OPEN_MAX);
887   
888   for (i = 3; i < max_open; i++)
889     {
890       int retval;
891
892       if (i == child_err_report_fd)
893         continue;
894       
895       retval = fcntl (i, F_GETFD);
896
897       if (retval != -1 && !(retval & FD_CLOEXEC))
898         _dbus_warn ("Fd %d did not have the close-on-exec flag set!\n", i);
899     }
900 #endif
901   
902   execv (argv[0], argv);
903   
904   /* Exec failed */
905   write_err_and_exit (child_err_report_fd,
906                       CHILD_EXEC_FAILED);
907 }
908
909 static void
910 check_babysit_events (pid_t grandchild_pid,
911                       int   parent_pipe,
912                       int   revents)
913 {
914   pid_t ret;
915   int status;
916   
917   do
918     {
919       ret = waitpid (grandchild_pid, &status, WNOHANG);
920       /* The man page says EINTR can't happen with WNOHANG,
921        * but there are reports of it (maybe only with valgrind?)
922        */
923     }
924   while (ret < 0 && errno == EINTR);
925
926   if (ret == 0)
927     {
928       _dbus_verbose ("no child exited\n");
929       
930       ; /* no child exited */
931     }
932   else if (ret < 0)
933     {
934       /* This isn't supposed to happen. */
935       _dbus_warn ("unexpected waitpid() failure in check_babysit_events(): %s\n",
936                   _dbus_strerror (errno));
937       exit (1);
938     }
939   else if (ret == grandchild_pid)
940     {
941       /* Child exited */
942       _dbus_verbose ("reaped child pid %ld\n", (long) ret);
943       
944       write_status_and_exit (parent_pipe, status);
945     }
946   else
947     {
948       _dbus_warn ("waitpid() reaped pid %d that we've never heard of\n",
949                   (int) ret);
950       exit (1);
951     }
952
953   if (revents & _DBUS_POLLIN)
954     {
955       _dbus_verbose ("babysitter got POLLIN from parent pipe\n");
956     }
957
958   if (revents & (_DBUS_POLLERR | _DBUS_POLLHUP))
959     {
960       /* Parent is gone, so we just exit */
961       _dbus_verbose ("babysitter got POLLERR or POLLHUP from parent\n");
962       exit (0);
963     }
964 }
965
966 static int babysit_sigchld_pipe = -1;
967
968 static void
969 babysit_signal_handler (int signo)
970 {
971   char b = '\0';
972  again:
973   write (babysit_sigchld_pipe, &b, 1);
974   if (errno == EINTR)
975     goto again;
976 }
977
978 static void
979 babysit (pid_t grandchild_pid,
980          int   parent_pipe)
981 {
982   int sigchld_pipe[2];
983
984   /* We don't exec, so we keep parent state, such as the pid that
985    * _dbus_verbose() uses. Reset the pid here.
986    */
987   _dbus_verbose_reset ();
988   
989   /* I thought SIGCHLD would just wake up the poll, but
990    * that didn't seem to work, so added this pipe.
991    * Probably the pipe is more likely to work on busted
992    * operating systems anyhow.
993    */
994   if (pipe (sigchld_pipe) < 0)
995     {
996       _dbus_warn ("Not enough file descriptors to create pipe in babysitter process\n");
997       exit (1);
998     }
999
1000   babysit_sigchld_pipe = sigchld_pipe[WRITE_END];
1001
1002   _dbus_set_signal_handler (SIGCHLD, babysit_signal_handler);
1003   
1004   write_pid (parent_pipe, grandchild_pid);
1005
1006   check_babysit_events (grandchild_pid, parent_pipe, 0);
1007
1008   while (TRUE)
1009     {
1010       DBusPollFD pfds[2];
1011       
1012       pfds[0].fd = parent_pipe;
1013       pfds[0].events = _DBUS_POLLIN;
1014       pfds[0].revents = 0;
1015
1016       pfds[1].fd = sigchld_pipe[READ_END];
1017       pfds[1].events = _DBUS_POLLIN;
1018       pfds[1].revents = 0;
1019       
1020       _dbus_poll (pfds, _DBUS_N_ELEMENTS (pfds), -1);
1021
1022       if (pfds[0].revents != 0)
1023         {
1024           check_babysit_events (grandchild_pid, parent_pipe, pfds[0].revents);
1025         }
1026       else if (pfds[1].revents & _DBUS_POLLIN)
1027         {
1028           char b;
1029           read (sigchld_pipe[READ_END], &b, 1);
1030           /* do waitpid check */
1031           check_babysit_events (grandchild_pid, parent_pipe, 0);
1032         }
1033     }
1034   
1035   exit (1);
1036 }
1037
1038 /**
1039  * Spawns a new process. The executable name and argv[0]
1040  * are the same, both are provided in argv[0]. The child_setup
1041  * function is passed the given user_data and is run in the child
1042  * just before calling exec().
1043  *
1044  * Also creates a "babysitter" which tracks the status of the
1045  * child process, advising the parent if the child exits.
1046  * If the spawn fails, no babysitter is created.
1047  * If sitter_p is #NULL, no babysitter is kept.
1048  *
1049  * @param sitter_p return location for babysitter or #NULL
1050  * @param argv the executable and arguments
1051  * @param env the environment (not used on unix yet)
1052  * @param child_setup function to call in child pre-exec()
1053  * @param user_data user data for setup function
1054  * @param error error object to be filled in if function fails
1055  * @returns #TRUE on success, #FALSE if error is filled in
1056  */
1057 dbus_bool_t
1058 _dbus_spawn_async_with_babysitter (DBusBabysitter          **sitter_p,
1059                                    char                    **argv,
1060                                    char                    **env,
1061                                    DBusSpawnChildSetupFunc   child_setup,
1062                                    void                     *user_data,
1063                                    DBusError                *error)
1064 {
1065   DBusBabysitter *sitter;
1066   int child_err_report_pipe[2] = { -1, -1 };
1067   int babysitter_pipe[2] = { -1, -1 };
1068   pid_t pid;
1069   
1070   _DBUS_ASSERT_ERROR_IS_CLEAR (error);
1071
1072   *sitter_p = NULL;
1073   sitter = NULL;
1074
1075   sitter = _dbus_babysitter_new ();
1076   if (sitter == NULL)
1077     {
1078       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1079       return FALSE;
1080     }
1081
1082   sitter->executable = _dbus_strdup (argv[0]);
1083   if (sitter->executable == NULL)
1084     {
1085       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1086       goto cleanup_and_fail;
1087     }
1088   
1089   if (!make_pipe (child_err_report_pipe, error))
1090     goto cleanup_and_fail;
1091
1092   _dbus_fd_set_close_on_exec (child_err_report_pipe[READ_END]);
1093   _dbus_fd_set_close_on_exec (child_err_report_pipe[WRITE_END]);
1094
1095   if (!_dbus_full_duplex_pipe (&babysitter_pipe[0], &babysitter_pipe[1], TRUE, error))
1096     goto cleanup_and_fail;
1097
1098   _dbus_fd_set_close_on_exec (babysitter_pipe[0]);
1099   _dbus_fd_set_close_on_exec (babysitter_pipe[1]);
1100
1101   /* Setting up the babysitter is only useful in the parent,
1102    * but we don't want to run out of memory and fail
1103    * after we've already forked, since then we'd leak
1104    * child processes everywhere.
1105    */
1106   sitter->error_watch = _dbus_watch_new (child_err_report_pipe[READ_END],
1107                                          DBUS_WATCH_READABLE,
1108                                          TRUE, handle_watch, sitter, NULL);
1109   if (sitter->error_watch == NULL)
1110     {
1111       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1112       goto cleanup_and_fail;
1113     }
1114         
1115   if (!_dbus_watch_list_add_watch (sitter->watches,  sitter->error_watch))
1116     {
1117       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1118       goto cleanup_and_fail;
1119     }
1120       
1121   sitter->sitter_watch = _dbus_watch_new (babysitter_pipe[0],
1122                                           DBUS_WATCH_READABLE,
1123                                           TRUE, handle_watch, sitter, NULL);
1124   if (sitter->sitter_watch == NULL)
1125     {
1126       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1127       goto cleanup_and_fail;
1128     }
1129       
1130   if (!_dbus_watch_list_add_watch (sitter->watches,  sitter->sitter_watch))
1131     {
1132       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1133       goto cleanup_and_fail;
1134     }
1135
1136   _DBUS_ASSERT_ERROR_IS_CLEAR (error);
1137   
1138   pid = fork ();
1139   
1140   if (pid < 0)
1141     {
1142       dbus_set_error (error,
1143                       DBUS_ERROR_SPAWN_FORK_FAILED,
1144                       "Failed to fork (%s)",
1145                       _dbus_strerror (errno));
1146       goto cleanup_and_fail;
1147     }
1148   else if (pid == 0)
1149     {
1150       /* Immediate child, this is the babysitter process. */
1151       int grandchild_pid;
1152       
1153       /* Be sure we crash if the parent exits
1154        * and we write to the err_report_pipe
1155        */
1156       signal (SIGPIPE, SIG_DFL);
1157
1158       /* Close the parent's end of the pipes. */
1159       close_and_invalidate (&child_err_report_pipe[READ_END]);
1160       close_and_invalidate (&babysitter_pipe[0]);
1161       
1162       /* Create the child that will exec () */
1163       grandchild_pid = fork ();
1164       
1165       if (grandchild_pid < 0)
1166         {
1167           write_err_and_exit (babysitter_pipe[1],
1168                               CHILD_FORK_FAILED);
1169           _dbus_assert_not_reached ("Got to code after write_err_and_exit()");
1170         }
1171       else if (grandchild_pid == 0)
1172         {
1173           do_exec (child_err_report_pipe[WRITE_END],
1174                    argv,
1175                    child_setup, user_data);
1176           _dbus_assert_not_reached ("Got to code after exec() - should have exited on error");
1177         }
1178       else
1179         {
1180           babysit (grandchild_pid, babysitter_pipe[1]);
1181           _dbus_assert_not_reached ("Got to code after babysit()");
1182         }
1183     }
1184   else
1185     {      
1186       /* Close the uncared-about ends of the pipes */
1187       close_and_invalidate (&child_err_report_pipe[WRITE_END]);
1188       close_and_invalidate (&babysitter_pipe[1]);
1189
1190       sitter->socket_to_babysitter = babysitter_pipe[0];
1191       babysitter_pipe[0] = -1;
1192       
1193       sitter->error_pipe_from_child = child_err_report_pipe[READ_END];
1194       child_err_report_pipe[READ_END] = -1;
1195
1196       sitter->sitter_pid = pid;
1197
1198       if (sitter_p != NULL)
1199         *sitter_p = sitter;
1200       else
1201         _dbus_babysitter_unref (sitter);
1202
1203       _DBUS_ASSERT_ERROR_IS_CLEAR (error);
1204       
1205       return TRUE;
1206     }
1207
1208  cleanup_and_fail:
1209
1210   _DBUS_ASSERT_ERROR_IS_SET (error);
1211   
1212   close_and_invalidate (&child_err_report_pipe[READ_END]);
1213   close_and_invalidate (&child_err_report_pipe[WRITE_END]);
1214   close_and_invalidate (&babysitter_pipe[0]);
1215   close_and_invalidate (&babysitter_pipe[1]);
1216
1217   if (sitter != NULL)
1218     _dbus_babysitter_unref (sitter);
1219   
1220   return FALSE;
1221 }
1222
1223 /** @} */
1224
1225 #ifdef DBUS_BUILD_TESTS
1226
1227 static void
1228 _dbus_babysitter_block_for_child_exit (DBusBabysitter *sitter)
1229 {
1230   while (LIVE_CHILDREN (sitter))
1231     babysitter_iteration (sitter, TRUE);
1232 }
1233
1234 static dbus_bool_t
1235 check_spawn_nonexistent (void *data)
1236 {
1237   char *argv[4] = { NULL, NULL, NULL, NULL };
1238   DBusBabysitter *sitter;
1239   DBusError error;
1240   
1241   sitter = NULL;
1242   
1243   dbus_error_init (&error);
1244
1245   /*** Test launching nonexistent binary */
1246   
1247   argv[0] = "/this/does/not/exist/32542sdgafgafdg";
1248   if (_dbus_spawn_async_with_babysitter (&sitter, argv,
1249                                          NULL, NULL, NULL,
1250                                          &error))
1251     {
1252       _dbus_babysitter_block_for_child_exit (sitter);
1253       _dbus_babysitter_set_child_exit_error (sitter, &error);
1254     }
1255
1256   if (sitter)
1257     _dbus_babysitter_unref (sitter);
1258
1259   if (!dbus_error_is_set (&error))
1260     {
1261       _dbus_warn ("Did not get an error launching nonexistent executable\n");
1262       return FALSE;
1263     }
1264
1265   if (!(dbus_error_has_name (&error, DBUS_ERROR_NO_MEMORY) ||
1266         dbus_error_has_name (&error, DBUS_ERROR_SPAWN_EXEC_FAILED)))
1267     {
1268       _dbus_warn ("Not expecting error when launching nonexistent executable: %s: %s\n",
1269                   error.name, error.message);
1270       dbus_error_free (&error);
1271       return FALSE;
1272     }
1273
1274   dbus_error_free (&error);
1275   
1276   return TRUE;
1277 }
1278
1279 static dbus_bool_t
1280 check_spawn_segfault (void *data)
1281 {
1282   char *argv[4] = { NULL, NULL, NULL, NULL };
1283   DBusBabysitter *sitter;
1284   DBusError error;
1285   
1286   sitter = NULL;
1287   
1288   dbus_error_init (&error);
1289
1290   /*** Test launching segfault binary */
1291   
1292   argv[0] = TEST_SEGFAULT_BINARY;
1293   if (_dbus_spawn_async_with_babysitter (&sitter, argv,
1294                                          NULL, NULL, NULL,
1295                                          &error))
1296     {
1297       _dbus_babysitter_block_for_child_exit (sitter);
1298       _dbus_babysitter_set_child_exit_error (sitter, &error);
1299     }
1300
1301   if (sitter)
1302     _dbus_babysitter_unref (sitter);
1303
1304   if (!dbus_error_is_set (&error))
1305     {
1306       _dbus_warn ("Did not get an error launching segfaulting binary\n");
1307       return FALSE;
1308     }
1309
1310   if (!(dbus_error_has_name (&error, DBUS_ERROR_NO_MEMORY) ||
1311         dbus_error_has_name (&error, DBUS_ERROR_SPAWN_CHILD_SIGNALED)))
1312     {
1313       _dbus_warn ("Not expecting error when launching segfaulting executable: %s: %s\n",
1314                   error.name, error.message);
1315       dbus_error_free (&error);
1316       return FALSE;
1317     }
1318
1319   dbus_error_free (&error);
1320   
1321   return TRUE;
1322 }
1323
1324 static dbus_bool_t
1325 check_spawn_exit (void *data)
1326 {
1327   char *argv[4] = { NULL, NULL, NULL, NULL };
1328   DBusBabysitter *sitter;
1329   DBusError error;
1330   
1331   sitter = NULL;
1332   
1333   dbus_error_init (&error);
1334
1335   /*** Test launching exit failure binary */
1336   
1337   argv[0] = TEST_EXIT_BINARY;
1338   if (_dbus_spawn_async_with_babysitter (&sitter, argv,
1339                                          NULL, NULL, NULL,
1340                                          &error))
1341     {
1342       _dbus_babysitter_block_for_child_exit (sitter);
1343       _dbus_babysitter_set_child_exit_error (sitter, &error);
1344     }
1345
1346   if (sitter)
1347     _dbus_babysitter_unref (sitter);
1348
1349   if (!dbus_error_is_set (&error))
1350     {
1351       _dbus_warn ("Did not get an error launching binary that exited with failure code\n");
1352       return FALSE;
1353     }
1354
1355   if (!(dbus_error_has_name (&error, DBUS_ERROR_NO_MEMORY) ||
1356         dbus_error_has_name (&error, DBUS_ERROR_SPAWN_CHILD_EXITED)))
1357     {
1358       _dbus_warn ("Not expecting error when launching exiting executable: %s: %s\n",
1359                   error.name, error.message);
1360       dbus_error_free (&error);
1361       return FALSE;
1362     }
1363
1364   dbus_error_free (&error);
1365   
1366   return TRUE;
1367 }
1368
1369 static dbus_bool_t
1370 check_spawn_and_kill (void *data)
1371 {
1372   char *argv[4] = { NULL, NULL, NULL, NULL };
1373   DBusBabysitter *sitter;
1374   DBusError error;
1375   
1376   sitter = NULL;
1377   
1378   dbus_error_init (&error);
1379
1380   /*** Test launching sleeping binary then killing it */
1381
1382   argv[0] = TEST_SLEEP_FOREVER_BINARY;
1383   if (_dbus_spawn_async_with_babysitter (&sitter, argv,
1384                                          NULL, NULL, NULL,
1385                                          &error))
1386     {
1387       _dbus_babysitter_kill_child (sitter);
1388       
1389       _dbus_babysitter_block_for_child_exit (sitter);
1390       
1391       _dbus_babysitter_set_child_exit_error (sitter, &error);
1392     }
1393
1394   if (sitter)
1395     _dbus_babysitter_unref (sitter);
1396
1397   if (!dbus_error_is_set (&error))
1398     {
1399       _dbus_warn ("Did not get an error after killing spawned binary\n");
1400       return FALSE;
1401     }
1402
1403   if (!(dbus_error_has_name (&error, DBUS_ERROR_NO_MEMORY) ||
1404         dbus_error_has_name (&error, DBUS_ERROR_SPAWN_CHILD_SIGNALED)))
1405     {
1406       _dbus_warn ("Not expecting error when killing executable: %s: %s\n",
1407                   error.name, error.message);
1408       dbus_error_free (&error);
1409       return FALSE;
1410     }
1411
1412   dbus_error_free (&error);
1413   
1414   return TRUE;
1415 }
1416
1417 dbus_bool_t
1418 _dbus_spawn_test (const char *test_data_dir)
1419 {
1420   if (!_dbus_test_oom_handling ("spawn_nonexistent",
1421                                 check_spawn_nonexistent,
1422                                 NULL))
1423     return FALSE;
1424
1425   if (!_dbus_test_oom_handling ("spawn_segfault",
1426                                 check_spawn_segfault,
1427                                 NULL))
1428     return FALSE;
1429
1430   if (!_dbus_test_oom_handling ("spawn_exit",
1431                                 check_spawn_exit,
1432                                 NULL))
1433     return FALSE;
1434
1435   if (!_dbus_test_oom_handling ("spawn_and_kill",
1436                                 check_spawn_and_kill,
1437                                 NULL))
1438     return FALSE;
1439   
1440   return TRUE;
1441 }
1442 #endif