use correct ssize_t type instead of size_t (FDO Bug #12862)
[platform/upstream/dbus.git] / dbus / dbus-spawn.c
1 /* -*- mode: C; c-file-style: "gnu"; indent-tabs-mode: nil; -*- */
2 /* dbus-spawn.c Wrapper around fork/exec
3  * 
4  * Copyright (C) 2002, 2003, 2004  Red Hat, Inc.
5  * Copyright (C) 2003 CodeFactory AB
6  *
7  * Licensed under the Academic Free License version 2.1
8  * 
9  * This program is free software; you can redistribute it and/or modify
10  * it under the terms of the GNU General Public License as published by
11  * the Free Software Foundation; either version 2 of the License, or
12  * (at your option) any later version.
13  *
14  * This program is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17  * GNU General Public License for more details.
18  * 
19  * You should have received a copy of the GNU General Public License
20  * along with this program; if not, write to the Free Software
21  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
22  *
23  */
24 #include "dbus-spawn.h"
25 #include "dbus-sysdeps-unix.h"
26 #include "dbus-internals.h"
27 #include "dbus-test.h"
28 #include "dbus-protocol.h"
29
30 #include <unistd.h>
31 #include <fcntl.h>
32 #include <signal.h>
33 #include <sys/wait.h>
34 #include <stdlib.h>
35 #ifdef HAVE_ERRNO_H
36 #include <errno.h>
37 #endif
38
39 /**
40  * @addtogroup DBusInternalsUtils
41  * @{
42  */
43
44 /*
45  * I'm pretty sure this whole spawn file could be made simpler,
46  * if you thought about it a bit.
47  */
48
49 /**
50  * Enumeration for status of a read()
51  */
52 typedef enum
53 {
54   READ_STATUS_OK,    /**< Read succeeded */
55   READ_STATUS_ERROR, /**< Some kind of error */
56   READ_STATUS_EOF    /**< EOF returned */
57 } ReadStatus;
58
59 static ReadStatus
60 read_ints (int        fd,
61            int       *buf,
62            int        n_ints_in_buf,
63            int       *n_ints_read,
64            DBusError *error)
65 {
66   size_t bytes = 0;    
67   ReadStatus retval;
68   
69   _DBUS_ASSERT_ERROR_IS_CLEAR (error);
70
71   retval = READ_STATUS_OK;
72   
73   while (TRUE)
74     {
75       size_t chunk;
76       ssize_t to_read;
77
78       to_read = sizeof (int) * n_ints_in_buf - bytes;
79
80       if (to_read == 0)
81         break;
82
83     again:
84       
85       chunk = read (fd,
86                     ((char*)buf) + bytes,
87                     to_read);
88       
89       if (chunk < 0 && errno == EINTR)
90         goto again;
91           
92       if (chunk < 0)
93         {
94           dbus_set_error (error,
95                           DBUS_ERROR_SPAWN_FAILED,
96                           "Failed to read from child pipe (%s)",
97                           _dbus_strerror (errno));
98
99           retval = READ_STATUS_ERROR;
100           break;
101         }
102       else if (chunk == 0)
103         {
104           retval = READ_STATUS_EOF;
105           break; /* EOF */
106         }
107       else /* chunk > 0 */
108         bytes += chunk;
109     }
110
111   *n_ints_read = (int)(bytes / sizeof(int));
112
113   return retval;
114 }
115
116 static ReadStatus
117 read_pid (int        fd,
118           pid_t     *buf,
119           DBusError *error)
120 {
121   size_t bytes = 0;    
122   ReadStatus retval;
123   
124   _DBUS_ASSERT_ERROR_IS_CLEAR (error);
125
126   retval = READ_STATUS_OK;
127   
128   while (TRUE)
129     {
130       size_t chunk;    
131       ssize_t to_read;
132       
133       to_read = sizeof (pid_t) - bytes;
134
135       if (to_read == 0)
136         break;
137
138     again:
139       
140       chunk = read (fd,
141                     ((char*)buf) + bytes,
142                     to_read);
143       if (chunk < 0 && errno == EINTR)
144         goto again;
145           
146       if (chunk < 0)
147         {
148           dbus_set_error (error,
149                           DBUS_ERROR_SPAWN_FAILED,
150                           "Failed to read from child pipe (%s)",
151                           _dbus_strerror (errno));
152
153           retval = READ_STATUS_ERROR;
154           break;
155         }
156       else if (chunk == 0)
157         {
158           retval = READ_STATUS_EOF;
159           break; /* EOF */
160         }
161       else /* chunk > 0 */
162         bytes += chunk;
163     }
164
165   return retval;
166 }
167
168 /* The implementation uses an intermediate child between the main process
169  * and the grandchild. The grandchild is our spawned process. The intermediate
170  * child is a babysitter process; it keeps track of when the grandchild
171  * exits/crashes, and reaps the grandchild.
172  */
173
174 /* Messages from children to parents */
175 enum
176 {
177   CHILD_EXITED,            /* This message is followed by the exit status int */
178   CHILD_FORK_FAILED,       /* Followed by errno */
179   CHILD_EXEC_FAILED,       /* Followed by errno */
180   CHILD_PID                /* Followed by pid_t */
181 };
182
183 /**
184  * Babysitter implementation details
185  */
186 struct DBusBabysitter
187 {
188   int refcount; /**< Reference count */
189
190   char *executable; /**< executable name to use in error messages */
191   
192   int socket_to_babysitter; /**< Connection to the babysitter process */
193   int error_pipe_from_child; /**< Connection to the process that does the exec() */
194   
195   pid_t sitter_pid;  /**< PID Of the babysitter */
196   pid_t grandchild_pid; /**< PID of the grandchild */
197
198   DBusWatchList *watches; /**< Watches */
199
200   DBusWatch *error_watch; /**< Error pipe watch */
201   DBusWatch *sitter_watch; /**< Sitter pipe watch */
202
203   int errnum; /**< Error number */
204   int status; /**< Exit status code */
205   unsigned int have_child_status : 1; /**< True if child status has been reaped */
206   unsigned int have_fork_errnum : 1; /**< True if we have an error code from fork() */
207   unsigned int have_exec_errnum : 1; /**< True if we have an error code from exec() */
208 };
209
210 static DBusBabysitter*
211 _dbus_babysitter_new (void)
212 {
213   DBusBabysitter *sitter;
214
215   sitter = dbus_new0 (DBusBabysitter, 1);
216   if (sitter == NULL)
217     return NULL;
218
219   sitter->refcount = 1;
220
221   sitter->socket_to_babysitter = -1;
222   sitter->error_pipe_from_child = -1;
223   
224   sitter->sitter_pid = -1;
225   sitter->grandchild_pid = -1;
226
227   sitter->watches = _dbus_watch_list_new ();
228   if (sitter->watches == NULL)
229     goto failed;
230   
231   return sitter;
232
233  failed:
234   _dbus_babysitter_unref (sitter);
235   return NULL;
236 }
237
238 /**
239  * Increment the reference count on the babysitter object.
240  *
241  * @param sitter the babysitter
242  * @returns the babysitter
243  */
244 DBusBabysitter *
245 _dbus_babysitter_ref (DBusBabysitter *sitter)
246 {
247   _dbus_assert (sitter != NULL);
248   _dbus_assert (sitter->refcount > 0);
249   
250   sitter->refcount += 1;
251
252   return sitter;
253 }
254
255 /**
256  * Decrement the reference count on the babysitter object.
257  * When the reference count of the babysitter object reaches
258  * zero, the babysitter is killed and the child that was being
259  * babysat gets emancipated.
260  *
261  * @param sitter the babysitter
262  */
263 void
264 _dbus_babysitter_unref (DBusBabysitter *sitter)
265 {
266   _dbus_assert (sitter != NULL);
267   _dbus_assert (sitter->refcount > 0);
268   
269   sitter->refcount -= 1;
270   if (sitter->refcount == 0)
271     {      
272       if (sitter->socket_to_babysitter >= 0)
273         {
274           /* If we haven't forked other babysitters
275            * since this babysitter and socket were
276            * created then this close will cause the
277            * babysitter to wake up from poll with
278            * a hangup and then the babysitter will
279            * quit itself.
280            */
281           _dbus_close_socket (sitter->socket_to_babysitter, NULL);
282           sitter->socket_to_babysitter = -1;
283         }
284
285       if (sitter->error_pipe_from_child >= 0)
286         {
287           _dbus_close_socket (sitter->error_pipe_from_child, NULL);
288           sitter->error_pipe_from_child = -1;
289         }
290
291       if (sitter->sitter_pid > 0)
292         {
293           int status;
294           int ret;
295
296           /* It's possible the babysitter died on its own above 
297            * from the close, or was killed randomly
298            * by some other process, so first try to reap it
299            */
300           ret = waitpid (sitter->sitter_pid, &status, WNOHANG);
301
302           /* If we couldn't reap the child then kill it, and
303            * try again
304            */
305           if (ret == 0)
306             kill (sitter->sitter_pid, SIGKILL);
307
308         again:
309           if (ret == 0)
310             ret = waitpid (sitter->sitter_pid, &status, 0);
311
312           if (ret < 0)
313             {
314               if (errno == EINTR)
315                 goto again;
316               else if (errno == ECHILD)
317                 _dbus_warn ("Babysitter process not available to be reaped; should not happen\n");
318               else
319                 _dbus_warn ("Unexpected error %d in waitpid() for babysitter: %s\n",
320                             errno, _dbus_strerror (errno));
321             }
322           else
323             {
324               _dbus_verbose ("Reaped %ld, waiting for babysitter %ld\n",
325                              (long) ret, (long) sitter->sitter_pid);
326               
327               if (WIFEXITED (sitter->status))
328                 _dbus_verbose ("Babysitter exited with status %d\n",
329                                WEXITSTATUS (sitter->status));
330               else if (WIFSIGNALED (sitter->status))
331                 _dbus_verbose ("Babysitter received signal %d\n",
332                                WTERMSIG (sitter->status));
333               else
334                 _dbus_verbose ("Babysitter exited abnormally\n");
335             }
336
337           sitter->sitter_pid = -1;
338         }
339       
340       if (sitter->error_watch)
341         {
342           _dbus_watch_invalidate (sitter->error_watch);
343           _dbus_watch_unref (sitter->error_watch);
344           sitter->error_watch = NULL;
345         }
346
347       if (sitter->sitter_watch)
348         {
349           _dbus_watch_invalidate (sitter->sitter_watch);
350           _dbus_watch_unref (sitter->sitter_watch);
351           sitter->sitter_watch = NULL;
352         }
353       
354       if (sitter->watches)
355         _dbus_watch_list_free (sitter->watches);
356
357       dbus_free (sitter->executable);
358       
359       dbus_free (sitter);
360     }
361 }
362
363 static ReadStatus
364 read_data (DBusBabysitter *sitter,
365            int             fd)
366 {
367   int what;
368   int got;
369   DBusError error = DBUS_ERROR_INIT;
370   ReadStatus r;
371
372   r = read_ints (fd, &what, 1, &got, &error);
373
374   switch (r)
375     {
376     case READ_STATUS_ERROR:
377       _dbus_warn ("Failed to read data from fd %d: %s\n", fd, error.message);
378       dbus_error_free (&error);
379       return r;
380
381     case READ_STATUS_EOF:
382       return r;
383
384     case READ_STATUS_OK:
385       break;
386     }
387   
388   if (got == 1)
389     {
390       switch (what)
391         {
392         case CHILD_EXITED:
393         case CHILD_FORK_FAILED:
394         case CHILD_EXEC_FAILED:
395           {
396             int arg;
397             
398             r = read_ints (fd, &arg, 1, &got, &error);
399
400             switch (r)
401               {
402               case READ_STATUS_ERROR:
403                 _dbus_warn ("Failed to read arg from fd %d: %s\n", fd, error.message);
404                 dbus_error_free (&error);
405                 return r;
406               case READ_STATUS_EOF:
407                 return r;
408               case READ_STATUS_OK:
409                 break;
410               }
411             
412             if (got == 1)
413               {
414                 if (what == CHILD_EXITED)
415                   {
416                     sitter->have_child_status = TRUE;
417                     sitter->status = arg;
418                     sitter->errnum = 0;
419                     _dbus_verbose ("recorded child status exited = %d signaled = %d exitstatus = %d termsig = %d\n",
420                                    WIFEXITED (sitter->status), WIFSIGNALED (sitter->status),
421                                    WEXITSTATUS (sitter->status), WTERMSIG (sitter->status));
422                   }
423                 else if (what == CHILD_FORK_FAILED)
424                   {
425                     sitter->have_fork_errnum = TRUE;
426                     sitter->errnum = arg;
427                     _dbus_verbose ("recorded fork errnum %d\n", sitter->errnum);
428                   }
429                 else if (what == CHILD_EXEC_FAILED)
430                   {
431                     sitter->have_exec_errnum = TRUE;
432                     sitter->errnum = arg;
433                     _dbus_verbose ("recorded exec errnum %d\n", sitter->errnum);
434                   }
435               }
436           }
437           break;
438         case CHILD_PID:
439           {
440             pid_t pid = -1;
441
442             r = read_pid (fd, &pid, &error);
443             
444             switch (r)
445               {
446               case READ_STATUS_ERROR:
447                 _dbus_warn ("Failed to read PID from fd %d: %s\n", fd, error.message);
448                 dbus_error_free (&error);
449                 return r;
450               case READ_STATUS_EOF:
451                 return r;
452               case READ_STATUS_OK:
453                 break;
454               }
455             
456             sitter->grandchild_pid = pid;
457             
458             _dbus_verbose ("recorded grandchild pid %d\n", sitter->grandchild_pid);
459           }
460           break;
461         default:
462           _dbus_warn ("Unknown message received from babysitter process\n");
463           break;
464         }
465     }
466
467   return r;
468 }
469
470 static void
471 close_socket_to_babysitter (DBusBabysitter *sitter)
472 {
473   _dbus_verbose ("Closing babysitter\n");
474   _dbus_close_socket (sitter->socket_to_babysitter, NULL);
475   sitter->socket_to_babysitter = -1;
476 }
477
478 static void
479 close_error_pipe_from_child (DBusBabysitter *sitter)
480 {
481   _dbus_verbose ("Closing child error\n");
482   _dbus_close_socket (sitter->error_pipe_from_child, NULL);
483   sitter->error_pipe_from_child = -1;
484 }
485
486 static void
487 handle_babysitter_socket (DBusBabysitter *sitter,
488                           int             revents)
489 {
490   /* Even if we have POLLHUP, we want to keep reading
491    * data until POLLIN goes away; so this function only
492    * looks at HUP/ERR if no IN is set.
493    */
494   if (revents & _DBUS_POLLIN)
495     {
496       _dbus_verbose ("Reading data from babysitter\n");
497       if (read_data (sitter, sitter->socket_to_babysitter) != READ_STATUS_OK)
498         close_socket_to_babysitter (sitter);
499     }
500   else if (revents & (_DBUS_POLLERR | _DBUS_POLLHUP))
501     {
502       close_socket_to_babysitter (sitter);
503     }
504 }
505
506 static void
507 handle_error_pipe (DBusBabysitter *sitter,
508                    int             revents)
509 {
510   if (revents & _DBUS_POLLIN)
511     {
512       _dbus_verbose ("Reading data from child error\n");
513       if (read_data (sitter, sitter->error_pipe_from_child) != READ_STATUS_OK)
514         close_error_pipe_from_child (sitter);
515     }
516   else if (revents & (_DBUS_POLLERR | _DBUS_POLLHUP))
517     {
518       close_error_pipe_from_child (sitter);
519     }
520 }
521
522 /* returns whether there were any poll events handled */
523 static dbus_bool_t
524 babysitter_iteration (DBusBabysitter *sitter,
525                       dbus_bool_t     block)
526 {
527   DBusPollFD fds[2];
528   int i;
529   dbus_bool_t descriptors_ready;
530
531   descriptors_ready = FALSE;
532   
533   i = 0;
534
535   if (sitter->error_pipe_from_child >= 0)
536     {
537       fds[i].fd = sitter->error_pipe_from_child;
538       fds[i].events = _DBUS_POLLIN;
539       fds[i].revents = 0;
540       ++i;
541     }
542   
543   if (sitter->socket_to_babysitter >= 0)
544     {
545       fds[i].fd = sitter->socket_to_babysitter;
546       fds[i].events = _DBUS_POLLIN;
547       fds[i].revents = 0;
548       ++i;
549     }
550
551   if (i > 0)
552     {
553       int ret;
554
555       do
556         {
557           ret = _dbus_poll (fds, i, 0);
558         }
559       while (ret < 0 && errno == EINTR);
560
561       if (ret == 0 && block)
562         {
563           do
564             {
565               ret = _dbus_poll (fds, i, -1);
566             }
567           while (ret < 0 && errno == EINTR);
568         }
569
570       if (ret > 0)
571         {
572           descriptors_ready = TRUE;
573           
574           while (i > 0)
575             {
576               --i;
577               if (fds[i].fd == sitter->error_pipe_from_child)
578                 handle_error_pipe (sitter, fds[i].revents);
579               else if (fds[i].fd == sitter->socket_to_babysitter)
580                 handle_babysitter_socket (sitter, fds[i].revents);
581             }
582         }
583     }
584
585   return descriptors_ready;
586 }
587
588 /**
589  * Macro returns #TRUE if the babysitter still has live sockets open to the
590  * babysitter child or the grandchild.
591  */
592 #define LIVE_CHILDREN(sitter) ((sitter)->socket_to_babysitter >= 0 || (sitter)->error_pipe_from_child >= 0)
593
594 /**
595  * Blocks until the babysitter process gives us the PID of the spawned grandchild,
596  * then kills the spawned grandchild.
597  *
598  * @param sitter the babysitter object
599  */
600 void
601 _dbus_babysitter_kill_child (DBusBabysitter *sitter)
602 {
603   /* be sure we have the PID of the child */
604   while (LIVE_CHILDREN (sitter) &&
605          sitter->grandchild_pid == -1)
606     babysitter_iteration (sitter, TRUE);
607
608   _dbus_verbose ("Got child PID %ld for killing\n",
609                  (long) sitter->grandchild_pid);
610   
611   if (sitter->grandchild_pid == -1)
612     return; /* child is already dead, or we're so hosed we'll never recover */
613
614   kill (sitter->grandchild_pid, SIGKILL);
615 }
616
617 /**
618  * Checks whether the child has exited, without blocking.
619  *
620  * @param sitter the babysitter
621  */
622 dbus_bool_t
623 _dbus_babysitter_get_child_exited (DBusBabysitter *sitter)
624 {
625
626   /* Be sure we're up-to-date */
627   while (LIVE_CHILDREN (sitter) &&
628          babysitter_iteration (sitter, FALSE))
629     ;
630
631   /* We will have exited the babysitter when the child has exited */
632   return sitter->socket_to_babysitter < 0;
633 }
634
635 /**
636  * Gets the exit status of the child. We do this so implementation specific
637  * detail is not cluttering up dbus, for example the system launcher code.
638  * This can only be called if the child has exited, i.e. call
639  * _dbus_babysitter_get_child_exited(). It returns FALSE if the child
640  * did not return a status code, e.g. because the child was signaled
641  * or we failed to ever launch the child in the first place.
642  *
643  * @param sitter the babysitter
644  * @param status the returned status code
645  * @returns #FALSE on failure
646  */
647 dbus_bool_t
648 _dbus_babysitter_get_child_exit_status (DBusBabysitter *sitter,
649                                         int            *status)
650 {
651   if (!_dbus_babysitter_get_child_exited (sitter))
652     _dbus_assert_not_reached ("Child has not exited");
653   
654   if (!sitter->have_child_status ||
655       !(WIFEXITED (sitter->status)))
656     return FALSE;
657
658   *status = WEXITSTATUS (sitter->status);
659   return TRUE;
660 }
661
662 /**
663  * Sets the #DBusError with an explanation of why the spawned
664  * child process exited (on a signal, or whatever). If
665  * the child process has not exited, does nothing (error
666  * will remain unset).
667  *
668  * @param sitter the babysitter
669  * @param error an error to fill in
670  */
671 void
672 _dbus_babysitter_set_child_exit_error (DBusBabysitter *sitter,
673                                        DBusError      *error)
674 {
675   if (!_dbus_babysitter_get_child_exited (sitter))
676     return;
677
678   /* Note that if exec fails, we will also get a child status
679    * from the babysitter saying the child exited,
680    * so we need to give priority to the exec error
681    */
682   if (sitter->have_exec_errnum)
683     {
684       dbus_set_error (error, DBUS_ERROR_SPAWN_EXEC_FAILED,
685                       "Failed to execute program %s: %s",
686                       sitter->executable, _dbus_strerror (sitter->errnum));
687     }
688   else if (sitter->have_fork_errnum)
689     {
690       dbus_set_error (error, DBUS_ERROR_NO_MEMORY,
691                       "Failed to fork a new process %s: %s",
692                       sitter->executable, _dbus_strerror (sitter->errnum));
693     }
694   else if (sitter->have_child_status)
695     {
696       if (WIFEXITED (sitter->status))
697         dbus_set_error (error, DBUS_ERROR_SPAWN_CHILD_EXITED,
698                         "Process %s exited with status %d",
699                         sitter->executable, WEXITSTATUS (sitter->status));
700       else if (WIFSIGNALED (sitter->status))
701         dbus_set_error (error, DBUS_ERROR_SPAWN_CHILD_SIGNALED,
702                         "Process %s received signal %d",
703                         sitter->executable, WTERMSIG (sitter->status));
704       else
705         dbus_set_error (error, DBUS_ERROR_FAILED,
706                         "Process %s exited abnormally",
707                         sitter->executable);
708     }
709   else
710     {
711       dbus_set_error (error, DBUS_ERROR_FAILED,
712                       "Process %s exited, reason unknown",
713                       sitter->executable);
714     }
715 }
716
717 /**
718  * Sets watch functions to notify us when the
719  * babysitter object needs to read/write file descriptors.
720  *
721  * @param sitter the babysitter
722  * @param add_function function to begin monitoring a new descriptor.
723  * @param remove_function function to stop monitoring a descriptor.
724  * @param toggled_function function to notify when the watch is enabled/disabled
725  * @param data data to pass to add_function and remove_function.
726  * @param free_data_function function to be called to free the data.
727  * @returns #FALSE on failure (no memory)
728  */
729 dbus_bool_t
730 _dbus_babysitter_set_watch_functions (DBusBabysitter            *sitter,
731                                       DBusAddWatchFunction       add_function,
732                                       DBusRemoveWatchFunction    remove_function,
733                                       DBusWatchToggledFunction   toggled_function,
734                                       void                      *data,
735                                       DBusFreeFunction           free_data_function)
736 {
737   return _dbus_watch_list_set_functions (sitter->watches,
738                                          add_function,
739                                          remove_function,
740                                          toggled_function,
741                                          data,
742                                          free_data_function);
743 }
744
745 static dbus_bool_t
746 handle_watch (DBusWatch       *watch,
747               unsigned int     condition,
748               void            *data)
749 {
750   DBusBabysitter *sitter = data;
751   int revents;
752   int fd;
753   
754   revents = 0;
755   if (condition & DBUS_WATCH_READABLE)
756     revents |= _DBUS_POLLIN;
757   if (condition & DBUS_WATCH_ERROR)
758     revents |= _DBUS_POLLERR;
759   if (condition & DBUS_WATCH_HANGUP)
760     revents |= _DBUS_POLLHUP;
761
762   fd = dbus_watch_get_socket (watch);
763
764   if (fd == sitter->error_pipe_from_child)
765     handle_error_pipe (sitter, revents);
766   else if (fd == sitter->socket_to_babysitter)
767     handle_babysitter_socket (sitter, revents);
768
769   while (LIVE_CHILDREN (sitter) &&
770          babysitter_iteration (sitter, FALSE))
771     ;
772   
773   return TRUE;
774 }
775
776 /** Helps remember which end of the pipe is which */
777 #define READ_END 0
778 /** Helps remember which end of the pipe is which */
779 #define WRITE_END 1
780
781
782 /* Avoids a danger in threaded situations (calling close()
783  * on a file descriptor twice, and another thread has
784  * re-opened it since the first close)
785  */
786 static int
787 close_and_invalidate (int *fd)
788 {
789   int ret;
790
791   if (*fd < 0)
792     return -1;
793   else
794     {
795       ret = _dbus_close_socket (*fd, NULL);
796       *fd = -1;
797     }
798
799   return ret;
800 }
801
802 static dbus_bool_t
803 make_pipe (int         p[2],
804            DBusError  *error)
805 {
806   _DBUS_ASSERT_ERROR_IS_CLEAR (error);
807   
808   if (pipe (p) < 0)
809     {
810       dbus_set_error (error,
811                       DBUS_ERROR_SPAWN_FAILED,
812                       "Failed to create pipe for communicating with child process (%s)",
813                       _dbus_strerror (errno));
814       return FALSE;
815     }
816
817   return TRUE;
818 }
819
820 static void
821 do_write (int fd, const void *buf, size_t count)
822 {
823   size_t bytes_written;
824   int ret;
825   
826   bytes_written = 0;
827   
828  again:
829   
830   ret = write (fd, ((const char*)buf) + bytes_written, count - bytes_written);
831
832   if (ret < 0)
833     {
834       if (errno == EINTR)
835         goto again;
836       else
837         {
838           _dbus_warn ("Failed to write data to pipe!\n");
839           exit (1); /* give up, we suck */
840         }
841     }
842   else
843     bytes_written += ret;
844   
845   if (bytes_written < count)
846     goto again;
847 }
848
849 static void
850 write_err_and_exit (int fd, int msg)
851 {
852   int en = errno;
853
854   do_write (fd, &msg, sizeof (msg));
855   do_write (fd, &en, sizeof (en));
856   
857   exit (1);
858 }
859
860 static void
861 write_pid (int fd, pid_t pid)
862 {
863   int msg = CHILD_PID;
864   
865   do_write (fd, &msg, sizeof (msg));
866   do_write (fd, &pid, sizeof (pid));
867 }
868
869 static void
870 write_status_and_exit (int fd, int status)
871 {
872   int msg = CHILD_EXITED;
873   
874   do_write (fd, &msg, sizeof (msg));
875   do_write (fd, &status, sizeof (status));
876   
877   exit (0);
878 }
879
880 static void
881 do_exec (int                       child_err_report_fd,
882          char                    **argv,
883          DBusSpawnChildSetupFunc   child_setup,
884          void                     *user_data)
885 {
886 #ifdef DBUS_BUILD_TESTS
887   int i, max_open;
888 #endif
889
890   _dbus_verbose_reset ();
891   _dbus_verbose ("Child process has PID " DBUS_PID_FORMAT "\n",
892                  _dbus_getpid ());
893   
894   if (child_setup)
895     (* child_setup) (user_data);
896
897 #ifdef DBUS_BUILD_TESTS
898   max_open = sysconf (_SC_OPEN_MAX);
899   
900   for (i = 3; i < max_open; i++)
901     {
902       int retval;
903
904       if (i == child_err_report_fd)
905         continue;
906       
907       retval = fcntl (i, F_GETFD);
908
909       if (retval != -1 && !(retval & FD_CLOEXEC))
910         _dbus_warn ("Fd %d did not have the close-on-exec flag set!\n", i);
911     }
912 #endif
913   
914   execv (argv[0], argv);
915   
916   /* Exec failed */
917   write_err_and_exit (child_err_report_fd,
918                       CHILD_EXEC_FAILED);
919 }
920
921 static void
922 check_babysit_events (pid_t grandchild_pid,
923                       int   parent_pipe,
924                       int   revents)
925 {
926   pid_t ret;
927   int status;
928   
929   do
930     {
931       ret = waitpid (grandchild_pid, &status, WNOHANG);
932       /* The man page says EINTR can't happen with WNOHANG,
933        * but there are reports of it (maybe only with valgrind?)
934        */
935     }
936   while (ret < 0 && errno == EINTR);
937
938   if (ret == 0)
939     {
940       _dbus_verbose ("no child exited\n");
941       
942       ; /* no child exited */
943     }
944   else if (ret < 0)
945     {
946       /* This isn't supposed to happen. */
947       _dbus_warn ("unexpected waitpid() failure in check_babysit_events(): %s\n",
948                   _dbus_strerror (errno));
949       exit (1);
950     }
951   else if (ret == grandchild_pid)
952     {
953       /* Child exited */
954       _dbus_verbose ("reaped child pid %ld\n", (long) ret);
955       
956       write_status_and_exit (parent_pipe, status);
957     }
958   else
959     {
960       _dbus_warn ("waitpid() reaped pid %d that we've never heard of\n",
961                   (int) ret);
962       exit (1);
963     }
964
965   if (revents & _DBUS_POLLIN)
966     {
967       _dbus_verbose ("babysitter got POLLIN from parent pipe\n");
968     }
969
970   if (revents & (_DBUS_POLLERR | _DBUS_POLLHUP))
971     {
972       /* Parent is gone, so we just exit */
973       _dbus_verbose ("babysitter got POLLERR or POLLHUP from parent\n");
974       exit (0);
975     }
976 }
977
978 static int babysit_sigchld_pipe = -1;
979
980 static void
981 babysit_signal_handler (int signo)
982 {
983   char b = '\0';
984  again:
985   write (babysit_sigchld_pipe, &b, 1);
986   if (errno == EINTR)
987     goto again;
988 }
989
990 static void
991 babysit (pid_t grandchild_pid,
992          int   parent_pipe)
993 {
994   int sigchld_pipe[2];
995
996   /* We don't exec, so we keep parent state, such as the pid that
997    * _dbus_verbose() uses. Reset the pid here.
998    */
999   _dbus_verbose_reset ();
1000   
1001   /* I thought SIGCHLD would just wake up the poll, but
1002    * that didn't seem to work, so added this pipe.
1003    * Probably the pipe is more likely to work on busted
1004    * operating systems anyhow.
1005    */
1006   if (pipe (sigchld_pipe) < 0)
1007     {
1008       _dbus_warn ("Not enough file descriptors to create pipe in babysitter process\n");
1009       exit (1);
1010     }
1011
1012   babysit_sigchld_pipe = sigchld_pipe[WRITE_END];
1013
1014   _dbus_set_signal_handler (SIGCHLD, babysit_signal_handler);
1015   
1016   write_pid (parent_pipe, grandchild_pid);
1017
1018   check_babysit_events (grandchild_pid, parent_pipe, 0);
1019
1020   while (TRUE)
1021     {
1022       DBusPollFD pfds[2];
1023       
1024       pfds[0].fd = parent_pipe;
1025       pfds[0].events = _DBUS_POLLIN;
1026       pfds[0].revents = 0;
1027
1028       pfds[1].fd = sigchld_pipe[READ_END];
1029       pfds[1].events = _DBUS_POLLIN;
1030       pfds[1].revents = 0;
1031       
1032       if (_dbus_poll (pfds, _DBUS_N_ELEMENTS (pfds), -1) < 0 && errno != EINTR)
1033         {
1034           _dbus_warn ("_dbus_poll() error: %s\n", strerror (errno));
1035           exit (1);
1036         }
1037
1038       if (pfds[0].revents != 0)
1039         {
1040           check_babysit_events (grandchild_pid, parent_pipe, pfds[0].revents);
1041         }
1042       else if (pfds[1].revents & _DBUS_POLLIN)
1043         {
1044           char b;
1045           read (sigchld_pipe[READ_END], &b, 1);
1046           /* do waitpid check */
1047           check_babysit_events (grandchild_pid, parent_pipe, 0);
1048         }
1049     }
1050   
1051   exit (1);
1052 }
1053
1054 /**
1055  * Spawns a new process. The executable name and argv[0]
1056  * are the same, both are provided in argv[0]. The child_setup
1057  * function is passed the given user_data and is run in the child
1058  * just before calling exec().
1059  *
1060  * Also creates a "babysitter" which tracks the status of the
1061  * child process, advising the parent if the child exits.
1062  * If the spawn fails, no babysitter is created.
1063  * If sitter_p is #NULL, no babysitter is kept.
1064  *
1065  * @param sitter_p return location for babysitter or #NULL
1066  * @param argv the executable and arguments
1067  * @param env the environment (not used on unix yet)
1068  * @param child_setup function to call in child pre-exec()
1069  * @param user_data user data for setup function
1070  * @param error error object to be filled in if function fails
1071  * @returns #TRUE on success, #FALSE if error is filled in
1072  */
1073 dbus_bool_t
1074 _dbus_spawn_async_with_babysitter (DBusBabysitter          **sitter_p,
1075                                    char                    **argv,
1076                                    char                    **env,
1077                                    DBusSpawnChildSetupFunc   child_setup,
1078                                    void                     *user_data,
1079                                    DBusError                *error)
1080 {
1081   DBusBabysitter *sitter;
1082   int child_err_report_pipe[2] = { -1, -1 };
1083   int babysitter_pipe[2] = { -1, -1 };
1084   pid_t pid;
1085   
1086   _DBUS_ASSERT_ERROR_IS_CLEAR (error);
1087
1088   *sitter_p = NULL;
1089   sitter = NULL;
1090
1091   sitter = _dbus_babysitter_new ();
1092   if (sitter == NULL)
1093     {
1094       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1095       return FALSE;
1096     }
1097
1098   sitter->executable = _dbus_strdup (argv[0]);
1099   if (sitter->executable == NULL)
1100     {
1101       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1102       goto cleanup_and_fail;
1103     }
1104   
1105   if (!make_pipe (child_err_report_pipe, error))
1106     goto cleanup_and_fail;
1107
1108   _dbus_fd_set_close_on_exec (child_err_report_pipe[READ_END]);
1109   _dbus_fd_set_close_on_exec (child_err_report_pipe[WRITE_END]);
1110
1111   if (!_dbus_full_duplex_pipe (&babysitter_pipe[0], &babysitter_pipe[1], TRUE, error))
1112     goto cleanup_and_fail;
1113
1114   _dbus_fd_set_close_on_exec (babysitter_pipe[0]);
1115   _dbus_fd_set_close_on_exec (babysitter_pipe[1]);
1116
1117   /* Setting up the babysitter is only useful in the parent,
1118    * but we don't want to run out of memory and fail
1119    * after we've already forked, since then we'd leak
1120    * child processes everywhere.
1121    */
1122   sitter->error_watch = _dbus_watch_new (child_err_report_pipe[READ_END],
1123                                          DBUS_WATCH_READABLE,
1124                                          TRUE, handle_watch, sitter, NULL);
1125   if (sitter->error_watch == NULL)
1126     {
1127       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1128       goto cleanup_and_fail;
1129     }
1130         
1131   if (!_dbus_watch_list_add_watch (sitter->watches,  sitter->error_watch))
1132     {
1133       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1134       goto cleanup_and_fail;
1135     }
1136       
1137   sitter->sitter_watch = _dbus_watch_new (babysitter_pipe[0],
1138                                           DBUS_WATCH_READABLE,
1139                                           TRUE, handle_watch, sitter, NULL);
1140   if (sitter->sitter_watch == NULL)
1141     {
1142       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1143       goto cleanup_and_fail;
1144     }
1145       
1146   if (!_dbus_watch_list_add_watch (sitter->watches,  sitter->sitter_watch))
1147     {
1148       dbus_set_error (error, DBUS_ERROR_NO_MEMORY, NULL);
1149       goto cleanup_and_fail;
1150     }
1151
1152   _DBUS_ASSERT_ERROR_IS_CLEAR (error);
1153   
1154   pid = fork ();
1155   
1156   if (pid < 0)
1157     {
1158       dbus_set_error (error,
1159                       DBUS_ERROR_SPAWN_FORK_FAILED,
1160                       "Failed to fork (%s)",
1161                       _dbus_strerror (errno));
1162       goto cleanup_and_fail;
1163     }
1164   else if (pid == 0)
1165     {
1166       /* Immediate child, this is the babysitter process. */
1167       int grandchild_pid;
1168       
1169       /* Be sure we crash if the parent exits
1170        * and we write to the err_report_pipe
1171        */
1172       signal (SIGPIPE, SIG_DFL);
1173
1174       /* Close the parent's end of the pipes. */
1175       close_and_invalidate (&child_err_report_pipe[READ_END]);
1176       close_and_invalidate (&babysitter_pipe[0]);
1177       
1178       /* Create the child that will exec () */
1179       grandchild_pid = fork ();
1180       
1181       if (grandchild_pid < 0)
1182         {
1183           write_err_and_exit (babysitter_pipe[1],
1184                               CHILD_FORK_FAILED);
1185           _dbus_assert_not_reached ("Got to code after write_err_and_exit()");
1186         }
1187       else if (grandchild_pid == 0)
1188         {
1189           do_exec (child_err_report_pipe[WRITE_END],
1190                    argv,
1191                    child_setup, user_data);
1192           _dbus_assert_not_reached ("Got to code after exec() - should have exited on error");
1193         }
1194       else
1195         {
1196           babysit (grandchild_pid, babysitter_pipe[1]);
1197           _dbus_assert_not_reached ("Got to code after babysit()");
1198         }
1199     }
1200   else
1201     {      
1202       /* Close the uncared-about ends of the pipes */
1203       close_and_invalidate (&child_err_report_pipe[WRITE_END]);
1204       close_and_invalidate (&babysitter_pipe[1]);
1205
1206       sitter->socket_to_babysitter = babysitter_pipe[0];
1207       babysitter_pipe[0] = -1;
1208       
1209       sitter->error_pipe_from_child = child_err_report_pipe[READ_END];
1210       child_err_report_pipe[READ_END] = -1;
1211
1212       sitter->sitter_pid = pid;
1213
1214       if (sitter_p != NULL)
1215         *sitter_p = sitter;
1216       else
1217         _dbus_babysitter_unref (sitter);
1218
1219       _DBUS_ASSERT_ERROR_IS_CLEAR (error);
1220       
1221       return TRUE;
1222     }
1223
1224  cleanup_and_fail:
1225
1226   _DBUS_ASSERT_ERROR_IS_SET (error);
1227   
1228   close_and_invalidate (&child_err_report_pipe[READ_END]);
1229   close_and_invalidate (&child_err_report_pipe[WRITE_END]);
1230   close_and_invalidate (&babysitter_pipe[0]);
1231   close_and_invalidate (&babysitter_pipe[1]);
1232
1233   if (sitter != NULL)
1234     _dbus_babysitter_unref (sitter);
1235   
1236   return FALSE;
1237 }
1238
1239 /** @} */
1240
1241 #ifdef DBUS_BUILD_TESTS
1242
1243 static void
1244 _dbus_babysitter_block_for_child_exit (DBusBabysitter *sitter)
1245 {
1246   while (LIVE_CHILDREN (sitter))
1247     babysitter_iteration (sitter, TRUE);
1248 }
1249
1250 static dbus_bool_t
1251 check_spawn_nonexistent (void *data)
1252 {
1253   char *argv[4] = { NULL, NULL, NULL, NULL };
1254   DBusBabysitter *sitter = NULL;
1255   DBusError error = DBUS_ERROR_INIT;
1256
1257   /*** Test launching nonexistent binary */
1258   
1259   argv[0] = "/this/does/not/exist/32542sdgafgafdg";
1260   if (_dbus_spawn_async_with_babysitter (&sitter, argv,
1261                                          NULL, NULL, NULL,
1262                                          &error))
1263     {
1264       _dbus_babysitter_block_for_child_exit (sitter);
1265       _dbus_babysitter_set_child_exit_error (sitter, &error);
1266     }
1267
1268   if (sitter)
1269     _dbus_babysitter_unref (sitter);
1270
1271   if (!dbus_error_is_set (&error))
1272     {
1273       _dbus_warn ("Did not get an error launching nonexistent executable\n");
1274       return FALSE;
1275     }
1276
1277   if (!(dbus_error_has_name (&error, DBUS_ERROR_NO_MEMORY) ||
1278         dbus_error_has_name (&error, DBUS_ERROR_SPAWN_EXEC_FAILED)))
1279     {
1280       _dbus_warn ("Not expecting error when launching nonexistent executable: %s: %s\n",
1281                   error.name, error.message);
1282       dbus_error_free (&error);
1283       return FALSE;
1284     }
1285
1286   dbus_error_free (&error);
1287   
1288   return TRUE;
1289 }
1290
1291 static dbus_bool_t
1292 check_spawn_segfault (void *data)
1293 {
1294   char *argv[4] = { NULL, NULL, NULL, NULL };
1295   DBusBabysitter *sitter = NULL;
1296   DBusError error = DBUS_ERROR_INIT;
1297
1298   /*** Test launching segfault binary */
1299   
1300   argv[0] = TEST_SEGFAULT_BINARY;
1301   if (_dbus_spawn_async_with_babysitter (&sitter, argv,
1302                                          NULL, NULL, NULL,
1303                                          &error))
1304     {
1305       _dbus_babysitter_block_for_child_exit (sitter);
1306       _dbus_babysitter_set_child_exit_error (sitter, &error);
1307     }
1308
1309   if (sitter)
1310     _dbus_babysitter_unref (sitter);
1311
1312   if (!dbus_error_is_set (&error))
1313     {
1314       _dbus_warn ("Did not get an error launching segfaulting binary\n");
1315       return FALSE;
1316     }
1317
1318   if (!(dbus_error_has_name (&error, DBUS_ERROR_NO_MEMORY) ||
1319         dbus_error_has_name (&error, DBUS_ERROR_SPAWN_CHILD_SIGNALED)))
1320     {
1321       _dbus_warn ("Not expecting error when launching segfaulting executable: %s: %s\n",
1322                   error.name, error.message);
1323       dbus_error_free (&error);
1324       return FALSE;
1325     }
1326
1327   dbus_error_free (&error);
1328   
1329   return TRUE;
1330 }
1331
1332 static dbus_bool_t
1333 check_spawn_exit (void *data)
1334 {
1335   char *argv[4] = { NULL, NULL, NULL, NULL };
1336   DBusBabysitter *sitter = NULL;
1337   DBusError error = DBUS_ERROR_INIT;
1338
1339   /*** Test launching exit failure binary */
1340   
1341   argv[0] = TEST_EXIT_BINARY;
1342   if (_dbus_spawn_async_with_babysitter (&sitter, argv,
1343                                          NULL, NULL, NULL,
1344                                          &error))
1345     {
1346       _dbus_babysitter_block_for_child_exit (sitter);
1347       _dbus_babysitter_set_child_exit_error (sitter, &error);
1348     }
1349
1350   if (sitter)
1351     _dbus_babysitter_unref (sitter);
1352
1353   if (!dbus_error_is_set (&error))
1354     {
1355       _dbus_warn ("Did not get an error launching binary that exited with failure code\n");
1356       return FALSE;
1357     }
1358
1359   if (!(dbus_error_has_name (&error, DBUS_ERROR_NO_MEMORY) ||
1360         dbus_error_has_name (&error, DBUS_ERROR_SPAWN_CHILD_EXITED)))
1361     {
1362       _dbus_warn ("Not expecting error when launching exiting executable: %s: %s\n",
1363                   error.name, error.message);
1364       dbus_error_free (&error);
1365       return FALSE;
1366     }
1367
1368   dbus_error_free (&error);
1369   
1370   return TRUE;
1371 }
1372
1373 static dbus_bool_t
1374 check_spawn_and_kill (void *data)
1375 {
1376   char *argv[4] = { NULL, NULL, NULL, NULL };
1377   DBusBabysitter *sitter = NULL;
1378   DBusError error = DBUS_ERROR_INIT;
1379
1380   /*** Test launching sleeping binary then killing it */
1381
1382   argv[0] = TEST_SLEEP_FOREVER_BINARY;
1383   if (_dbus_spawn_async_with_babysitter (&sitter, argv,
1384                                          NULL, NULL, NULL,
1385                                          &error))
1386     {
1387       _dbus_babysitter_kill_child (sitter);
1388       
1389       _dbus_babysitter_block_for_child_exit (sitter);
1390       
1391       _dbus_babysitter_set_child_exit_error (sitter, &error);
1392     }
1393
1394   if (sitter)
1395     _dbus_babysitter_unref (sitter);
1396
1397   if (!dbus_error_is_set (&error))
1398     {
1399       _dbus_warn ("Did not get an error after killing spawned binary\n");
1400       return FALSE;
1401     }
1402
1403   if (!(dbus_error_has_name (&error, DBUS_ERROR_NO_MEMORY) ||
1404         dbus_error_has_name (&error, DBUS_ERROR_SPAWN_CHILD_SIGNALED)))
1405     {
1406       _dbus_warn ("Not expecting error when killing executable: %s: %s\n",
1407                   error.name, error.message);
1408       dbus_error_free (&error);
1409       return FALSE;
1410     }
1411
1412   dbus_error_free (&error);
1413   
1414   return TRUE;
1415 }
1416
1417 dbus_bool_t
1418 _dbus_spawn_test (const char *test_data_dir)
1419 {
1420   if (!_dbus_test_oom_handling ("spawn_nonexistent",
1421                                 check_spawn_nonexistent,
1422                                 NULL))
1423     return FALSE;
1424
1425   if (!_dbus_test_oom_handling ("spawn_segfault",
1426                                 check_spawn_segfault,
1427                                 NULL))
1428     return FALSE;
1429
1430   if (!_dbus_test_oom_handling ("spawn_exit",
1431                                 check_spawn_exit,
1432                                 NULL))
1433     return FALSE;
1434
1435   if (!_dbus_test_oom_handling ("spawn_and_kill",
1436                                 check_spawn_and_kill,
1437                                 NULL))
1438     return FALSE;
1439   
1440   return TRUE;
1441 }
1442 #endif