btrfs-progs: build, use autoconf to detect RM
[platform/upstream/btrfs-progs.git] / utils.c
1 /*
2  * Copyright (C) 2007 Oracle.  All rights reserved.
3  * Copyright (C) 2008 Morey Roof.  All rights reserved.
4  *
5  * This program is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU General Public
7  * License v2 as published by the Free Software Foundation.
8  *
9  * This program is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12  * General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public
15  * License along with this program; if not, write to the
16  * Free Software Foundation, Inc., 59 Temple Place - Suite 330,
17  * Boston, MA 021110-1307, USA.
18  */
19
20 #include <stdio.h>
21 #include <stdlib.h>
22 #include <string.h>
23 #include <sys/ioctl.h>
24 #include <sys/mount.h>
25 #include <sys/types.h>
26 #include <sys/stat.h>
27 #include <uuid/uuid.h>
28 #include <fcntl.h>
29 #include <unistd.h>
30 #include <mntent.h>
31 #include <ctype.h>
32 #include <linux/loop.h>
33 #include <linux/major.h>
34 #include <linux/kdev_t.h>
35 #include <limits.h>
36 #include <blkid/blkid.h>
37 #include <sys/vfs.h>
38
39 #include "kerncompat.h"
40 #include "radix-tree.h"
41 #include "ctree.h"
42 #include "disk-io.h"
43 #include "transaction.h"
44 #include "crc32c.h"
45 #include "utils.h"
46 #include "volumes.h"
47 #include "ioctl.h"
48
49 #ifndef BLKDISCARD
50 #define BLKDISCARD      _IO(0x12,119)
51 #endif
52
53 static int btrfs_scan_done = 0;
54
55 static char argv0_buf[ARGV0_BUF_SIZE] = "btrfs";
56
57 void fixup_argv0(char **argv, const char *token)
58 {
59         int len = strlen(argv0_buf);
60
61         snprintf(argv0_buf + len, sizeof(argv0_buf) - len, " %s", token);
62         argv[0] = argv0_buf;
63 }
64
65 void set_argv0(char **argv)
66 {
67         strncpy(argv0_buf, argv[0], sizeof(argv0_buf));
68         argv0_buf[sizeof(argv0_buf) - 1] = 0;
69 }
70
71 int check_argc_exact(int nargs, int expected)
72 {
73         if (nargs < expected)
74                 fprintf(stderr, "%s: too few arguments\n", argv0_buf);
75         if (nargs > expected)
76                 fprintf(stderr, "%s: too many arguments\n", argv0_buf);
77
78         return nargs != expected;
79 }
80
81 int check_argc_min(int nargs, int expected)
82 {
83         if (nargs < expected) {
84                 fprintf(stderr, "%s: too few arguments\n", argv0_buf);
85                 return 1;
86         }
87
88         return 0;
89 }
90
91 int check_argc_max(int nargs, int expected)
92 {
93         if (nargs > expected) {
94                 fprintf(stderr, "%s: too many arguments\n", argv0_buf);
95                 return 1;
96         }
97
98         return 0;
99 }
100
101
102 /*
103  * Discard the given range in one go
104  */
105 static int discard_range(int fd, u64 start, u64 len)
106 {
107         u64 range[2] = { start, len };
108
109         if (ioctl(fd, BLKDISCARD, &range) < 0)
110                 return errno;
111         return 0;
112 }
113
114 /*
115  * Discard blocks in the given range in 1G chunks, the process is interruptible
116  */
117 static int discard_blocks(int fd, u64 start, u64 len)
118 {
119         while (len > 0) {
120                 /* 1G granularity */
121                 u64 chunk_size = min_t(u64, len, 1*1024*1024*1024);
122                 int ret;
123
124                 ret = discard_range(fd, start, chunk_size);
125                 if (ret)
126                         return ret;
127                 len -= chunk_size;
128                 start += chunk_size;
129         }
130
131         return 0;
132 }
133
134 static u64 reference_root_table[] = {
135         [1] =   BTRFS_ROOT_TREE_OBJECTID,
136         [2] =   BTRFS_EXTENT_TREE_OBJECTID,
137         [3] =   BTRFS_CHUNK_TREE_OBJECTID,
138         [4] =   BTRFS_DEV_TREE_OBJECTID,
139         [5] =   BTRFS_FS_TREE_OBJECTID,
140         [6] =   BTRFS_CSUM_TREE_OBJECTID,
141 };
142
143 int test_uuid_unique(char *fs_uuid)
144 {
145         int unique = 1;
146         blkid_dev_iterate iter = NULL;
147         blkid_dev dev = NULL;
148         blkid_cache cache = NULL;
149
150         if (blkid_get_cache(&cache, 0) < 0) {
151                 printf("ERROR: lblkid cache get failed\n");
152                 return 1;
153         }
154         blkid_probe_all(cache);
155         iter = blkid_dev_iterate_begin(cache);
156         blkid_dev_set_search(iter, "UUID", fs_uuid);
157
158         while (blkid_dev_next(iter, &dev) == 0) {
159                 dev = blkid_verify(cache, dev);
160                 if (dev) {
161                         unique = 0;
162                         break;
163                 }
164         }
165
166         blkid_dev_iterate_end(iter);
167         blkid_put_cache(cache);
168
169         return unique;
170 }
171
172 int make_btrfs(int fd, const char *device, const char *label, char *fs_uuid,
173                u64 blocks[7], u64 num_bytes, u32 nodesize,
174                u32 leafsize, u32 sectorsize, u32 stripesize, u64 features)
175 {
176         struct btrfs_super_block super;
177         struct extent_buffer *buf = NULL;
178         struct btrfs_root_item root_item;
179         struct btrfs_disk_key disk_key;
180         struct btrfs_extent_item *extent_item;
181         struct btrfs_inode_item *inode_item;
182         struct btrfs_chunk *chunk;
183         struct btrfs_dev_item *dev_item;
184         struct btrfs_dev_extent *dev_extent;
185         u8 chunk_tree_uuid[BTRFS_UUID_SIZE];
186         u8 *ptr;
187         int i;
188         int ret;
189         u32 itemoff;
190         u32 nritems = 0;
191         u64 first_free;
192         u64 ref_root;
193         u32 array_size;
194         u32 item_size;
195         int skinny_metadata = !!(features &
196                                  BTRFS_FEATURE_INCOMPAT_SKINNY_METADATA);
197
198         first_free = BTRFS_SUPER_INFO_OFFSET + sectorsize * 2 - 1;
199         first_free &= ~((u64)sectorsize - 1);
200
201         memset(&super, 0, sizeof(super));
202
203         num_bytes = (num_bytes / sectorsize) * sectorsize;
204         if (fs_uuid) {
205                 if (uuid_parse(fs_uuid, super.fsid) != 0) {
206                         fprintf(stderr, "could not parse UUID: %s\n", fs_uuid);
207                         ret = -EINVAL;
208                         goto out;
209                 }
210                 if (!test_uuid_unique(fs_uuid)) {
211                         fprintf(stderr, "non-unique UUID: %s\n", fs_uuid);
212                         ret = -EBUSY;
213                         goto out;
214                 }
215         } else {
216                 uuid_generate(super.fsid);
217         }
218         uuid_generate(super.dev_item.uuid);
219         uuid_generate(chunk_tree_uuid);
220
221         btrfs_set_super_bytenr(&super, blocks[0]);
222         btrfs_set_super_num_devices(&super, 1);
223         btrfs_set_super_magic(&super, BTRFS_MAGIC);
224         btrfs_set_super_generation(&super, 1);
225         btrfs_set_super_root(&super, blocks[1]);
226         btrfs_set_super_chunk_root(&super, blocks[3]);
227         btrfs_set_super_total_bytes(&super, num_bytes);
228         btrfs_set_super_bytes_used(&super, 6 * leafsize);
229         btrfs_set_super_sectorsize(&super, sectorsize);
230         btrfs_set_super_leafsize(&super, leafsize);
231         btrfs_set_super_nodesize(&super, nodesize);
232         btrfs_set_super_stripesize(&super, stripesize);
233         btrfs_set_super_csum_type(&super, BTRFS_CSUM_TYPE_CRC32);
234         btrfs_set_super_chunk_root_generation(&super, 1);
235         btrfs_set_super_cache_generation(&super, -1);
236         btrfs_set_super_incompat_flags(&super, features);
237         if (label)
238                 strncpy(super.label, label, BTRFS_LABEL_SIZE - 1);
239
240         buf = malloc(sizeof(*buf) + max(sectorsize, leafsize));
241
242         /* create the tree of root objects */
243         memset(buf->data, 0, leafsize);
244         buf->len = leafsize;
245         btrfs_set_header_bytenr(buf, blocks[1]);
246         btrfs_set_header_nritems(buf, 4);
247         btrfs_set_header_generation(buf, 1);
248         btrfs_set_header_backref_rev(buf, BTRFS_MIXED_BACKREF_REV);
249         btrfs_set_header_owner(buf, BTRFS_ROOT_TREE_OBJECTID);
250         write_extent_buffer(buf, super.fsid, btrfs_header_fsid(),
251                             BTRFS_FSID_SIZE);
252
253         write_extent_buffer(buf, chunk_tree_uuid,
254                             btrfs_header_chunk_tree_uuid(buf),
255                             BTRFS_UUID_SIZE);
256
257         /* create the items for the root tree */
258         memset(&root_item, 0, sizeof(root_item));
259         inode_item = &root_item.inode;
260         btrfs_set_stack_inode_generation(inode_item, 1);
261         btrfs_set_stack_inode_size(inode_item, 3);
262         btrfs_set_stack_inode_nlink(inode_item, 1);
263         btrfs_set_stack_inode_nbytes(inode_item, leafsize);
264         btrfs_set_stack_inode_mode(inode_item, S_IFDIR | 0755);
265         btrfs_set_root_refs(&root_item, 1);
266         btrfs_set_root_used(&root_item, leafsize);
267         btrfs_set_root_generation(&root_item, 1);
268
269         memset(&disk_key, 0, sizeof(disk_key));
270         btrfs_set_disk_key_type(&disk_key, BTRFS_ROOT_ITEM_KEY);
271         btrfs_set_disk_key_offset(&disk_key, 0);
272         nritems = 0;
273
274         itemoff = __BTRFS_LEAF_DATA_SIZE(leafsize) - sizeof(root_item);
275         btrfs_set_root_bytenr(&root_item, blocks[2]);
276         btrfs_set_disk_key_objectid(&disk_key, BTRFS_EXTENT_TREE_OBJECTID);
277         btrfs_set_item_key(buf, &disk_key, nritems);
278         btrfs_set_item_offset(buf, btrfs_item_nr(nritems), itemoff);
279         btrfs_set_item_size(buf, btrfs_item_nr(nritems),
280                             sizeof(root_item));
281         write_extent_buffer(buf, &root_item, btrfs_item_ptr_offset(buf,
282                             nritems), sizeof(root_item));
283         nritems++;
284
285         itemoff = itemoff - sizeof(root_item);
286         btrfs_set_root_bytenr(&root_item, blocks[4]);
287         btrfs_set_disk_key_objectid(&disk_key, BTRFS_DEV_TREE_OBJECTID);
288         btrfs_set_item_key(buf, &disk_key, nritems);
289         btrfs_set_item_offset(buf, btrfs_item_nr(nritems), itemoff);
290         btrfs_set_item_size(buf, btrfs_item_nr(nritems),
291                             sizeof(root_item));
292         write_extent_buffer(buf, &root_item,
293                             btrfs_item_ptr_offset(buf, nritems),
294                             sizeof(root_item));
295         nritems++;
296
297         itemoff = itemoff - sizeof(root_item);
298         btrfs_set_root_bytenr(&root_item, blocks[5]);
299         btrfs_set_disk_key_objectid(&disk_key, BTRFS_FS_TREE_OBJECTID);
300         btrfs_set_item_key(buf, &disk_key, nritems);
301         btrfs_set_item_offset(buf, btrfs_item_nr(nritems), itemoff);
302         btrfs_set_item_size(buf, btrfs_item_nr(nritems),
303                             sizeof(root_item));
304         write_extent_buffer(buf, &root_item,
305                             btrfs_item_ptr_offset(buf, nritems),
306                             sizeof(root_item));
307         nritems++;
308
309         itemoff = itemoff - sizeof(root_item);
310         btrfs_set_root_bytenr(&root_item, blocks[6]);
311         btrfs_set_disk_key_objectid(&disk_key, BTRFS_CSUM_TREE_OBJECTID);
312         btrfs_set_item_key(buf, &disk_key, nritems);
313         btrfs_set_item_offset(buf, btrfs_item_nr(nritems), itemoff);
314         btrfs_set_item_size(buf, btrfs_item_nr(nritems),
315                             sizeof(root_item));
316         write_extent_buffer(buf, &root_item,
317                             btrfs_item_ptr_offset(buf, nritems),
318                             sizeof(root_item));
319         nritems++;
320
321
322         csum_tree_block_size(buf, BTRFS_CRC32_SIZE, 0);
323         ret = pwrite(fd, buf->data, leafsize, blocks[1]);
324         if (ret != leafsize) {
325                 ret = (ret < 0 ? -errno : -EIO);
326                 goto out;
327         }
328
329         /* create the items for the extent tree */
330         memset(buf->data+sizeof(struct btrfs_header), 0,
331                 leafsize-sizeof(struct btrfs_header));
332         nritems = 0;
333         itemoff = __BTRFS_LEAF_DATA_SIZE(leafsize);
334         for (i = 1; i < 7; i++) {
335                 item_size = sizeof(struct btrfs_extent_item);
336                 if (!skinny_metadata)
337                         item_size += sizeof(struct btrfs_tree_block_info);
338
339                 BUG_ON(blocks[i] < first_free);
340                 BUG_ON(blocks[i] < blocks[i - 1]);
341
342                 /* create extent item */
343                 itemoff -= item_size;
344                 btrfs_set_disk_key_objectid(&disk_key, blocks[i]);
345                 if (skinny_metadata) {
346                         btrfs_set_disk_key_type(&disk_key,
347                                                 BTRFS_METADATA_ITEM_KEY);
348                         btrfs_set_disk_key_offset(&disk_key, 0);
349                 } else {
350                         btrfs_set_disk_key_type(&disk_key,
351                                                 BTRFS_EXTENT_ITEM_KEY);
352                         btrfs_set_disk_key_offset(&disk_key, leafsize);
353                 }
354                 btrfs_set_item_key(buf, &disk_key, nritems);
355                 btrfs_set_item_offset(buf, btrfs_item_nr(nritems),
356                                       itemoff);
357                 btrfs_set_item_size(buf, btrfs_item_nr(nritems),
358                                     item_size);
359                 extent_item = btrfs_item_ptr(buf, nritems,
360                                              struct btrfs_extent_item);
361                 btrfs_set_extent_refs(buf, extent_item, 1);
362                 btrfs_set_extent_generation(buf, extent_item, 1);
363                 btrfs_set_extent_flags(buf, extent_item,
364                                        BTRFS_EXTENT_FLAG_TREE_BLOCK);
365                 nritems++;
366
367                 /* create extent ref */
368                 ref_root = reference_root_table[i];
369                 btrfs_set_disk_key_objectid(&disk_key, blocks[i]);
370                 btrfs_set_disk_key_offset(&disk_key, ref_root);
371                 btrfs_set_disk_key_type(&disk_key, BTRFS_TREE_BLOCK_REF_KEY);
372                 btrfs_set_item_key(buf, &disk_key, nritems);
373                 btrfs_set_item_offset(buf, btrfs_item_nr(nritems),
374                                       itemoff);
375                 btrfs_set_item_size(buf, btrfs_item_nr(nritems), 0);
376                 nritems++;
377         }
378         btrfs_set_header_bytenr(buf, blocks[2]);
379         btrfs_set_header_owner(buf, BTRFS_EXTENT_TREE_OBJECTID);
380         btrfs_set_header_nritems(buf, nritems);
381         csum_tree_block_size(buf, BTRFS_CRC32_SIZE, 0);
382         ret = pwrite(fd, buf->data, leafsize, blocks[2]);
383         if (ret != leafsize) {
384                 ret = (ret < 0 ? -errno : -EIO);
385                 goto out;
386         }
387
388         /* create the chunk tree */
389         memset(buf->data+sizeof(struct btrfs_header), 0,
390                 leafsize-sizeof(struct btrfs_header));
391         nritems = 0;
392         item_size = sizeof(*dev_item);
393         itemoff = __BTRFS_LEAF_DATA_SIZE(leafsize) - item_size;
394
395         /* first device 1 (there is no device 0) */
396         btrfs_set_disk_key_objectid(&disk_key, BTRFS_DEV_ITEMS_OBJECTID);
397         btrfs_set_disk_key_offset(&disk_key, 1);
398         btrfs_set_disk_key_type(&disk_key, BTRFS_DEV_ITEM_KEY);
399         btrfs_set_item_key(buf, &disk_key, nritems);
400         btrfs_set_item_offset(buf, btrfs_item_nr(nritems), itemoff);
401         btrfs_set_item_size(buf, btrfs_item_nr(nritems), item_size);
402
403         dev_item = btrfs_item_ptr(buf, nritems, struct btrfs_dev_item);
404         btrfs_set_device_id(buf, dev_item, 1);
405         btrfs_set_device_generation(buf, dev_item, 0);
406         btrfs_set_device_total_bytes(buf, dev_item, num_bytes);
407         btrfs_set_device_bytes_used(buf, dev_item,
408                                     BTRFS_MKFS_SYSTEM_GROUP_SIZE);
409         btrfs_set_device_io_align(buf, dev_item, sectorsize);
410         btrfs_set_device_io_width(buf, dev_item, sectorsize);
411         btrfs_set_device_sector_size(buf, dev_item, sectorsize);
412         btrfs_set_device_type(buf, dev_item, 0);
413
414         write_extent_buffer(buf, super.dev_item.uuid,
415                             (unsigned long)btrfs_device_uuid(dev_item),
416                             BTRFS_UUID_SIZE);
417         write_extent_buffer(buf, super.fsid,
418                             (unsigned long)btrfs_device_fsid(dev_item),
419                             BTRFS_UUID_SIZE);
420         read_extent_buffer(buf, &super.dev_item, (unsigned long)dev_item,
421                            sizeof(*dev_item));
422
423         nritems++;
424         item_size = btrfs_chunk_item_size(1);
425         itemoff = itemoff - item_size;
426
427         /* then we have chunk 0 */
428         btrfs_set_disk_key_objectid(&disk_key, BTRFS_FIRST_CHUNK_TREE_OBJECTID);
429         btrfs_set_disk_key_offset(&disk_key, 0);
430         btrfs_set_disk_key_type(&disk_key, BTRFS_CHUNK_ITEM_KEY);
431         btrfs_set_item_key(buf, &disk_key, nritems);
432         btrfs_set_item_offset(buf, btrfs_item_nr(nritems), itemoff);
433         btrfs_set_item_size(buf, btrfs_item_nr(nritems), item_size);
434
435         chunk = btrfs_item_ptr(buf, nritems, struct btrfs_chunk);
436         btrfs_set_chunk_length(buf, chunk, BTRFS_MKFS_SYSTEM_GROUP_SIZE);
437         btrfs_set_chunk_owner(buf, chunk, BTRFS_EXTENT_TREE_OBJECTID);
438         btrfs_set_chunk_stripe_len(buf, chunk, 64 * 1024);
439         btrfs_set_chunk_type(buf, chunk, BTRFS_BLOCK_GROUP_SYSTEM);
440         btrfs_set_chunk_io_align(buf, chunk, sectorsize);
441         btrfs_set_chunk_io_width(buf, chunk, sectorsize);
442         btrfs_set_chunk_sector_size(buf, chunk, sectorsize);
443         btrfs_set_chunk_num_stripes(buf, chunk, 1);
444         btrfs_set_stripe_devid_nr(buf, chunk, 0, 1);
445         btrfs_set_stripe_offset_nr(buf, chunk, 0, 0);
446         nritems++;
447
448         write_extent_buffer(buf, super.dev_item.uuid,
449                             (unsigned long)btrfs_stripe_dev_uuid(&chunk->stripe),
450                             BTRFS_UUID_SIZE);
451
452         /* copy the key for the chunk to the system array */
453         ptr = super.sys_chunk_array;
454         array_size = sizeof(disk_key);
455
456         memcpy(ptr, &disk_key, sizeof(disk_key));
457         ptr += sizeof(disk_key);
458
459         /* copy the chunk to the system array */
460         read_extent_buffer(buf, ptr, (unsigned long)chunk, item_size);
461         array_size += item_size;
462         ptr += item_size;
463         btrfs_set_super_sys_array_size(&super, array_size);
464
465         btrfs_set_header_bytenr(buf, blocks[3]);
466         btrfs_set_header_owner(buf, BTRFS_CHUNK_TREE_OBJECTID);
467         btrfs_set_header_nritems(buf, nritems);
468         csum_tree_block_size(buf, BTRFS_CRC32_SIZE, 0);
469         ret = pwrite(fd, buf->data, leafsize, blocks[3]);
470         if (ret != leafsize) {
471                 ret = (ret < 0 ? -errno : -EIO);
472                 goto out;
473         }
474
475         /* create the device tree */
476         memset(buf->data+sizeof(struct btrfs_header), 0,
477                 leafsize-sizeof(struct btrfs_header));
478         nritems = 0;
479         itemoff = __BTRFS_LEAF_DATA_SIZE(leafsize) -
480                 sizeof(struct btrfs_dev_extent);
481
482         btrfs_set_disk_key_objectid(&disk_key, 1);
483         btrfs_set_disk_key_offset(&disk_key, 0);
484         btrfs_set_disk_key_type(&disk_key, BTRFS_DEV_EXTENT_KEY);
485         btrfs_set_item_key(buf, &disk_key, nritems);
486         btrfs_set_item_offset(buf, btrfs_item_nr(nritems), itemoff);
487         btrfs_set_item_size(buf, btrfs_item_nr(nritems),
488                             sizeof(struct btrfs_dev_extent));
489         dev_extent = btrfs_item_ptr(buf, nritems, struct btrfs_dev_extent);
490         btrfs_set_dev_extent_chunk_tree(buf, dev_extent,
491                                         BTRFS_CHUNK_TREE_OBJECTID);
492         btrfs_set_dev_extent_chunk_objectid(buf, dev_extent,
493                                         BTRFS_FIRST_CHUNK_TREE_OBJECTID);
494         btrfs_set_dev_extent_chunk_offset(buf, dev_extent, 0);
495
496         write_extent_buffer(buf, chunk_tree_uuid,
497                     (unsigned long)btrfs_dev_extent_chunk_tree_uuid(dev_extent),
498                     BTRFS_UUID_SIZE);
499
500         btrfs_set_dev_extent_length(buf, dev_extent,
501                                     BTRFS_MKFS_SYSTEM_GROUP_SIZE);
502         nritems++;
503
504         btrfs_set_header_bytenr(buf, blocks[4]);
505         btrfs_set_header_owner(buf, BTRFS_DEV_TREE_OBJECTID);
506         btrfs_set_header_nritems(buf, nritems);
507         csum_tree_block_size(buf, BTRFS_CRC32_SIZE, 0);
508         ret = pwrite(fd, buf->data, leafsize, blocks[4]);
509         if (ret != leafsize) {
510                 ret = (ret < 0 ? -errno : -EIO);
511                 goto out;
512         }
513
514         /* create the FS root */
515         memset(buf->data+sizeof(struct btrfs_header), 0,
516                 leafsize-sizeof(struct btrfs_header));
517         btrfs_set_header_bytenr(buf, blocks[5]);
518         btrfs_set_header_owner(buf, BTRFS_FS_TREE_OBJECTID);
519         btrfs_set_header_nritems(buf, 0);
520         csum_tree_block_size(buf, BTRFS_CRC32_SIZE, 0);
521         ret = pwrite(fd, buf->data, leafsize, blocks[5]);
522         if (ret != leafsize) {
523                 ret = (ret < 0 ? -errno : -EIO);
524                 goto out;
525         }
526         /* finally create the csum root */
527         memset(buf->data+sizeof(struct btrfs_header), 0,
528                 leafsize-sizeof(struct btrfs_header));
529         btrfs_set_header_bytenr(buf, blocks[6]);
530         btrfs_set_header_owner(buf, BTRFS_CSUM_TREE_OBJECTID);
531         btrfs_set_header_nritems(buf, 0);
532         csum_tree_block_size(buf, BTRFS_CRC32_SIZE, 0);
533         ret = pwrite(fd, buf->data, leafsize, blocks[6]);
534         if (ret != leafsize) {
535                 ret = (ret < 0 ? -errno : -EIO);
536                 goto out;
537         }
538
539         /* and write out the super block */
540         BUG_ON(sizeof(super) > sectorsize);
541         memset(buf->data, 0, sectorsize);
542         memcpy(buf->data, &super, sizeof(super));
543         buf->len = sectorsize;
544         csum_tree_block_size(buf, BTRFS_CRC32_SIZE, 0);
545         ret = pwrite(fd, buf->data, sectorsize, blocks[0]);
546         if (ret != sectorsize) {
547                 ret = (ret < 0 ? -errno : -EIO);
548                 goto out;
549         }
550
551         ret = 0;
552
553 out:
554         free(buf);
555         return ret;
556 }
557
558 u64 btrfs_device_size(int fd, struct stat *st)
559 {
560         u64 size;
561         if (S_ISREG(st->st_mode)) {
562                 return st->st_size;
563         }
564         if (!S_ISBLK(st->st_mode)) {
565                 return 0;
566         }
567         if (ioctl(fd, BLKGETSIZE64, &size) >= 0) {
568                 return size;
569         }
570         return 0;
571 }
572
573 static int zero_blocks(int fd, off_t start, size_t len)
574 {
575         char *buf = malloc(len);
576         int ret = 0;
577         ssize_t written;
578
579         if (!buf)
580                 return -ENOMEM;
581         memset(buf, 0, len);
582         written = pwrite(fd, buf, len, start);
583         if (written != len)
584                 ret = -EIO;
585         free(buf);
586         return ret;
587 }
588
589 #define ZERO_DEV_BYTES (2 * 1024 * 1024)
590
591 /* don't write outside the device by clamping the region to the device size */
592 static int zero_dev_clamped(int fd, off_t start, ssize_t len, u64 dev_size)
593 {
594         off_t end = max(start, start + len);
595
596 #ifdef __sparc__
597         /* and don't overwrite the disk labels on sparc */
598         start = max(start, 1024);
599         end = max(end, 1024);
600 #endif
601
602         start = min_t(u64, start, dev_size);
603         end = min_t(u64, end, dev_size);
604
605         return zero_blocks(fd, start, end - start);
606 }
607
608 int btrfs_add_to_fsid(struct btrfs_trans_handle *trans,
609                       struct btrfs_root *root, int fd, char *path,
610                       u64 block_count, u32 io_width, u32 io_align,
611                       u32 sectorsize)
612 {
613         struct btrfs_super_block *disk_super;
614         struct btrfs_super_block *super = root->fs_info->super_copy;
615         struct btrfs_device *device;
616         struct btrfs_dev_item *dev_item;
617         char *buf;
618         u64 total_bytes;
619         u64 num_devs;
620         int ret;
621
622         device = kzalloc(sizeof(*device), GFP_NOFS);
623         if (!device)
624                 return -ENOMEM;
625         buf = kmalloc(sectorsize, GFP_NOFS);
626         if (!buf) {
627                 kfree(device);
628                 return -ENOMEM;
629         }
630         BUG_ON(sizeof(*disk_super) > sectorsize);
631         memset(buf, 0, sectorsize);
632
633         disk_super = (struct btrfs_super_block *)buf;
634         dev_item = &disk_super->dev_item;
635
636         uuid_generate(device->uuid);
637         device->devid = 0;
638         device->type = 0;
639         device->io_width = io_width;
640         device->io_align = io_align;
641         device->sector_size = sectorsize;
642         device->fd = fd;
643         device->writeable = 1;
644         device->total_bytes = block_count;
645         device->bytes_used = 0;
646         device->total_ios = 0;
647         device->dev_root = root->fs_info->dev_root;
648
649         ret = btrfs_add_device(trans, root, device);
650         BUG_ON(ret);
651
652         total_bytes = btrfs_super_total_bytes(super) + block_count;
653         btrfs_set_super_total_bytes(super, total_bytes);
654
655         num_devs = btrfs_super_num_devices(super) + 1;
656         btrfs_set_super_num_devices(super, num_devs);
657
658         memcpy(disk_super, super, sizeof(*disk_super));
659
660         printf("adding device %s id %llu\n", path,
661                (unsigned long long)device->devid);
662
663         btrfs_set_super_bytenr(disk_super, BTRFS_SUPER_INFO_OFFSET);
664         btrfs_set_stack_device_id(dev_item, device->devid);
665         btrfs_set_stack_device_type(dev_item, device->type);
666         btrfs_set_stack_device_io_align(dev_item, device->io_align);
667         btrfs_set_stack_device_io_width(dev_item, device->io_width);
668         btrfs_set_stack_device_sector_size(dev_item, device->sector_size);
669         btrfs_set_stack_device_total_bytes(dev_item, device->total_bytes);
670         btrfs_set_stack_device_bytes_used(dev_item, device->bytes_used);
671         memcpy(&dev_item->uuid, device->uuid, BTRFS_UUID_SIZE);
672
673         ret = pwrite(fd, buf, sectorsize, BTRFS_SUPER_INFO_OFFSET);
674         BUG_ON(ret != sectorsize);
675
676         kfree(buf);
677         list_add(&device->dev_list, &root->fs_info->fs_devices->devices);
678         device->fs_devices = root->fs_info->fs_devices;
679         return 0;
680 }
681
682 static void btrfs_wipe_existing_sb(int fd)
683 {
684         const char *off = NULL;
685         size_t len = 0;
686         loff_t offset;
687         char buf[BUFSIZ];
688         int rc = 0;
689         blkid_probe pr = NULL;
690
691         pr = blkid_new_probe();
692         if (!pr)
693                 return;
694
695         if (blkid_probe_set_device(pr, fd, 0, 0))
696                 goto out;
697
698         rc = blkid_probe_lookup_value(pr, "SBMAGIC_OFFSET", &off, NULL);
699         if (!rc)
700                 rc = blkid_probe_lookup_value(pr, "SBMAGIC", NULL, &len);
701
702         if (rc || len == 0 || off == NULL)
703                 goto out;
704
705         offset = strtoll(off, NULL, 10);
706         if (len > sizeof(buf))
707                 len = sizeof(buf);
708
709         memset(buf, 0, len);
710         rc = pwrite(fd, buf, len, offset);
711         fsync(fd);
712
713 out:
714         blkid_free_probe(pr);
715         return;
716 }
717
718 int btrfs_prepare_device(int fd, char *file, int zero_end, u64 *block_count_ret,
719                            u64 max_block_count, int *mixed, int discard)
720 {
721         u64 block_count;
722         struct stat st;
723         int i, ret;
724
725         ret = fstat(fd, &st);
726         if (ret < 0) {
727                 fprintf(stderr, "unable to stat %s\n", file);
728                 return 1;
729         }
730
731         block_count = btrfs_device_size(fd, &st);
732         if (block_count == 0) {
733                 fprintf(stderr, "unable to find %s size\n", file);
734                 return 1;
735         }
736         if (max_block_count)
737                 block_count = min(block_count, max_block_count);
738
739         if (block_count < BTRFS_MKFS_SMALL_VOLUME_SIZE && !(*mixed))
740                 *mixed = 1;
741
742         if (discard) {
743                 /*
744                  * We intentionally ignore errors from the discard ioctl.  It
745                  * is not necessary for the mkfs functionality but just an
746                  * optimization.
747                  */
748                 if (discard_range(fd, 0, 0) == 0) {
749                         printf("Performing full device TRIM (%s) ...\n",
750                                 pretty_size(block_count));
751                         discard_blocks(fd, 0, block_count);
752                 }
753         }
754
755         ret = zero_dev_clamped(fd, 0, ZERO_DEV_BYTES, block_count);
756         for (i = 0 ; !ret && i < BTRFS_SUPER_MIRROR_MAX; i++)
757                 ret = zero_dev_clamped(fd, btrfs_sb_offset(i),
758                                        BTRFS_SUPER_INFO_SIZE, block_count);
759         if (!ret && zero_end)
760                 ret = zero_dev_clamped(fd, block_count - ZERO_DEV_BYTES,
761                                        ZERO_DEV_BYTES, block_count);
762
763         if (ret < 0) {
764                 fprintf(stderr, "ERROR: failed to zero device '%s' - %s\n",
765                         file, strerror(-ret));
766                 return 1;
767         }
768
769         btrfs_wipe_existing_sb(fd);
770
771         *block_count_ret = block_count;
772         return 0;
773 }
774
775 int btrfs_make_root_dir(struct btrfs_trans_handle *trans,
776                         struct btrfs_root *root, u64 objectid)
777 {
778         int ret;
779         struct btrfs_inode_item inode_item;
780         time_t now = time(NULL);
781
782         memset(&inode_item, 0, sizeof(inode_item));
783         btrfs_set_stack_inode_generation(&inode_item, trans->transid);
784         btrfs_set_stack_inode_size(&inode_item, 0);
785         btrfs_set_stack_inode_nlink(&inode_item, 1);
786         btrfs_set_stack_inode_nbytes(&inode_item, root->leafsize);
787         btrfs_set_stack_inode_mode(&inode_item, S_IFDIR | 0755);
788         btrfs_set_stack_timespec_sec(&inode_item.atime, now);
789         btrfs_set_stack_timespec_nsec(&inode_item.atime, 0);
790         btrfs_set_stack_timespec_sec(&inode_item.ctime, now);
791         btrfs_set_stack_timespec_nsec(&inode_item.ctime, 0);
792         btrfs_set_stack_timespec_sec(&inode_item.mtime, now);
793         btrfs_set_stack_timespec_nsec(&inode_item.mtime, 0);
794         btrfs_set_stack_timespec_sec(&inode_item.otime, 0);
795         btrfs_set_stack_timespec_nsec(&inode_item.otime, 0);
796
797         if (root->fs_info->tree_root == root)
798                 btrfs_set_super_root_dir(root->fs_info->super_copy, objectid);
799
800         ret = btrfs_insert_inode(trans, root, objectid, &inode_item);
801         if (ret)
802                 goto error;
803
804         ret = btrfs_insert_inode_ref(trans, root, "..", 2, objectid, objectid, 0);
805         if (ret)
806                 goto error;
807
808         btrfs_set_root_dirid(&root->root_item, objectid);
809         ret = 0;
810 error:
811         return ret;
812 }
813
814 /*
815  * checks if a path is a block device node
816  * Returns negative errno on failure, otherwise
817  * returns 1 for blockdev, 0 for not-blockdev
818  */
819 int is_block_device(const char *path)
820 {
821         struct stat statbuf;
822
823         if (stat(path, &statbuf) < 0)
824                 return -errno;
825
826         return S_ISBLK(statbuf.st_mode);
827 }
828
829 /*
830  * check if given path is a mount point
831  * return 1 if yes. 0 if no. -1 for error
832  */
833 int is_mount_point(const char *path)
834 {
835         FILE *f;
836         struct mntent *mnt;
837         int ret = 0;
838
839         f = setmntent("/proc/self/mounts", "r");
840         if (f == NULL)
841                 return -1;
842
843         while ((mnt = getmntent(f)) != NULL) {
844                 if (strcmp(mnt->mnt_dir, path))
845                         continue;
846                 ret = 1;
847                 break;
848         }
849         endmntent(f);
850         return ret;
851 }
852
853 static int is_reg_file(const char *path)
854 {
855         struct stat statbuf;
856
857         if (stat(path, &statbuf) < 0)
858                 return -errno;
859         return S_ISREG(statbuf.st_mode);
860 }
861
862 /*
863  * This function checks if the given input parameter is
864  * an uuid or a path
865  * return <0 : some error in the given input
866  * return BTRFS_ARG_UNKNOWN:    unknown input
867  * return BTRFS_ARG_UUID:       given input is uuid
868  * return BTRFS_ARG_MNTPOINT:   given input is path
869  * return BTRFS_ARG_REG:        given input is regular file
870  */
871 int check_arg_type(const char *input)
872 {
873         uuid_t uuid;
874         char path[PATH_MAX];
875
876         if (!input)
877                 return -EINVAL;
878
879         if (realpath(input, path)) {
880                 if (is_block_device(path) == 1)
881                         return BTRFS_ARG_BLKDEV;
882
883                 if (is_mount_point(path) == 1)
884                         return BTRFS_ARG_MNTPOINT;
885
886                 if (is_reg_file(path))
887                         return BTRFS_ARG_REG;
888
889                 return BTRFS_ARG_UNKNOWN;
890         }
891
892         if (strlen(input) == (BTRFS_UUID_UNPARSED_SIZE - 1) &&
893                 !uuid_parse(input, uuid))
894                 return BTRFS_ARG_UUID;
895
896         return BTRFS_ARG_UNKNOWN;
897 }
898
899 /*
900  * Find the mount point for a mounted device.
901  * On success, returns 0 with mountpoint in *mp.
902  * On failure, returns -errno (not mounted yields -EINVAL)
903  * Is noisy on failures, expects to be given a mounted device.
904  */
905 int get_btrfs_mount(const char *dev, char *mp, size_t mp_size)
906 {
907         int ret;
908         int fd = -1;
909
910         ret = is_block_device(dev);
911         if (ret <= 0) {
912                 if (!ret) {
913                         fprintf(stderr, "%s is not a block device\n", dev);
914                         ret = -EINVAL;
915                 } else {
916                         fprintf(stderr, "Could not check %s: %s\n",
917                                 dev, strerror(-ret));
918                 }
919                 goto out;
920         }
921
922         fd = open(dev, O_RDONLY);
923         if (fd < 0) {
924                 ret = -errno;
925                 fprintf(stderr, "Could not open %s: %s\n", dev, strerror(errno));
926                 goto out;
927         }
928
929         ret = check_mounted_where(fd, dev, mp, mp_size, NULL);
930         if (!ret) {
931                 ret = -EINVAL;
932         } else { /* mounted, all good */
933                 ret = 0;
934         }
935 out:
936         if (fd != -1)
937                 close(fd);
938         return ret;
939 }
940
941 /*
942  * Given a pathname, return a filehandle to:
943  *      the original pathname or,
944  *      if the pathname is a mounted btrfs device, to its mountpoint.
945  *
946  * On error, return -1, errno should be set.
947  */
948 int open_path_or_dev_mnt(const char *path, DIR **dirstream)
949 {
950         char mp[BTRFS_PATH_NAME_MAX + 1];
951         int fdmnt;
952
953         if (is_block_device(path)) {
954                 int ret;
955
956                 ret = get_btrfs_mount(path, mp, sizeof(mp));
957                 if (ret < 0) {
958                         /* not a mounted btrfs dev */
959                         errno = EINVAL;
960                         return -1;
961                 }
962                 fdmnt = open_file_or_dir(mp, dirstream);
963         } else {
964                 fdmnt = open_file_or_dir(path, dirstream);
965         }
966
967         return fdmnt;
968 }
969
970 /* checks if a device is a loop device */
971 static int is_loop_device (const char* device) {
972         struct stat statbuf;
973
974         if(stat(device, &statbuf) < 0)
975                 return -errno;
976
977         return (S_ISBLK(statbuf.st_mode) &&
978                 MAJOR(statbuf.st_rdev) == LOOP_MAJOR);
979 }
980
981
982 /* Takes a loop device path (e.g. /dev/loop0) and returns
983  * the associated file (e.g. /images/my_btrfs.img) */
984 static int resolve_loop_device(const char* loop_dev, char* loop_file,
985                 int max_len)
986 {
987         int ret;
988         FILE *f;
989         char fmt[20];
990         char p[PATH_MAX];
991         char real_loop_dev[PATH_MAX];
992
993         if (!realpath(loop_dev, real_loop_dev))
994                 return -errno;
995         snprintf(p, PATH_MAX, "/sys/block/%s/loop/backing_file", strrchr(real_loop_dev, '/'));
996         if (!(f = fopen(p, "r")))
997                 return -errno;
998
999         snprintf(fmt, 20, "%%%i[^\n]", max_len-1);
1000         ret = fscanf(f, fmt, loop_file);
1001         fclose(f);
1002         if (ret == EOF)
1003                 return -errno;
1004
1005         return 0;
1006 }
1007
1008 /*
1009  * Checks whether a and b are identical or device
1010  * files associated with the same block device
1011  */
1012 static int is_same_blk_file(const char* a, const char* b)
1013 {
1014         struct stat st_buf_a, st_buf_b;
1015         char real_a[PATH_MAX];
1016         char real_b[PATH_MAX];
1017
1018         if (!realpath(a, real_a))
1019                 strncpy_null(real_a, a);
1020
1021         if (!realpath(b, real_b))
1022                 strncpy_null(real_b, b);
1023
1024         /* Identical path? */
1025         if (strcmp(real_a, real_b) == 0)
1026                 return 1;
1027
1028         if (stat(a, &st_buf_a) < 0 || stat(b, &st_buf_b) < 0) {
1029                 if (errno == ENOENT)
1030                         return 0;
1031                 return -errno;
1032         }
1033
1034         /* Same blockdevice? */
1035         if (S_ISBLK(st_buf_a.st_mode) && S_ISBLK(st_buf_b.st_mode) &&
1036             st_buf_a.st_rdev == st_buf_b.st_rdev) {
1037                 return 1;
1038         }
1039
1040         /* Hardlink? */
1041         if (st_buf_a.st_dev == st_buf_b.st_dev &&
1042             st_buf_a.st_ino == st_buf_b.st_ino) {
1043                 return 1;
1044         }
1045
1046         return 0;
1047 }
1048
1049 /* checks if a and b are identical or device
1050  * files associated with the same block device or
1051  * if one file is a loop device that uses the other
1052  * file.
1053  */
1054 static int is_same_loop_file(const char* a, const char* b)
1055 {
1056         char res_a[PATH_MAX];
1057         char res_b[PATH_MAX];
1058         const char* final_a = NULL;
1059         const char* final_b = NULL;
1060         int ret;
1061
1062         /* Resolve a if it is a loop device */
1063         if((ret = is_loop_device(a)) < 0) {
1064                 if (ret == -ENOENT)
1065                         return 0;
1066                 return ret;
1067         } else if (ret) {
1068                 ret = resolve_loop_device(a, res_a, sizeof(res_a));
1069                 if (ret < 0) {
1070                         if (errno != EPERM)
1071                                 return ret;
1072                 } else {
1073                         final_a = res_a;
1074                 }
1075         } else {
1076                 final_a = a;
1077         }
1078
1079         /* Resolve b if it is a loop device */
1080         if ((ret = is_loop_device(b)) < 0) {
1081                 if (ret == -ENOENT)
1082                         return 0;
1083                 return ret;
1084         } else if (ret) {
1085                 ret = resolve_loop_device(b, res_b, sizeof(res_b));
1086                 if (ret < 0) {
1087                         if (errno != EPERM)
1088                                 return ret;
1089                 } else {
1090                         final_b = res_b;
1091                 }
1092         } else {
1093                 final_b = b;
1094         }
1095
1096         return is_same_blk_file(final_a, final_b);
1097 }
1098
1099 /* Checks if a file exists and is a block or regular file*/
1100 static int is_existing_blk_or_reg_file(const char* filename)
1101 {
1102         struct stat st_buf;
1103
1104         if(stat(filename, &st_buf) < 0) {
1105                 if(errno == ENOENT)
1106                         return 0;
1107                 else
1108                         return -errno;
1109         }
1110
1111         return (S_ISBLK(st_buf.st_mode) || S_ISREG(st_buf.st_mode));
1112 }
1113
1114 /* Checks if a file is used (directly or indirectly via a loop device)
1115  * by a device in fs_devices
1116  */
1117 static int blk_file_in_dev_list(struct btrfs_fs_devices* fs_devices,
1118                 const char* file)
1119 {
1120         int ret;
1121         struct list_head *head;
1122         struct list_head *cur;
1123         struct btrfs_device *device;
1124
1125         head = &fs_devices->devices;
1126         list_for_each(cur, head) {
1127                 device = list_entry(cur, struct btrfs_device, dev_list);
1128
1129                 if((ret = is_same_loop_file(device->name, file)))
1130                         return ret;
1131         }
1132
1133         return 0;
1134 }
1135
1136 /*
1137  * Resolve a pathname to a device mapper node to /dev/mapper/<name>
1138  * Returns NULL on invalid input or malloc failure; Other failures
1139  * will be handled by the caller using the input pathame.
1140  */
1141 char *canonicalize_dm_name(const char *ptname)
1142 {
1143         FILE    *f;
1144         size_t  sz;
1145         char    path[PATH_MAX], name[PATH_MAX], *res = NULL;
1146
1147         if (!ptname || !*ptname)
1148                 return NULL;
1149
1150         snprintf(path, sizeof(path), "/sys/block/%s/dm/name", ptname);
1151         if (!(f = fopen(path, "r")))
1152                 return NULL;
1153
1154         /* read <name>\n from sysfs */
1155         if (fgets(name, sizeof(name), f) && (sz = strlen(name)) > 1) {
1156                 name[sz - 1] = '\0';
1157                 snprintf(path, sizeof(path), "/dev/mapper/%s", name);
1158
1159                 if (access(path, F_OK) == 0)
1160                         res = strdup(path);
1161         }
1162         fclose(f);
1163         return res;
1164 }
1165
1166 /*
1167  * Resolve a pathname to a canonical device node, e.g. /dev/sda1 or
1168  * to a device mapper pathname.
1169  * Returns NULL on invalid input or malloc failure; Other failures
1170  * will be handled by the caller using the input pathame.
1171  */
1172 char *canonicalize_path(const char *path)
1173 {
1174         char *canonical, *p;
1175
1176         if (!path || !*path)
1177                 return NULL;
1178
1179         canonical = realpath(path, NULL);
1180         if (!canonical)
1181                 return strdup(path);
1182         p = strrchr(canonical, '/');
1183         if (p && strncmp(p, "/dm-", 4) == 0 && isdigit(*(p + 4))) {
1184                 char *dm = canonicalize_dm_name(p + 1);
1185
1186                 if (dm) {
1187                         free(canonical);
1188                         return dm;
1189                 }
1190         }
1191         return canonical;
1192 }
1193
1194 /*
1195  * returns 1 if the device was mounted, < 0 on error or 0 if everything
1196  * is safe to continue.
1197  */
1198 int check_mounted(const char* file)
1199 {
1200         int fd;
1201         int ret;
1202
1203         fd = open(file, O_RDONLY);
1204         if (fd < 0) {
1205                 fprintf (stderr, "check_mounted(): Could not open %s\n", file);
1206                 return -errno;
1207         }
1208
1209         ret =  check_mounted_where(fd, file, NULL, 0, NULL);
1210         close(fd);
1211
1212         return ret;
1213 }
1214
1215 int check_mounted_where(int fd, const char *file, char *where, int size,
1216                         struct btrfs_fs_devices **fs_dev_ret)
1217 {
1218         int ret;
1219         u64 total_devs = 1;
1220         int is_btrfs;
1221         struct btrfs_fs_devices *fs_devices_mnt = NULL;
1222         FILE *f;
1223         struct mntent *mnt;
1224
1225         /* scan the initial device */
1226         ret = btrfs_scan_one_device(fd, file, &fs_devices_mnt,
1227                                     &total_devs, BTRFS_SUPER_INFO_OFFSET, 0);
1228         is_btrfs = (ret >= 0);
1229
1230         /* scan other devices */
1231         if (is_btrfs && total_devs > 1) {
1232                 ret = btrfs_scan_lblkid();
1233                 if (ret)
1234                         return ret;
1235         }
1236
1237         /* iterate over the list of currently mountes filesystems */
1238         if ((f = setmntent ("/proc/self/mounts", "r")) == NULL)
1239                 return -errno;
1240
1241         while ((mnt = getmntent (f)) != NULL) {
1242                 if(is_btrfs) {
1243                         if(strcmp(mnt->mnt_type, "btrfs") != 0)
1244                                 continue;
1245
1246                         ret = blk_file_in_dev_list(fs_devices_mnt, mnt->mnt_fsname);
1247                 } else {
1248                         /* ignore entries in the mount table that are not
1249                            associated with a file*/
1250                         if((ret = is_existing_blk_or_reg_file(mnt->mnt_fsname)) < 0)
1251                                 goto out_mntloop_err;
1252                         else if(!ret)
1253                                 continue;
1254
1255                         ret = is_same_loop_file(file, mnt->mnt_fsname);
1256                 }
1257
1258                 if(ret < 0)
1259                         goto out_mntloop_err;
1260                 else if(ret)
1261                         break;
1262         }
1263
1264         /* Did we find an entry in mnt table? */
1265         if (mnt && size && where) {
1266                 strncpy(where, mnt->mnt_dir, size);
1267                 where[size-1] = 0;
1268         }
1269         if (fs_dev_ret)
1270                 *fs_dev_ret = fs_devices_mnt;
1271
1272         ret = (mnt != NULL);
1273
1274 out_mntloop_err:
1275         endmntent (f);
1276
1277         return ret;
1278 }
1279
1280 struct pending_dir {
1281         struct list_head list;
1282         char name[PATH_MAX];
1283 };
1284
1285 int btrfs_register_one_device(const char *fname)
1286 {
1287         struct btrfs_ioctl_vol_args args;
1288         int fd;
1289         int ret;
1290         int e;
1291
1292         fd = open("/dev/btrfs-control", O_RDWR);
1293         if (fd < 0) {
1294                 fprintf(stderr, "failed to open /dev/btrfs-control "
1295                         "skipping device registration: %s\n",
1296                         strerror(errno));
1297                 return -errno;
1298         }
1299         strncpy(args.name, fname, BTRFS_PATH_NAME_MAX);
1300         args.name[BTRFS_PATH_NAME_MAX-1] = 0;
1301         ret = ioctl(fd, BTRFS_IOC_SCAN_DEV, &args);
1302         e = errno;
1303         if (ret < 0) {
1304                 fprintf(stderr, "ERROR: device scan failed '%s' - %s\n",
1305                         fname, strerror(e));
1306                 ret = -e;
1307         }
1308         close(fd);
1309         return ret;
1310 }
1311
1312 /*
1313  * Register all devices in the fs_uuid list created in the user
1314  * space. Ensure btrfs_scan_lblkid() is called before this func.
1315  */
1316 int btrfs_register_all_devices(void)
1317 {
1318         int err;
1319         struct btrfs_fs_devices *fs_devices;
1320         struct btrfs_device *device;
1321         struct list_head *all_uuids;
1322
1323         all_uuids = btrfs_scanned_uuids();
1324
1325         list_for_each_entry(fs_devices, all_uuids, list) {
1326                 list_for_each_entry(device, &fs_devices->devices, dev_list) {
1327                         if (strlen(device->name) != 0) {
1328                                 err = btrfs_register_one_device(device->name);
1329                                 if (err < 0)
1330                                         return err;
1331                                 if (err > 0)
1332                                         return -err;
1333                         }
1334                 }
1335         }
1336         return 0;
1337 }
1338
1339 int btrfs_device_already_in_root(struct btrfs_root *root, int fd,
1340                                  int super_offset)
1341 {
1342         struct btrfs_super_block *disk_super;
1343         char *buf;
1344         int ret = 0;
1345
1346         buf = malloc(BTRFS_SUPER_INFO_SIZE);
1347         if (!buf) {
1348                 ret = -ENOMEM;
1349                 goto out;
1350         }
1351         ret = pread(fd, buf, BTRFS_SUPER_INFO_SIZE, super_offset);
1352         if (ret != BTRFS_SUPER_INFO_SIZE)
1353                 goto brelse;
1354
1355         ret = 0;
1356         disk_super = (struct btrfs_super_block *)buf;
1357         if (btrfs_super_magic(disk_super) != BTRFS_MAGIC)
1358                 goto brelse;
1359
1360         if (!memcmp(disk_super->fsid, root->fs_info->super_copy->fsid,
1361                     BTRFS_FSID_SIZE))
1362                 ret = 1;
1363 brelse:
1364         free(buf);
1365 out:
1366         return ret;
1367 }
1368
1369 static const char* unit_suffix_binary[] =
1370         { "B", "KiB", "MiB", "GiB", "TiB", "PiB", "EiB"};
1371 static const char* unit_suffix_decimal[] =
1372         { "B", "kB", "MB", "GB", "TB", "PB", "EB"};
1373
1374 int pretty_size_snprintf(u64 size, char *str, size_t str_size, unsigned unit_mode)
1375 {
1376         int num_divs;
1377         float fraction;
1378         u64 base = 0;
1379         int mult = 0;
1380         const char** suffix = NULL;
1381         u64 last_size;
1382
1383         if (str_size == 0)
1384                 return 0;
1385
1386         if ((unit_mode & ~UNITS_MODE_MASK) == UNITS_RAW) {
1387                 snprintf(str, str_size, "%llu", size);
1388                 return 0;
1389         }
1390
1391         if ((unit_mode & ~UNITS_MODE_MASK) == UNITS_BINARY) {
1392                 base = 1024;
1393                 mult = 1024;
1394                 suffix = unit_suffix_binary;
1395         } else if ((unit_mode & ~UNITS_MODE_MASK) == UNITS_DECIMAL) {
1396                 base = 1000;
1397                 mult = 1000;
1398                 suffix = unit_suffix_decimal;
1399         }
1400
1401         /* Unknown mode */
1402         if (!base) {
1403                 fprintf(stderr, "INTERNAL ERROR: unknown unit base, mode %d\n",
1404                                 unit_mode);
1405                 assert(0);
1406                 return -1;
1407         }
1408
1409         num_divs = 0;
1410         last_size = size;
1411         switch (unit_mode & UNITS_MODE_MASK) {
1412         case UNITS_TBYTES: base *= mult; num_divs++;
1413         case UNITS_GBYTES: base *= mult; num_divs++;
1414         case UNITS_MBYTES: base *= mult; num_divs++;
1415         case UNITS_KBYTES: num_divs++;
1416                            break;
1417         case UNITS_BYTES:
1418                            base = 1;
1419                            num_divs = 0;
1420                            break;
1421         default:
1422                 while (size >= mult) {
1423                         last_size = size;
1424                         size /= mult;
1425                         num_divs++;
1426                 }
1427         }
1428
1429         if (num_divs >= ARRAY_SIZE(unit_suffix_binary)) {
1430                 str[0] = '\0';
1431                 printf("INTERNAL ERROR: unsupported unit suffix, index %d\n",
1432                                 num_divs);
1433                 assert(0);
1434                 return -1;
1435         }
1436         fraction = (float)last_size / base;
1437
1438         return snprintf(str, str_size, "%.2f%s", fraction, suffix[num_divs]);
1439 }
1440
1441 /*
1442  * __strncpy__null - strncpy with null termination
1443  * @dest:       the target array
1444  * @src:        the source string
1445  * @n:          maximum bytes to copy (size of *dest)
1446  *
1447  * Like strncpy, but ensures destination is null-terminated.
1448  *
1449  * Copies the string pointed to by src, including the terminating null
1450  * byte ('\0'), to the buffer pointed to by dest, up to a maximum
1451  * of n bytes.  Then ensure that dest is null-terminated.
1452  */
1453 char *__strncpy__null(char *dest, const char *src, size_t n)
1454 {
1455         strncpy(dest, src, n);
1456         if (n > 0)
1457                 dest[n - 1] = '\0';
1458         return dest;
1459 }
1460
1461 /*
1462  * Checks to make sure that the label matches our requirements.
1463  * Returns:
1464        0    if everything is safe and usable
1465       -1    if the label is too long
1466  */
1467 static int check_label(const char *input)
1468 {
1469        int len = strlen(input);
1470
1471        if (len > BTRFS_LABEL_SIZE - 1) {
1472                 fprintf(stderr, "ERROR: Label %s is too long (max %d)\n",
1473                         input, BTRFS_LABEL_SIZE - 1);
1474                return -1;
1475        }
1476
1477        return 0;
1478 }
1479
1480 static int set_label_unmounted(const char *dev, const char *label)
1481 {
1482         struct btrfs_trans_handle *trans;
1483         struct btrfs_root *root;
1484         int ret;
1485
1486         ret = check_mounted(dev);
1487         if (ret < 0) {
1488                fprintf(stderr, "FATAL: error checking %s mount status\n", dev);
1489                return -1;
1490         }
1491         if (ret > 0) {
1492                 fprintf(stderr, "ERROR: dev %s is mounted, use mount point\n",
1493                         dev);
1494                 return -1;
1495         }
1496
1497         /* Open the super_block at the default location
1498          * and as read-write.
1499          */
1500         root = open_ctree(dev, 0, OPEN_CTREE_WRITES);
1501         if (!root) /* errors are printed by open_ctree() */
1502                 return -1;
1503
1504         trans = btrfs_start_transaction(root, 1);
1505         snprintf(root->fs_info->super_copy->label, BTRFS_LABEL_SIZE, "%s",
1506                  label);
1507         btrfs_commit_transaction(trans, root);
1508
1509         /* Now we close it since we are done. */
1510         close_ctree(root);
1511         return 0;
1512 }
1513
1514 static int set_label_mounted(const char *mount_path, const char *label)
1515 {
1516         int fd;
1517
1518         fd = open(mount_path, O_RDONLY | O_NOATIME);
1519         if (fd < 0) {
1520                 fprintf(stderr, "ERROR: unable to access '%s'\n", mount_path);
1521                 return -1;
1522         }
1523
1524         if (ioctl(fd, BTRFS_IOC_SET_FSLABEL, label) < 0) {
1525                 fprintf(stderr, "ERROR: unable to set label %s\n",
1526                         strerror(errno));
1527                 close(fd);
1528                 return -1;
1529         }
1530
1531         close(fd);
1532         return 0;
1533 }
1534
1535 static int get_label_unmounted(const char *dev, char *label)
1536 {
1537         struct btrfs_root *root;
1538         int ret;
1539
1540         ret = check_mounted(dev);
1541         if (ret < 0) {
1542                fprintf(stderr, "FATAL: error checking %s mount status\n", dev);
1543                return -1;
1544         }
1545         if (ret > 0) {
1546                 fprintf(stderr, "ERROR: dev %s is mounted, use mount point\n",
1547                         dev);
1548                 return -1;
1549         }
1550
1551         /* Open the super_block at the default location
1552          * and as read-only.
1553          */
1554         root = open_ctree(dev, 0, 0);
1555         if(!root)
1556                 return -1;
1557
1558         memcpy(label, root->fs_info->super_copy->label, BTRFS_LABEL_SIZE);
1559
1560         /* Now we close it since we are done. */
1561         close_ctree(root);
1562         return 0;
1563 }
1564
1565 /*
1566  * If a partition is mounted, try to get the filesystem label via its
1567  * mounted path rather than device.  Return the corresponding error
1568  * the user specified the device path.
1569  */
1570 int get_label_mounted(const char *mount_path, char *labelp)
1571 {
1572         char label[BTRFS_LABEL_SIZE];
1573         int fd;
1574
1575         fd = open(mount_path, O_RDONLY | O_NOATIME);
1576         if (fd < 0) {
1577                 fprintf(stderr, "ERROR: unable to access '%s'\n", mount_path);
1578                 return -1;
1579         }
1580
1581         memset(label, '\0', sizeof(label));
1582         if (ioctl(fd, BTRFS_IOC_GET_FSLABEL, label) < 0) {
1583                 fprintf(stderr, "ERROR: unable get label %s\n", strerror(errno));
1584                 close(fd);
1585                 return -1;
1586         }
1587
1588         strncpy(labelp, label, sizeof(label));
1589         close(fd);
1590         return 0;
1591 }
1592
1593 int get_label(const char *btrfs_dev, char *label)
1594 {
1595         int ret;
1596
1597         ret = is_existing_blk_or_reg_file(btrfs_dev);
1598         if (!ret)
1599                 ret = get_label_mounted(btrfs_dev, label);
1600         else if (ret > 0)
1601                 ret = get_label_unmounted(btrfs_dev, label);
1602
1603         return ret;
1604 }
1605
1606 int set_label(const char *btrfs_dev, const char *label)
1607 {
1608         int ret;
1609
1610         if (check_label(label))
1611                 return -1;
1612
1613         ret = is_existing_blk_or_reg_file(btrfs_dev);
1614         if (!ret)
1615                 ret = set_label_mounted(btrfs_dev, label);
1616         else if (ret > 0)
1617                 ret = set_label_unmounted(btrfs_dev, label);
1618
1619         return ret;
1620 }
1621
1622 int btrfs_scan_block_devices(int run_ioctl)
1623 {
1624
1625         struct stat st;
1626         int ret;
1627         int fd;
1628         struct btrfs_fs_devices *tmp_devices;
1629         u64 num_devices;
1630         FILE *proc_partitions;
1631         int i;
1632         char buf[1024];
1633         char fullpath[110];
1634         int scans = 0;
1635         int special;
1636
1637 scan_again:
1638         proc_partitions = fopen("/proc/partitions","r");
1639         if (!proc_partitions) {
1640                 fprintf(stderr, "Unable to open '/proc/partitions' for scanning\n");
1641                 return -ENOENT;
1642         }
1643         /* skip the header */
1644         for (i = 0; i < 2; i++)
1645                 if (!fgets(buf, 1023, proc_partitions)) {
1646                         fprintf(stderr,
1647                                 "Unable to read '/proc/partitions' for scanning\n");
1648                         fclose(proc_partitions);
1649                         return -ENOENT;
1650                 }
1651
1652         strcpy(fullpath,"/dev/");
1653         while(fgets(buf, 1023, proc_partitions)) {
1654                 ret = sscanf(buf," %*d %*d %*d %99s", fullpath + 5);
1655                 if (ret != 1) {
1656                         fprintf(stderr,
1657                                 "failed to scan device name from /proc/partitions\n");
1658                         break;
1659                 }
1660
1661                 /*
1662                  * multipath and MD devices may register as a btrfs filesystem
1663                  * both through the original block device and through
1664                  * the special (/dev/mapper or /dev/mdX) entry.
1665                  * This scans the special entries last
1666                  */
1667                 special = strncmp(fullpath, "/dev/dm-", strlen("/dev/dm-")) == 0;
1668                 if (!special)
1669                         special = strncmp(fullpath, "/dev/md", strlen("/dev/md")) == 0;
1670
1671                 if (scans == 0 && special)
1672                         continue;
1673                 if (scans > 0 && !special)
1674                         continue;
1675
1676                 ret = lstat(fullpath, &st);
1677                 if (ret < 0) {
1678                         fprintf(stderr, "failed to stat %s\n", fullpath);
1679                         continue;
1680                 }
1681                 if (!S_ISBLK(st.st_mode)) {
1682                         continue;
1683                 }
1684
1685                 fd = open(fullpath, O_RDONLY);
1686                 if (fd < 0) {
1687                         if (errno != ENOMEDIUM)
1688                                 fprintf(stderr, "failed to open %s: %s\n",
1689                                         fullpath, strerror(errno));
1690                         continue;
1691                 }
1692                 ret = btrfs_scan_one_device(fd, fullpath, &tmp_devices,
1693                                             &num_devices,
1694                                             BTRFS_SUPER_INFO_OFFSET, 0);
1695                 if (ret == 0 && run_ioctl > 0) {
1696                         btrfs_register_one_device(fullpath);
1697                 }
1698                 close(fd);
1699         }
1700
1701         fclose(proc_partitions);
1702
1703         if (scans == 0) {
1704                 scans++;
1705                 goto scan_again;
1706         }
1707         return 0;
1708 }
1709
1710 /*
1711  * A not-so-good version fls64. No fascinating optimization since
1712  * no one except parse_size use it
1713  */
1714 static int fls64(u64 x)
1715 {
1716         int i;
1717
1718         for (i = 0; i <64; i++)
1719                 if (x << i & (1ULL << 63))
1720                         return 64 - i;
1721         return 64 - i;
1722 }
1723
1724 u64 parse_size(char *s)
1725 {
1726         char c;
1727         char *endptr;
1728         u64 mult = 1;
1729         u64 ret;
1730
1731         if (!s) {
1732                 fprintf(stderr, "ERROR: Size value is empty\n");
1733                 exit(1);
1734         }
1735         if (s[0] == '-') {
1736                 fprintf(stderr,
1737                         "ERROR: Size value '%s' is less equal than 0\n", s);
1738                 exit(1);
1739         }
1740         ret = strtoull(s, &endptr, 10);
1741         if (endptr == s) {
1742                 fprintf(stderr, "ERROR: Size value '%s' is invalid\n", s);
1743                 exit(1);
1744         }
1745         if (endptr[0] && endptr[1]) {
1746                 fprintf(stderr, "ERROR: Illegal suffix contains character '%c' in wrong position\n",
1747                         endptr[1]);
1748                 exit(1);
1749         }
1750         /*
1751          * strtoll returns LLONG_MAX when overflow, if this happens,
1752          * need to call strtoull to get the real size
1753          */
1754         if (errno == ERANGE && ret == ULLONG_MAX) {
1755                 fprintf(stderr,
1756                         "ERROR: Size value '%s' is too large for u64\n", s);
1757                 exit(1);
1758         }
1759         if (endptr[0]) {
1760                 c = tolower(endptr[0]);
1761                 switch (c) {
1762                 case 'e':
1763                         mult *= 1024;
1764                         /* fallthrough */
1765                 case 'p':
1766                         mult *= 1024;
1767                         /* fallthrough */
1768                 case 't':
1769                         mult *= 1024;
1770                         /* fallthrough */
1771                 case 'g':
1772                         mult *= 1024;
1773                         /* fallthrough */
1774                 case 'm':
1775                         mult *= 1024;
1776                         /* fallthrough */
1777                 case 'k':
1778                         mult *= 1024;
1779                         /* fallthrough */
1780                 case 'b':
1781                         break;
1782                 default:
1783                         fprintf(stderr, "ERROR: Unknown size descriptor '%c'\n",
1784                                 c);
1785                         exit(1);
1786                 }
1787         }
1788         /* Check whether ret * mult overflow */
1789         if (fls64(ret) + fls64(mult) - 1 > 64) {
1790                 fprintf(stderr,
1791                         "ERROR: Size value '%s' is too large for u64\n", s);
1792                 exit(1);
1793         }
1794         ret *= mult;
1795         return ret;
1796 }
1797
1798 int open_file_or_dir3(const char *fname, DIR **dirstream, int open_flags)
1799 {
1800         int ret;
1801         struct stat st;
1802         int fd;
1803
1804         ret = stat(fname, &st);
1805         if (ret < 0) {
1806                 return -1;
1807         }
1808         if (S_ISDIR(st.st_mode)) {
1809                 *dirstream = opendir(fname);
1810                 if (!*dirstream)
1811                         return -1;
1812                 fd = dirfd(*dirstream);
1813         } else if (S_ISREG(st.st_mode) || S_ISLNK(st.st_mode)) {
1814                 fd = open(fname, open_flags);
1815         } else {
1816                 /*
1817                  * we set this on purpose, in case the caller output
1818                  * strerror(errno) as success
1819                  */
1820                 errno = EINVAL;
1821                 return -1;
1822         }
1823         if (fd < 0) {
1824                 fd = -1;
1825                 if (*dirstream)
1826                         closedir(*dirstream);
1827         }
1828         return fd;
1829 }
1830
1831 int open_file_or_dir(const char *fname, DIR **dirstream)
1832 {
1833         return open_file_or_dir3(fname, dirstream, O_RDWR);
1834 }
1835
1836 void close_file_or_dir(int fd, DIR *dirstream)
1837 {
1838         if (dirstream)
1839                 closedir(dirstream);
1840         else if (fd >= 0)
1841                 close(fd);
1842 }
1843
1844 int get_device_info(int fd, u64 devid,
1845                 struct btrfs_ioctl_dev_info_args *di_args)
1846 {
1847         int ret;
1848
1849         di_args->devid = devid;
1850         memset(&di_args->uuid, '\0', sizeof(di_args->uuid));
1851
1852         ret = ioctl(fd, BTRFS_IOC_DEV_INFO, di_args);
1853         return ret ? -errno : 0;
1854 }
1855
1856 static u64 find_max_device_id(struct btrfs_ioctl_search_args *search_args,
1857                               int nr_items)
1858 {
1859         struct btrfs_dev_item *dev_item;
1860         char *buf = search_args->buf;
1861
1862         buf += (nr_items - 1) * (sizeof(struct btrfs_ioctl_search_header)
1863                                        + sizeof(struct btrfs_dev_item));
1864         buf += sizeof(struct btrfs_ioctl_search_header);
1865
1866         dev_item = (struct btrfs_dev_item *)buf;
1867
1868         return btrfs_stack_device_id(dev_item);
1869 }
1870
1871 static int search_chunk_tree_for_fs_info(int fd,
1872                                 struct btrfs_ioctl_fs_info_args *fi_args)
1873 {
1874         int ret;
1875         int max_items;
1876         u64 start_devid = 1;
1877         struct btrfs_ioctl_search_args search_args;
1878         struct btrfs_ioctl_search_key *search_key = &search_args.key;
1879
1880         fi_args->num_devices = 0;
1881
1882         max_items = BTRFS_SEARCH_ARGS_BUFSIZE
1883                / (sizeof(struct btrfs_ioctl_search_header)
1884                                + sizeof(struct btrfs_dev_item));
1885
1886         search_key->tree_id = BTRFS_CHUNK_TREE_OBJECTID;
1887         search_key->min_objectid = BTRFS_DEV_ITEMS_OBJECTID;
1888         search_key->max_objectid = BTRFS_DEV_ITEMS_OBJECTID;
1889         search_key->min_type = BTRFS_DEV_ITEM_KEY;
1890         search_key->max_type = BTRFS_DEV_ITEM_KEY;
1891         search_key->min_transid = 0;
1892         search_key->max_transid = (u64)-1;
1893         search_key->nr_items = max_items;
1894         search_key->max_offset = (u64)-1;
1895
1896 again:
1897         search_key->min_offset = start_devid;
1898
1899         ret = ioctl(fd, BTRFS_IOC_TREE_SEARCH, &search_args);
1900         if (ret < 0)
1901                 return -errno;
1902
1903         fi_args->num_devices += (u64)search_key->nr_items;
1904
1905         if (search_key->nr_items == max_items) {
1906                 start_devid = find_max_device_id(&search_args,
1907                                         search_key->nr_items) + 1;
1908                 goto again;
1909         }
1910
1911         /* get the lastest max_id to stay consistent with the num_devices */
1912         if (search_key->nr_items == 0)
1913                 /*
1914                  * last tree_search returns an empty buf, use the devid of
1915                  * the last dev_item of the previous tree_search
1916                  */
1917                 fi_args->max_id = start_devid - 1;
1918         else
1919                 fi_args->max_id = find_max_device_id(&search_args,
1920                                                 search_key->nr_items);
1921
1922         return 0;
1923 }
1924
1925 /*
1926  * For a given path, fill in the ioctl fs_ and info_ args.
1927  * If the path is a btrfs mountpoint, fill info for all devices.
1928  * If the path is a btrfs device, fill in only that device.
1929  *
1930  * The path provided must be either on a mounted btrfs fs,
1931  * or be a mounted btrfs device.
1932  *
1933  * Returns 0 on success, or a negative errno.
1934  */
1935 int get_fs_info(char *path, struct btrfs_ioctl_fs_info_args *fi_args,
1936                 struct btrfs_ioctl_dev_info_args **di_ret)
1937 {
1938         int fd = -1;
1939         int ret = 0;
1940         int ndevs = 0;
1941         int i = 0;
1942         int replacing = 0;
1943         struct btrfs_fs_devices *fs_devices_mnt = NULL;
1944         struct btrfs_ioctl_dev_info_args *di_args;
1945         struct btrfs_ioctl_dev_info_args tmp;
1946         char mp[BTRFS_PATH_NAME_MAX + 1];
1947         DIR *dirstream = NULL;
1948
1949         memset(fi_args, 0, sizeof(*fi_args));
1950
1951         if (is_block_device(path)) {
1952                 struct btrfs_super_block *disk_super;
1953                 char buf[BTRFS_SUPER_INFO_SIZE];
1954                 u64 devid;
1955
1956                 /* Ensure it's mounted, then set path to the mountpoint */
1957                 fd = open(path, O_RDONLY);
1958                 if (fd < 0) {
1959                         ret = -errno;
1960                         fprintf(stderr, "Couldn't open %s: %s\n",
1961                                 path, strerror(errno));
1962                         goto out;
1963                 }
1964                 ret = check_mounted_where(fd, path, mp, sizeof(mp),
1965                                           &fs_devices_mnt);
1966                 if (!ret) {
1967                         ret = -EINVAL;
1968                         goto out;
1969                 }
1970                 if (ret < 0)
1971                         goto out;
1972                 path = mp;
1973                 /* Only fill in this one device */
1974                 fi_args->num_devices = 1;
1975
1976                 disk_super = (struct btrfs_super_block *)buf;
1977                 ret = btrfs_read_dev_super(fd, disk_super,
1978                                            BTRFS_SUPER_INFO_OFFSET, 0);
1979                 if (ret < 0) {
1980                         ret = -EIO;
1981                         goto out;
1982                 }
1983                 devid = btrfs_stack_device_id(&disk_super->dev_item);
1984
1985                 fi_args->max_id = devid;
1986                 i = devid;
1987
1988                 memcpy(fi_args->fsid, fs_devices_mnt->fsid, BTRFS_FSID_SIZE);
1989                 close(fd);
1990         }
1991
1992         /* at this point path must not be for a block device */
1993         fd = open_file_or_dir(path, &dirstream);
1994         if (fd < 0) {
1995                 ret = -errno;
1996                 goto out;
1997         }
1998
1999         /* fill in fi_args if not just a single device */
2000         if (fi_args->num_devices != 1) {
2001                 ret = ioctl(fd, BTRFS_IOC_FS_INFO, fi_args);
2002                 if (ret < 0) {
2003                         ret = -errno;
2004                         goto out;
2005                 }
2006
2007                 /*
2008                  * The fs_args->num_devices does not include seed devices
2009                  */
2010                 ret = search_chunk_tree_for_fs_info(fd, fi_args);
2011                 if (ret)
2012                         goto out;
2013
2014                 /*
2015                  * search_chunk_tree_for_fs_info() will lacks the devid 0
2016                  * so manual probe for it here.
2017                  */
2018                 ret = get_device_info(fd, 0, &tmp);
2019                 if (!ret) {
2020                         fi_args->num_devices++;
2021                         ndevs++;
2022                         replacing = 1;
2023                         if (i == 0)
2024                                 i++;
2025                 }
2026         }
2027
2028         if (!fi_args->num_devices)
2029                 goto out;
2030
2031         di_args = *di_ret = malloc((fi_args->num_devices) * sizeof(*di_args));
2032         if (!di_args) {
2033                 ret = -errno;
2034                 goto out;
2035         }
2036
2037         if (replacing)
2038                 memcpy(di_args, &tmp, sizeof(tmp));
2039         for (; i <= fi_args->max_id; ++i) {
2040                 ret = get_device_info(fd, i, &di_args[ndevs]);
2041                 if (ret == -ENODEV)
2042                         continue;
2043                 if (ret)
2044                         goto out;
2045                 ndevs++;
2046         }
2047
2048         /*
2049         * only when the only dev we wanted to find is not there then
2050         * let any error be returned
2051         */
2052         if (fi_args->num_devices != 1) {
2053                 BUG_ON(ndevs == 0);
2054                 ret = 0;
2055         }
2056
2057 out:
2058         close_file_or_dir(fd, dirstream);
2059         return ret;
2060 }
2061
2062 #define isoctal(c)      (((c) & ~7) == '0')
2063
2064 static inline void translate(char *f, char *t)
2065 {
2066         while (*f != '\0') {
2067                 if (*f == '\\' &&
2068                     isoctal(f[1]) && isoctal(f[2]) && isoctal(f[3])) {
2069                         *t++ = 64*(f[1] & 7) + 8*(f[2] & 7) + (f[3] & 7);
2070                         f += 4;
2071                 } else
2072                         *t++ = *f++;
2073         }
2074         *t = '\0';
2075         return;
2076 }
2077
2078 /*
2079  * Checks if the swap device.
2080  * Returns 1 if swap device, < 0 on error or 0 if not swap device.
2081  */
2082 static int is_swap_device(const char *file)
2083 {
2084         FILE    *f;
2085         struct stat     st_buf;
2086         dev_t   dev;
2087         ino_t   ino = 0;
2088         char    tmp[PATH_MAX];
2089         char    buf[PATH_MAX];
2090         char    *cp;
2091         int     ret = 0;
2092
2093         if (stat(file, &st_buf) < 0)
2094                 return -errno;
2095         if (S_ISBLK(st_buf.st_mode))
2096                 dev = st_buf.st_rdev;
2097         else if (S_ISREG(st_buf.st_mode)) {
2098                 dev = st_buf.st_dev;
2099                 ino = st_buf.st_ino;
2100         } else
2101                 return 0;
2102
2103         if ((f = fopen("/proc/swaps", "r")) == NULL)
2104                 return 0;
2105
2106         /* skip the first line */
2107         if (fgets(tmp, sizeof(tmp), f) == NULL)
2108                 goto out;
2109
2110         while (fgets(tmp, sizeof(tmp), f) != NULL) {
2111                 if ((cp = strchr(tmp, ' ')) != NULL)
2112                         *cp = '\0';
2113                 if ((cp = strchr(tmp, '\t')) != NULL)
2114                         *cp = '\0';
2115                 translate(tmp, buf);
2116                 if (stat(buf, &st_buf) != 0)
2117                         continue;
2118                 if (S_ISBLK(st_buf.st_mode)) {
2119                         if (dev == st_buf.st_rdev) {
2120                                 ret = 1;
2121                                 break;
2122                         }
2123                 } else if (S_ISREG(st_buf.st_mode)) {
2124                         if (dev == st_buf.st_dev && ino == st_buf.st_ino) {
2125                                 ret = 1;
2126                                 break;
2127                         }
2128                 }
2129         }
2130
2131 out:
2132         fclose(f);
2133
2134         return ret;
2135 }
2136
2137 /*
2138  * Check for existing filesystem or partition table on device.
2139  * Returns:
2140  *       1 for existing fs or partition
2141  *       0 for nothing found
2142  *      -1 for internal error
2143  */
2144 static int
2145 check_overwrite(
2146         char            *device)
2147 {
2148         const char      *type;
2149         blkid_probe     pr = NULL;
2150         int             ret;
2151         blkid_loff_t    size;
2152
2153         if (!device || !*device)
2154                 return 0;
2155
2156         ret = -1; /* will reset on success of all setup calls */
2157
2158         pr = blkid_new_probe_from_filename(device);
2159         if (!pr)
2160                 goto out;
2161
2162         size = blkid_probe_get_size(pr);
2163         if (size < 0)
2164                 goto out;
2165
2166         /* nothing to overwrite on a 0-length device */
2167         if (size == 0) {
2168                 ret = 0;
2169                 goto out;
2170         }
2171
2172         ret = blkid_probe_enable_partitions(pr, 1);
2173         if (ret < 0)
2174                 goto out;
2175
2176         ret = blkid_do_fullprobe(pr);
2177         if (ret < 0)
2178                 goto out;
2179
2180         /*
2181          * Blkid returns 1 for nothing found and 0 when it finds a signature,
2182          * but we want the exact opposite, so reverse the return value here.
2183          *
2184          * In addition print some useful diagnostics about what actually is
2185          * on the device.
2186          */
2187         if (ret) {
2188                 ret = 0;
2189                 goto out;
2190         }
2191
2192         if (!blkid_probe_lookup_value(pr, "TYPE", &type, NULL)) {
2193                 fprintf(stderr,
2194                         "%s appears to contain an existing "
2195                         "filesystem (%s).\n", device, type);
2196         } else if (!blkid_probe_lookup_value(pr, "PTTYPE", &type, NULL)) {
2197                 fprintf(stderr,
2198                         "%s appears to contain a partition "
2199                         "table (%s).\n", device, type);
2200         } else {
2201                 fprintf(stderr,
2202                         "%s appears to contain something weird "
2203                         "according to blkid\n", device);
2204         }
2205         ret = 1;
2206
2207 out:
2208         if (pr)
2209                 blkid_free_probe(pr);
2210         if (ret == -1)
2211                 fprintf(stderr,
2212                         "probe of %s failed, cannot detect "
2213                           "existing filesystem.\n", device);
2214         return ret;
2215 }
2216
2217 static int group_profile_devs_min(u64 flag)
2218 {
2219         switch (flag & BTRFS_BLOCK_GROUP_PROFILE_MASK) {
2220         case 0: /* single */
2221         case BTRFS_BLOCK_GROUP_DUP:
2222                 return 1;
2223         case BTRFS_BLOCK_GROUP_RAID0:
2224         case BTRFS_BLOCK_GROUP_RAID1:
2225         case BTRFS_BLOCK_GROUP_RAID5:
2226                 return 2;
2227         case BTRFS_BLOCK_GROUP_RAID6:
2228                 return 3;
2229         case BTRFS_BLOCK_GROUP_RAID10:
2230                 return 4;
2231         default:
2232                 return -1;
2233         }
2234 }
2235
2236 int test_num_disk_vs_raid(u64 metadata_profile, u64 data_profile,
2237         u64 dev_cnt, int mixed, char *estr)
2238 {
2239         size_t sz = 100;
2240         u64 allowed = 0;
2241
2242         switch (dev_cnt) {
2243         default:
2244         case 4:
2245                 allowed |= BTRFS_BLOCK_GROUP_RAID10;
2246         case 3:
2247                 allowed |= BTRFS_BLOCK_GROUP_RAID6;
2248         case 2:
2249                 allowed |= BTRFS_BLOCK_GROUP_RAID0 | BTRFS_BLOCK_GROUP_RAID1 |
2250                         BTRFS_BLOCK_GROUP_RAID5;
2251                 break;
2252         case 1:
2253                 allowed |= BTRFS_BLOCK_GROUP_DUP;
2254         }
2255
2256         if (dev_cnt > 1 &&
2257             ((metadata_profile | data_profile) & BTRFS_BLOCK_GROUP_DUP)) {
2258                 snprintf(estr, sz,
2259                         "DUP is not allowed when FS has multiple devices\n");
2260                 return 1;
2261         }
2262         if (metadata_profile & ~allowed) {
2263                 snprintf(estr, sz,
2264                         "unable to create FS with metadata profile %s "
2265                         "(have %llu devices but %d devices are required)\n",
2266                         btrfs_group_profile_str(metadata_profile), dev_cnt,
2267                         group_profile_devs_min(metadata_profile));
2268                 return 1;
2269         }
2270         if (data_profile & ~allowed) {
2271                 snprintf(estr, sz,
2272                         "unable to create FS with data profile %s "
2273                         "(have %llu devices but %d devices are required)\n",
2274                         btrfs_group_profile_str(data_profile), dev_cnt,
2275                         group_profile_devs_min(data_profile));
2276                 return 1;
2277         }
2278
2279         if (!mixed && (data_profile & BTRFS_BLOCK_GROUP_DUP)) {
2280                 snprintf(estr, sz,
2281                         "dup for data is allowed only in mixed mode");
2282                 return 1;
2283         }
2284         return 0;
2285 }
2286
2287 /* Check if disk is suitable for btrfs
2288  * returns:
2289  *  1: something is wrong, estr provides the error
2290  *  0: all is fine
2291  */
2292 int test_dev_for_mkfs(char *file, int force_overwrite, char *estr)
2293 {
2294         int ret, fd;
2295         size_t sz = 100;
2296         struct stat st;
2297
2298         ret = is_swap_device(file);
2299         if (ret < 0) {
2300                 snprintf(estr, sz, "error checking %s status: %s\n", file,
2301                         strerror(-ret));
2302                 return 1;
2303         }
2304         if (ret == 1) {
2305                 snprintf(estr, sz, "%s is a swap device\n", file);
2306                 return 1;
2307         }
2308         if (!force_overwrite) {
2309                 if (check_overwrite(file)) {
2310                         snprintf(estr, sz, "Use the -f option to force overwrite.\n");
2311                         return 1;
2312                 }
2313         }
2314         ret = check_mounted(file);
2315         if (ret < 0) {
2316                 snprintf(estr, sz, "error checking %s mount status\n",
2317                         file);
2318                 return 1;
2319         }
2320         if (ret == 1) {
2321                 snprintf(estr, sz, "%s is mounted\n", file);
2322                 return 1;
2323         }
2324         /* check if the device is busy */
2325         fd = open(file, O_RDWR|O_EXCL);
2326         if (fd < 0) {
2327                 snprintf(estr, sz, "unable to open %s: %s\n", file,
2328                         strerror(errno));
2329                 return 1;
2330         }
2331         if (fstat(fd, &st)) {
2332                 snprintf(estr, sz, "unable to stat %s: %s\n", file,
2333                         strerror(errno));
2334                 close(fd);
2335                 return 1;
2336         }
2337         if (!S_ISBLK(st.st_mode)) {
2338                 fprintf(stderr, "'%s' is not a block device\n", file);
2339                 close(fd);
2340                 return 1;
2341         }
2342         close(fd);
2343         return 0;
2344 }
2345
2346 int btrfs_scan_lblkid()
2347 {
2348         int fd = -1;
2349         int ret;
2350         u64 num_devices;
2351         struct btrfs_fs_devices *tmp_devices;
2352         blkid_dev_iterate iter = NULL;
2353         blkid_dev dev = NULL;
2354         blkid_cache cache = NULL;
2355         char path[PATH_MAX];
2356
2357         if (btrfs_scan_done)
2358                 return 0;
2359
2360         if (blkid_get_cache(&cache, 0) < 0) {
2361                 printf("ERROR: lblkid cache get failed\n");
2362                 return 1;
2363         }
2364         blkid_probe_all(cache);
2365         iter = blkid_dev_iterate_begin(cache);
2366         blkid_dev_set_search(iter, "TYPE", "btrfs");
2367         while (blkid_dev_next(iter, &dev) == 0) {
2368                 dev = blkid_verify(cache, dev);
2369                 if (!dev)
2370                         continue;
2371                 /* if we are here its definitely a btrfs disk*/
2372                 strncpy_null(path, blkid_dev_devname(dev));
2373
2374                 fd = open(path, O_RDONLY);
2375                 if (fd < 0) {
2376                         printf("ERROR: could not open %s\n", path);
2377                         continue;
2378                 }
2379                 ret = btrfs_scan_one_device(fd, path, &tmp_devices,
2380                                 &num_devices, BTRFS_SUPER_INFO_OFFSET, 0);
2381                 if (ret) {
2382                         printf("ERROR: could not scan %s\n", path);
2383                         close (fd);
2384                         continue;
2385                 }
2386
2387                 close(fd);
2388         }
2389         blkid_dev_iterate_end(iter);
2390         blkid_put_cache(cache);
2391
2392         btrfs_scan_done = 1;
2393
2394         return 0;
2395 }
2396
2397 int is_vol_small(char *file)
2398 {
2399         int fd = -1;
2400         int e;
2401         struct stat st;
2402         u64 size;
2403
2404         fd = open(file, O_RDONLY);
2405         if (fd < 0)
2406                 return -errno;
2407         if (fstat(fd, &st) < 0) {
2408                 e = -errno;
2409                 close(fd);
2410                 return e;
2411         }
2412         size = btrfs_device_size(fd, &st);
2413         if (size == 0) {
2414                 close(fd);
2415                 return -1;
2416         }
2417         if (size < BTRFS_MKFS_SMALL_VOLUME_SIZE) {
2418                 close(fd);
2419                 return 1;
2420         } else {
2421                 close(fd);
2422                 return 0;
2423         }
2424 }
2425
2426 /*
2427  * This reads a line from the stdin and only returns non-zero if the
2428  * first whitespace delimited token is a case insensitive match with yes
2429  * or y.
2430  */
2431 int ask_user(char *question)
2432 {
2433         char buf[30] = {0,};
2434         char *saveptr = NULL;
2435         char *answer;
2436
2437         printf("%s [y/N]: ", question);
2438
2439         return fgets(buf, sizeof(buf) - 1, stdin) &&
2440                (answer = strtok_r(buf, " \t\n\r", &saveptr)) &&
2441                (!strcasecmp(answer, "yes") || !strcasecmp(answer, "y"));
2442 }
2443
2444 /*
2445  * For a given:
2446  * - file or directory return the containing tree root id
2447  * - subvolume return its own tree id
2448  * - BTRFS_EMPTY_SUBVOL_DIR_OBJECTID (directory with ino == 2) the result is
2449  *   undefined and function returns -1
2450  */
2451 int lookup_ino_rootid(int fd, u64 *rootid)
2452 {
2453         struct btrfs_ioctl_ino_lookup_args args;
2454         int ret;
2455         int e;
2456
2457         memset(&args, 0, sizeof(args));
2458         args.treeid = 0;
2459         args.objectid = BTRFS_FIRST_FREE_OBJECTID;
2460
2461         ret = ioctl(fd, BTRFS_IOC_INO_LOOKUP, &args);
2462         e = errno;
2463         if (ret) {
2464                 fprintf(stderr, "ERROR: Failed to lookup root id - %s\n",
2465                         strerror(e));
2466                 return ret;
2467         }
2468
2469         *rootid = args.treeid;
2470
2471         return 0;
2472 }
2473
2474 /*
2475  * return 0 if a btrfs mount point is found
2476  * return 1 if a mount point is found but not btrfs
2477  * return <0 if something goes wrong
2478  */
2479 int find_mount_root(const char *path, char **mount_root)
2480 {
2481         FILE *mnttab;
2482         int fd;
2483         struct mntent *ent;
2484         int len;
2485         int ret;
2486         int not_btrfs = 1;
2487         int longest_matchlen = 0;
2488         char *longest_match = NULL;
2489
2490         fd = open(path, O_RDONLY | O_NOATIME);
2491         if (fd < 0)
2492                 return -errno;
2493         close(fd);
2494
2495         mnttab = setmntent("/proc/self/mounts", "r");
2496         if (!mnttab)
2497                 return -errno;
2498
2499         while ((ent = getmntent(mnttab))) {
2500                 len = strlen(ent->mnt_dir);
2501                 if (strncmp(ent->mnt_dir, path, len) == 0) {
2502                         /* match found and use the latest match */
2503                         if (longest_matchlen <= len) {
2504                                 free(longest_match);
2505                                 longest_matchlen = len;
2506                                 longest_match = strdup(ent->mnt_dir);
2507                                 not_btrfs = strcmp(ent->mnt_type, "btrfs");
2508                         }
2509                 }
2510         }
2511         endmntent(mnttab);
2512
2513         if (!longest_match)
2514                 return -ENOENT;
2515         if (not_btrfs) {
2516                 free(longest_match);
2517                 return 1;
2518         }
2519
2520         ret = 0;
2521         *mount_root = realpath(longest_match, NULL);
2522         if (!*mount_root)
2523                 ret = -errno;
2524
2525         free(longest_match);
2526         return ret;
2527 }
2528
2529 int test_minimum_size(const char *file, u32 leafsize)
2530 {
2531         int fd;
2532         struct stat statbuf;
2533
2534         fd = open(file, O_RDONLY);
2535         if (fd < 0)
2536                 return -errno;
2537         if (stat(file, &statbuf) < 0) {
2538                 close(fd);
2539                 return -errno;
2540         }
2541         if (btrfs_device_size(fd, &statbuf) < btrfs_min_dev_size(leafsize)) {
2542                 close(fd);
2543                 return 1;
2544         }
2545         close(fd);
2546         return 0;
2547 }
2548
2549 /*
2550  * test if name is a correct subvolume name
2551  * this function return
2552  * 0-> name is not a correct subvolume name
2553  * 1-> name is a correct subvolume name
2554  */
2555 int test_issubvolname(const char *name)
2556 {
2557         return name[0] != '\0' && !strchr(name, '/') &&
2558                 strcmp(name, ".") && strcmp(name, "..");
2559 }
2560
2561 /*
2562  * test if path is a directory
2563  * this function return
2564  * 0-> path exists but it is not a directory
2565  * 1-> path exists and it is a directory
2566  * -1 -> path is unaccessible
2567  */
2568 int test_isdir(const char *path)
2569 {
2570         struct stat st;
2571         int ret;
2572
2573         ret = stat(path, &st);
2574         if(ret < 0 )
2575                 return -1;
2576
2577         return S_ISDIR(st.st_mode);
2578 }
2579
2580 void units_set_mode(unsigned *units, unsigned mode)
2581 {
2582         unsigned base = *units & UNITS_MODE_MASK;
2583
2584         *units = base | mode;
2585 }
2586
2587 void units_set_base(unsigned *units, unsigned base)
2588 {
2589         unsigned mode = *units & ~UNITS_MODE_MASK;
2590
2591         *units = base | mode;
2592 }
2593
2594 int find_next_key(struct btrfs_path *path, struct btrfs_key *key)
2595 {
2596         int level;
2597
2598         for (level = 0; level < BTRFS_MAX_LEVEL; level++) {
2599                 if (!path->nodes[level])
2600                         break;
2601                 if (path->slots[level] + 1 >=
2602                     btrfs_header_nritems(path->nodes[level]))
2603                         continue;
2604                 if (level == 0)
2605                         btrfs_item_key_to_cpu(path->nodes[level], key,
2606                                               path->slots[level] + 1);
2607                 else
2608                         btrfs_node_key_to_cpu(path->nodes[level], key,
2609                                               path->slots[level] + 1);
2610                 return 0;
2611         }
2612         return 1;
2613 }
2614
2615 char* btrfs_group_type_str(u64 flag)
2616 {
2617         u64 mask = BTRFS_BLOCK_GROUP_TYPE_MASK |
2618                 BTRFS_SPACE_INFO_GLOBAL_RSV;
2619
2620         switch (flag & mask) {
2621         case BTRFS_BLOCK_GROUP_DATA:
2622                 return "Data";
2623         case BTRFS_BLOCK_GROUP_SYSTEM:
2624                 return "System";
2625         case BTRFS_BLOCK_GROUP_METADATA:
2626                 return "Metadata";
2627         case BTRFS_BLOCK_GROUP_DATA|BTRFS_BLOCK_GROUP_METADATA:
2628                 return "Data+Metadata";
2629         case BTRFS_SPACE_INFO_GLOBAL_RSV:
2630                 return "GlobalReserve";
2631         default:
2632                 return "unknown";
2633         }
2634 }
2635
2636 char* btrfs_group_profile_str(u64 flag)
2637 {
2638         switch (flag & BTRFS_BLOCK_GROUP_PROFILE_MASK) {
2639         case 0:
2640                 return "single";
2641         case BTRFS_BLOCK_GROUP_RAID0:
2642                 return "RAID0";
2643         case BTRFS_BLOCK_GROUP_RAID1:
2644                 return "RAID1";
2645         case BTRFS_BLOCK_GROUP_RAID5:
2646                 return "RAID5";
2647         case BTRFS_BLOCK_GROUP_RAID6:
2648                 return "RAID6";
2649         case BTRFS_BLOCK_GROUP_DUP:
2650                 return "DUP";
2651         case BTRFS_BLOCK_GROUP_RAID10:
2652                 return "RAID10";
2653         default:
2654                 return "unknown";
2655         }
2656 }
2657
2658 u64 disk_size(char *path)
2659 {
2660         struct statfs sfs;
2661
2662         if (statfs(path, &sfs) < 0)
2663                 return 0;
2664         else
2665                 return sfs.f_bsize * sfs.f_blocks;
2666 }
2667
2668 u64 get_partition_size(char *dev)
2669 {
2670         u64 result;
2671         int fd = open(dev, O_RDONLY);
2672
2673         if (fd < 0)
2674                 return 0;
2675         if (ioctl(fd, BLKGETSIZE64, &result) < 0) {
2676                 close(fd);
2677                 return 0;
2678         }
2679         close(fd);
2680
2681         return result;
2682 }
2683
2684 int btrfs_tree_search2_ioctl_supported(int fd)
2685 {
2686         struct btrfs_ioctl_search_args_v2 *args2;
2687         struct btrfs_ioctl_search_key *sk;
2688         int args2_size = 1024;
2689         char args2_buf[args2_size];
2690         int ret;
2691         static int v2_supported = -1;
2692
2693         if (v2_supported != -1)
2694                 return v2_supported;
2695
2696         args2 = (struct btrfs_ioctl_search_args_v2 *)args2_buf;
2697         sk = &(args2->key);
2698
2699         /*
2700          * Search for the extent tree item in the root tree.
2701          */
2702         sk->tree_id = BTRFS_ROOT_TREE_OBJECTID;
2703         sk->min_objectid = BTRFS_EXTENT_TREE_OBJECTID;
2704         sk->max_objectid = BTRFS_EXTENT_TREE_OBJECTID;
2705         sk->min_type = BTRFS_ROOT_ITEM_KEY;
2706         sk->max_type = BTRFS_ROOT_ITEM_KEY;
2707         sk->min_offset = 0;
2708         sk->max_offset = (u64)-1;
2709         sk->min_transid = 0;
2710         sk->max_transid = (u64)-1;
2711         sk->nr_items = 1;
2712         args2->buf_size = args2_size - sizeof(struct btrfs_ioctl_search_args_v2);
2713         ret = ioctl(fd, BTRFS_IOC_TREE_SEARCH_V2, args2);
2714         if (ret == -EOPNOTSUPP)
2715                 v2_supported = 0;
2716         else if (ret == 0)
2717                 v2_supported = 1;
2718         else
2719                 return ret;
2720
2721         return v2_supported;
2722 }