Linux 6.1.66
[platform/kernel/linux-starfive.git] / block / ioctl.c
1 // SPDX-License-Identifier: GPL-2.0
2 #include <linux/capability.h>
3 #include <linux/compat.h>
4 #include <linux/blkdev.h>
5 #include <linux/export.h>
6 #include <linux/gfp.h>
7 #include <linux/blkpg.h>
8 #include <linux/hdreg.h>
9 #include <linux/backing-dev.h>
10 #include <linux/fs.h>
11 #include <linux/blktrace_api.h>
12 #include <linux/pr.h>
13 #include <linux/uaccess.h>
14 #include "blk.h"
15
16 static int blkpg_do_ioctl(struct block_device *bdev,
17                           struct blkpg_partition __user *upart, int op)
18 {
19         struct gendisk *disk = bdev->bd_disk;
20         struct blkpg_partition p;
21         long long start, length;
22
23         if (disk->flags & GENHD_FL_NO_PART)
24                 return -EINVAL;
25         if (!capable(CAP_SYS_ADMIN))
26                 return -EACCES;
27         if (copy_from_user(&p, upart, sizeof(struct blkpg_partition)))
28                 return -EFAULT;
29         if (bdev_is_partition(bdev))
30                 return -EINVAL;
31
32         if (p.pno <= 0)
33                 return -EINVAL;
34
35         if (op == BLKPG_DEL_PARTITION)
36                 return bdev_del_partition(disk, p.pno);
37
38         start = p.start >> SECTOR_SHIFT;
39         length = p.length >> SECTOR_SHIFT;
40
41         switch (op) {
42         case BLKPG_ADD_PARTITION:
43                 /* check if partition is aligned to blocksize */
44                 if (p.start & (bdev_logical_block_size(bdev) - 1))
45                         return -EINVAL;
46                 return bdev_add_partition(disk, p.pno, start, length);
47         case BLKPG_RESIZE_PARTITION:
48                 return bdev_resize_partition(disk, p.pno, start, length);
49         default:
50                 return -EINVAL;
51         }
52 }
53
54 static int blkpg_ioctl(struct block_device *bdev,
55                        struct blkpg_ioctl_arg __user *arg)
56 {
57         struct blkpg_partition __user *udata;
58         int op;
59
60         if (get_user(op, &arg->op) || get_user(udata, &arg->data))
61                 return -EFAULT;
62
63         return blkpg_do_ioctl(bdev, udata, op);
64 }
65
66 #ifdef CONFIG_COMPAT
67 struct compat_blkpg_ioctl_arg {
68         compat_int_t op;
69         compat_int_t flags;
70         compat_int_t datalen;
71         compat_caddr_t data;
72 };
73
74 static int compat_blkpg_ioctl(struct block_device *bdev,
75                               struct compat_blkpg_ioctl_arg __user *arg)
76 {
77         compat_caddr_t udata;
78         int op;
79
80         if (get_user(op, &arg->op) || get_user(udata, &arg->data))
81                 return -EFAULT;
82
83         return blkpg_do_ioctl(bdev, compat_ptr(udata), op);
84 }
85 #endif
86
87 static int blk_ioctl_discard(struct block_device *bdev, fmode_t mode,
88                 unsigned long arg)
89 {
90         uint64_t range[2];
91         uint64_t start, len;
92         struct inode *inode = bdev->bd_inode;
93         int err;
94
95         if (!(mode & FMODE_WRITE))
96                 return -EBADF;
97
98         if (!bdev_max_discard_sectors(bdev))
99                 return -EOPNOTSUPP;
100
101         if (copy_from_user(range, (void __user *)arg, sizeof(range)))
102                 return -EFAULT;
103
104         start = range[0];
105         len = range[1];
106
107         if (start & 511)
108                 return -EINVAL;
109         if (len & 511)
110                 return -EINVAL;
111
112         if (start + len > bdev_nr_bytes(bdev))
113                 return -EINVAL;
114
115         filemap_invalidate_lock(inode->i_mapping);
116         err = truncate_bdev_range(bdev, mode, start, start + len - 1);
117         if (err)
118                 goto fail;
119         err = blkdev_issue_discard(bdev, start >> 9, len >> 9, GFP_KERNEL);
120 fail:
121         filemap_invalidate_unlock(inode->i_mapping);
122         return err;
123 }
124
125 static int blk_ioctl_secure_erase(struct block_device *bdev, fmode_t mode,
126                 void __user *argp)
127 {
128         uint64_t start, len;
129         uint64_t range[2];
130         int err;
131
132         if (!(mode & FMODE_WRITE))
133                 return -EBADF;
134         if (!bdev_max_secure_erase_sectors(bdev))
135                 return -EOPNOTSUPP;
136         if (copy_from_user(range, argp, sizeof(range)))
137                 return -EFAULT;
138
139         start = range[0];
140         len = range[1];
141         if ((start & 511) || (len & 511))
142                 return -EINVAL;
143         if (start + len > bdev_nr_bytes(bdev))
144                 return -EINVAL;
145
146         filemap_invalidate_lock(bdev->bd_inode->i_mapping);
147         err = truncate_bdev_range(bdev, mode, start, start + len - 1);
148         if (!err)
149                 err = blkdev_issue_secure_erase(bdev, start >> 9, len >> 9,
150                                                 GFP_KERNEL);
151         filemap_invalidate_unlock(bdev->bd_inode->i_mapping);
152         return err;
153 }
154
155
156 static int blk_ioctl_zeroout(struct block_device *bdev, fmode_t mode,
157                 unsigned long arg)
158 {
159         uint64_t range[2];
160         uint64_t start, end, len;
161         struct inode *inode = bdev->bd_inode;
162         int err;
163
164         if (!(mode & FMODE_WRITE))
165                 return -EBADF;
166
167         if (copy_from_user(range, (void __user *)arg, sizeof(range)))
168                 return -EFAULT;
169
170         start = range[0];
171         len = range[1];
172         end = start + len - 1;
173
174         if (start & 511)
175                 return -EINVAL;
176         if (len & 511)
177                 return -EINVAL;
178         if (end >= (uint64_t)bdev_nr_bytes(bdev))
179                 return -EINVAL;
180         if (end < start)
181                 return -EINVAL;
182
183         /* Invalidate the page cache, including dirty pages */
184         filemap_invalidate_lock(inode->i_mapping);
185         err = truncate_bdev_range(bdev, mode, start, end);
186         if (err)
187                 goto fail;
188
189         err = blkdev_issue_zeroout(bdev, start >> 9, len >> 9, GFP_KERNEL,
190                                    BLKDEV_ZERO_NOUNMAP);
191
192 fail:
193         filemap_invalidate_unlock(inode->i_mapping);
194         return err;
195 }
196
197 static int put_ushort(unsigned short __user *argp, unsigned short val)
198 {
199         return put_user(val, argp);
200 }
201
202 static int put_int(int __user *argp, int val)
203 {
204         return put_user(val, argp);
205 }
206
207 static int put_uint(unsigned int __user *argp, unsigned int val)
208 {
209         return put_user(val, argp);
210 }
211
212 static int put_long(long __user *argp, long val)
213 {
214         return put_user(val, argp);
215 }
216
217 static int put_ulong(unsigned long __user *argp, unsigned long val)
218 {
219         return put_user(val, argp);
220 }
221
222 static int put_u64(u64 __user *argp, u64 val)
223 {
224         return put_user(val, argp);
225 }
226
227 #ifdef CONFIG_COMPAT
228 static int compat_put_long(compat_long_t __user *argp, long val)
229 {
230         return put_user(val, argp);
231 }
232
233 static int compat_put_ulong(compat_ulong_t __user *argp, compat_ulong_t val)
234 {
235         return put_user(val, argp);
236 }
237 #endif
238
239 #ifdef CONFIG_COMPAT
240 /*
241  * This is the equivalent of compat_ptr_ioctl(), to be used by block
242  * drivers that implement only commands that are completely compatible
243  * between 32-bit and 64-bit user space
244  */
245 int blkdev_compat_ptr_ioctl(struct block_device *bdev, fmode_t mode,
246                         unsigned cmd, unsigned long arg)
247 {
248         struct gendisk *disk = bdev->bd_disk;
249
250         if (disk->fops->ioctl)
251                 return disk->fops->ioctl(bdev, mode, cmd,
252                                          (unsigned long)compat_ptr(arg));
253
254         return -ENOIOCTLCMD;
255 }
256 EXPORT_SYMBOL(blkdev_compat_ptr_ioctl);
257 #endif
258
259 static int blkdev_pr_register(struct block_device *bdev,
260                 struct pr_registration __user *arg)
261 {
262         const struct pr_ops *ops = bdev->bd_disk->fops->pr_ops;
263         struct pr_registration reg;
264
265         if (!capable(CAP_SYS_ADMIN))
266                 return -EPERM;
267         if (!ops || !ops->pr_register)
268                 return -EOPNOTSUPP;
269         if (copy_from_user(&reg, arg, sizeof(reg)))
270                 return -EFAULT;
271
272         if (reg.flags & ~PR_FL_IGNORE_KEY)
273                 return -EOPNOTSUPP;
274         return ops->pr_register(bdev, reg.old_key, reg.new_key, reg.flags);
275 }
276
277 static int blkdev_pr_reserve(struct block_device *bdev,
278                 struct pr_reservation __user *arg)
279 {
280         const struct pr_ops *ops = bdev->bd_disk->fops->pr_ops;
281         struct pr_reservation rsv;
282
283         if (!capable(CAP_SYS_ADMIN))
284                 return -EPERM;
285         if (!ops || !ops->pr_reserve)
286                 return -EOPNOTSUPP;
287         if (copy_from_user(&rsv, arg, sizeof(rsv)))
288                 return -EFAULT;
289
290         if (rsv.flags & ~PR_FL_IGNORE_KEY)
291                 return -EOPNOTSUPP;
292         return ops->pr_reserve(bdev, rsv.key, rsv.type, rsv.flags);
293 }
294
295 static int blkdev_pr_release(struct block_device *bdev,
296                 struct pr_reservation __user *arg)
297 {
298         const struct pr_ops *ops = bdev->bd_disk->fops->pr_ops;
299         struct pr_reservation rsv;
300
301         if (!capable(CAP_SYS_ADMIN))
302                 return -EPERM;
303         if (!ops || !ops->pr_release)
304                 return -EOPNOTSUPP;
305         if (copy_from_user(&rsv, arg, sizeof(rsv)))
306                 return -EFAULT;
307
308         if (rsv.flags)
309                 return -EOPNOTSUPP;
310         return ops->pr_release(bdev, rsv.key, rsv.type);
311 }
312
313 static int blkdev_pr_preempt(struct block_device *bdev,
314                 struct pr_preempt __user *arg, bool abort)
315 {
316         const struct pr_ops *ops = bdev->bd_disk->fops->pr_ops;
317         struct pr_preempt p;
318
319         if (!capable(CAP_SYS_ADMIN))
320                 return -EPERM;
321         if (!ops || !ops->pr_preempt)
322                 return -EOPNOTSUPP;
323         if (copy_from_user(&p, arg, sizeof(p)))
324                 return -EFAULT;
325
326         if (p.flags)
327                 return -EOPNOTSUPP;
328         return ops->pr_preempt(bdev, p.old_key, p.new_key, p.type, abort);
329 }
330
331 static int blkdev_pr_clear(struct block_device *bdev,
332                 struct pr_clear __user *arg)
333 {
334         const struct pr_ops *ops = bdev->bd_disk->fops->pr_ops;
335         struct pr_clear c;
336
337         if (!capable(CAP_SYS_ADMIN))
338                 return -EPERM;
339         if (!ops || !ops->pr_clear)
340                 return -EOPNOTSUPP;
341         if (copy_from_user(&c, arg, sizeof(c)))
342                 return -EFAULT;
343
344         if (c.flags)
345                 return -EOPNOTSUPP;
346         return ops->pr_clear(bdev, c.key);
347 }
348
349 static int blkdev_flushbuf(struct block_device *bdev, fmode_t mode,
350                 unsigned cmd, unsigned long arg)
351 {
352         if (!capable(CAP_SYS_ADMIN))
353                 return -EACCES;
354         fsync_bdev(bdev);
355         invalidate_bdev(bdev);
356         return 0;
357 }
358
359 static int blkdev_roset(struct block_device *bdev, fmode_t mode,
360                 unsigned cmd, unsigned long arg)
361 {
362         int ret, n;
363
364         if (!capable(CAP_SYS_ADMIN))
365                 return -EACCES;
366
367         if (get_user(n, (int __user *)arg))
368                 return -EFAULT;
369         if (bdev->bd_disk->fops->set_read_only) {
370                 ret = bdev->bd_disk->fops->set_read_only(bdev, n);
371                 if (ret)
372                         return ret;
373         }
374         bdev->bd_read_only = n;
375         return 0;
376 }
377
378 static int blkdev_getgeo(struct block_device *bdev,
379                 struct hd_geometry __user *argp)
380 {
381         struct gendisk *disk = bdev->bd_disk;
382         struct hd_geometry geo;
383         int ret;
384
385         if (!argp)
386                 return -EINVAL;
387         if (!disk->fops->getgeo)
388                 return -ENOTTY;
389
390         /*
391          * We need to set the startsect first, the driver may
392          * want to override it.
393          */
394         memset(&geo, 0, sizeof(geo));
395         geo.start = get_start_sect(bdev);
396         ret = disk->fops->getgeo(bdev, &geo);
397         if (ret)
398                 return ret;
399         if (copy_to_user(argp, &geo, sizeof(geo)))
400                 return -EFAULT;
401         return 0;
402 }
403
404 #ifdef CONFIG_COMPAT
405 struct compat_hd_geometry {
406         unsigned char heads;
407         unsigned char sectors;
408         unsigned short cylinders;
409         u32 start;
410 };
411
412 static int compat_hdio_getgeo(struct block_device *bdev,
413                               struct compat_hd_geometry __user *ugeo)
414 {
415         struct gendisk *disk = bdev->bd_disk;
416         struct hd_geometry geo;
417         int ret;
418
419         if (!ugeo)
420                 return -EINVAL;
421         if (!disk->fops->getgeo)
422                 return -ENOTTY;
423
424         memset(&geo, 0, sizeof(geo));
425         /*
426          * We need to set the startsect first, the driver may
427          * want to override it.
428          */
429         geo.start = get_start_sect(bdev);
430         ret = disk->fops->getgeo(bdev, &geo);
431         if (ret)
432                 return ret;
433
434         ret = copy_to_user(ugeo, &geo, 4);
435         ret |= put_user(geo.start, &ugeo->start);
436         if (ret)
437                 ret = -EFAULT;
438
439         return ret;
440 }
441 #endif
442
443 /* set the logical block size */
444 static int blkdev_bszset(struct block_device *bdev, fmode_t mode,
445                 int __user *argp)
446 {
447         int ret, n;
448
449         if (!capable(CAP_SYS_ADMIN))
450                 return -EACCES;
451         if (!argp)
452                 return -EINVAL;
453         if (get_user(n, argp))
454                 return -EFAULT;
455
456         if (mode & FMODE_EXCL)
457                 return set_blocksize(bdev, n);
458
459         if (IS_ERR(blkdev_get_by_dev(bdev->bd_dev, mode | FMODE_EXCL, &bdev)))
460                 return -EBUSY;
461         ret = set_blocksize(bdev, n);
462         blkdev_put(bdev, mode | FMODE_EXCL);
463
464         return ret;
465 }
466
467 /*
468  * Common commands that are handled the same way on native and compat
469  * user space. Note the separate arg/argp parameters that are needed
470  * to deal with the compat_ptr() conversion.
471  */
472 static int blkdev_common_ioctl(struct block_device *bdev, fmode_t mode,
473                                unsigned int cmd, unsigned long arg,
474                                void __user *argp)
475 {
476         unsigned int max_sectors;
477
478         switch (cmd) {
479         case BLKFLSBUF:
480                 return blkdev_flushbuf(bdev, mode, cmd, arg);
481         case BLKROSET:
482                 return blkdev_roset(bdev, mode, cmd, arg);
483         case BLKDISCARD:
484                 return blk_ioctl_discard(bdev, mode, arg);
485         case BLKSECDISCARD:
486                 return blk_ioctl_secure_erase(bdev, mode, argp);
487         case BLKZEROOUT:
488                 return blk_ioctl_zeroout(bdev, mode, arg);
489         case BLKGETDISKSEQ:
490                 return put_u64(argp, bdev->bd_disk->diskseq);
491         case BLKREPORTZONE:
492                 return blkdev_report_zones_ioctl(bdev, mode, cmd, arg);
493         case BLKRESETZONE:
494         case BLKOPENZONE:
495         case BLKCLOSEZONE:
496         case BLKFINISHZONE:
497                 return blkdev_zone_mgmt_ioctl(bdev, mode, cmd, arg);
498         case BLKGETZONESZ:
499                 return put_uint(argp, bdev_zone_sectors(bdev));
500         case BLKGETNRZONES:
501                 return put_uint(argp, bdev_nr_zones(bdev));
502         case BLKROGET:
503                 return put_int(argp, bdev_read_only(bdev) != 0);
504         case BLKSSZGET: /* get block device logical block size */
505                 return put_int(argp, bdev_logical_block_size(bdev));
506         case BLKPBSZGET: /* get block device physical block size */
507                 return put_uint(argp, bdev_physical_block_size(bdev));
508         case BLKIOMIN:
509                 return put_uint(argp, bdev_io_min(bdev));
510         case BLKIOOPT:
511                 return put_uint(argp, bdev_io_opt(bdev));
512         case BLKALIGNOFF:
513                 return put_int(argp, bdev_alignment_offset(bdev));
514         case BLKDISCARDZEROES:
515                 return put_uint(argp, 0);
516         case BLKSECTGET:
517                 max_sectors = min_t(unsigned int, USHRT_MAX,
518                                     queue_max_sectors(bdev_get_queue(bdev)));
519                 return put_ushort(argp, max_sectors);
520         case BLKROTATIONAL:
521                 return put_ushort(argp, !bdev_nonrot(bdev));
522         case BLKRASET:
523         case BLKFRASET:
524                 if(!capable(CAP_SYS_ADMIN))
525                         return -EACCES;
526                 bdev->bd_disk->bdi->ra_pages = (arg * 512) / PAGE_SIZE;
527                 return 0;
528         case BLKRRPART:
529                 if (!capable(CAP_SYS_ADMIN))
530                         return -EACCES;
531                 if (bdev_is_partition(bdev))
532                         return -EINVAL;
533                 return disk_scan_partitions(bdev->bd_disk, mode);
534         case BLKTRACESTART:
535         case BLKTRACESTOP:
536         case BLKTRACETEARDOWN:
537                 return blk_trace_ioctl(bdev, cmd, argp);
538         case IOC_PR_REGISTER:
539                 return blkdev_pr_register(bdev, argp);
540         case IOC_PR_RESERVE:
541                 return blkdev_pr_reserve(bdev, argp);
542         case IOC_PR_RELEASE:
543                 return blkdev_pr_release(bdev, argp);
544         case IOC_PR_PREEMPT:
545                 return blkdev_pr_preempt(bdev, argp, false);
546         case IOC_PR_PREEMPT_ABORT:
547                 return blkdev_pr_preempt(bdev, argp, true);
548         case IOC_PR_CLEAR:
549                 return blkdev_pr_clear(bdev, argp);
550         default:
551                 return -ENOIOCTLCMD;
552         }
553 }
554
555 /*
556  * Always keep this in sync with compat_blkdev_ioctl()
557  * to handle all incompatible commands in both functions.
558  *
559  * New commands must be compatible and go into blkdev_common_ioctl
560  */
561 long blkdev_ioctl(struct file *file, unsigned cmd, unsigned long arg)
562 {
563         struct block_device *bdev = I_BDEV(file->f_mapping->host);
564         void __user *argp = (void __user *)arg;
565         fmode_t mode = file->f_mode;
566         int ret;
567
568         /*
569          * O_NDELAY can be altered using fcntl(.., F_SETFL, ..), so we have
570          * to updated it before every ioctl.
571          */
572         if (file->f_flags & O_NDELAY)
573                 mode |= FMODE_NDELAY;
574         else
575                 mode &= ~FMODE_NDELAY;
576
577         switch (cmd) {
578         /* These need separate implementations for the data structure */
579         case HDIO_GETGEO:
580                 return blkdev_getgeo(bdev, argp);
581         case BLKPG:
582                 return blkpg_ioctl(bdev, argp);
583
584         /* Compat mode returns 32-bit data instead of 'long' */
585         case BLKRAGET:
586         case BLKFRAGET:
587                 if (!argp)
588                         return -EINVAL;
589                 return put_long(argp,
590                         (bdev->bd_disk->bdi->ra_pages * PAGE_SIZE) / 512);
591         case BLKGETSIZE:
592                 if (bdev_nr_sectors(bdev) > ~0UL)
593                         return -EFBIG;
594                 return put_ulong(argp, bdev_nr_sectors(bdev));
595
596         /* The data is compatible, but the command number is different */
597         case BLKBSZGET: /* get block device soft block size (cf. BLKSSZGET) */
598                 return put_int(argp, block_size(bdev));
599         case BLKBSZSET:
600                 return blkdev_bszset(bdev, mode, argp);
601         case BLKGETSIZE64:
602                 return put_u64(argp, bdev_nr_bytes(bdev));
603
604         /* Incompatible alignment on i386 */
605         case BLKTRACESETUP:
606                 return blk_trace_ioctl(bdev, cmd, argp);
607         default:
608                 break;
609         }
610
611         ret = blkdev_common_ioctl(bdev, mode, cmd, arg, argp);
612         if (ret != -ENOIOCTLCMD)
613                 return ret;
614
615         if (!bdev->bd_disk->fops->ioctl)
616                 return -ENOTTY;
617         return bdev->bd_disk->fops->ioctl(bdev, mode, cmd, arg);
618 }
619
620 #ifdef CONFIG_COMPAT
621
622 #define BLKBSZGET_32            _IOR(0x12, 112, int)
623 #define BLKBSZSET_32            _IOW(0x12, 113, int)
624 #define BLKGETSIZE64_32         _IOR(0x12, 114, int)
625
626 /* Most of the generic ioctls are handled in the normal fallback path.
627    This assumes the blkdev's low level compat_ioctl always returns
628    ENOIOCTLCMD for unknown ioctls. */
629 long compat_blkdev_ioctl(struct file *file, unsigned cmd, unsigned long arg)
630 {
631         int ret;
632         void __user *argp = compat_ptr(arg);
633         struct block_device *bdev = I_BDEV(file->f_mapping->host);
634         struct gendisk *disk = bdev->bd_disk;
635         fmode_t mode = file->f_mode;
636
637         /*
638          * O_NDELAY can be altered using fcntl(.., F_SETFL, ..), so we have
639          * to updated it before every ioctl.
640          */
641         if (file->f_flags & O_NDELAY)
642                 mode |= FMODE_NDELAY;
643         else
644                 mode &= ~FMODE_NDELAY;
645
646         switch (cmd) {
647         /* These need separate implementations for the data structure */
648         case HDIO_GETGEO:
649                 return compat_hdio_getgeo(bdev, argp);
650         case BLKPG:
651                 return compat_blkpg_ioctl(bdev, argp);
652
653         /* Compat mode returns 32-bit data instead of 'long' */
654         case BLKRAGET:
655         case BLKFRAGET:
656                 if (!argp)
657                         return -EINVAL;
658                 return compat_put_long(argp,
659                         (bdev->bd_disk->bdi->ra_pages * PAGE_SIZE) / 512);
660         case BLKGETSIZE:
661                 if (bdev_nr_sectors(bdev) > ~(compat_ulong_t)0)
662                         return -EFBIG;
663                 return compat_put_ulong(argp, bdev_nr_sectors(bdev));
664
665         /* The data is compatible, but the command number is different */
666         case BLKBSZGET_32: /* get the logical block size (cf. BLKSSZGET) */
667                 return put_int(argp, bdev_logical_block_size(bdev));
668         case BLKBSZSET_32:
669                 return blkdev_bszset(bdev, mode, argp);
670         case BLKGETSIZE64_32:
671                 return put_u64(argp, bdev_nr_bytes(bdev));
672
673         /* Incompatible alignment on i386 */
674         case BLKTRACESETUP32:
675                 return blk_trace_ioctl(bdev, cmd, argp);
676         default:
677                 break;
678         }
679
680         ret = blkdev_common_ioctl(bdev, mode, cmd, arg, argp);
681         if (ret == -ENOIOCTLCMD && disk->fops->compat_ioctl)
682                 ret = disk->fops->compat_ioctl(bdev, mode, cmd, arg);
683
684         return ret;
685 }
686 #endif