bpf: always allocate at least 16 bytes for setsockopt hook

author Stanislav Fomichev <sdf@google.com>

Mon, 29 Jul 2019 21:51:10 +0000 (14:51 -0700)

committer Alexei Starovoitov <ast@kernel.org>

Thu, 1 Aug 2019 20:55:52 +0000 (13:55 -0700)
author Stanislav Fomichev <sdf@google.com>
Mon, 29 Jul 2019 21:51:10 +0000 (14:51 -0700)
committer Alexei Starovoitov <ast@kernel.org>
Thu, 1 Aug 2019 20:55:52 +0000 (13:55 -0700)
diff --git a/kernel/bpf/cgroup.c b/kernel/bpf/cgroup.c

index 0a00eaca6fae652e50f7d2261237cf9992502938..6a6a154cfa7b80838bbf6b9d5a4a3ff005f570c8 100644 (file)
--- a/kernel/bpf/cgroup.c
+++ b/kernel/bpf/cgroup.c
@@ -964,7 +964,6 @@ static int sockopt_alloc_buf(struct bpf_sockopt_kern *ctx, int max_optlen)
                 return -ENOMEM;
  
         ctx->optval_end = ctx->optval + max_optlen;
-       ctx->optlen = max_optlen;
  
         return 0;
  }
@@ -984,7 +983,7 @@ int __cgroup_bpf_run_filter_setsockopt(struct sock *sk, int *level,
                 .level = *level,
                 .optname = *optname,
         };
-       int ret;
+       int ret, max_optlen;
  
         /* Opportunistic check to see whether we have any BPF program
          * attached to the hook so we don't waste time allocating
@@ -994,10 +993,18 @@ int __cgroup_bpf_run_filter_setsockopt(struct sock *sk, int *level,
             __cgroup_bpf_prog_array_is_empty(cgrp, BPF_CGROUP_SETSOCKOPT))
                 return 0;
  
-       ret = sockopt_alloc_buf(&ctx, *optlen);
+       /* Allocate a bit more than the initial user buffer for
+        * BPF program. The canonical use case is overriding
+        * TCP_CONGESTION(nv) to TCP_CONGESTION(cubic).
+        */
+       max_optlen = max_t(int, 16, *optlen);
+
+       ret = sockopt_alloc_buf(&ctx, max_optlen);
         if (ret)
                 return ret;
  
+       ctx.optlen = *optlen;
+
         if (copy_from_user(ctx.optval, optval, *optlen) != 0) {
                 ret = -EFAULT;
                 goto out;
@@ -1016,7 +1023,7 @@ int __cgroup_bpf_run_filter_setsockopt(struct sock *sk, int *level,
         if (ctx.optlen == -1) {
                 /* optlen set to -1, bypass kernel */
                 ret = 1;
-       } else if (ctx.optlen > *optlen || ctx.optlen < -1) {
+       } else if (ctx.optlen > max_optlen || ctx.optlen < -1) {
                 /* optlen is out of bounds */
                 ret = -EFAULT;
         } else {
@@ -1063,6 +1070,8 @@ int __cgroup_bpf_run_filter_getsockopt(struct sock *sk, int level,
         if (ret)
                 return ret;
  
+       ctx.optlen = max_optlen;
+
         if (!retval) {
                 /* If kernel getsockopt finished successfully,
                  * copy whatever was returned to the user back
author	Stanislav Fomichev <sdf@google.com>
	Mon, 29 Jul 2019 21:51:10 +0000 (14:51 -0700)
committer	Alexei Starovoitov <ast@kernel.org>
	Thu, 1 Aug 2019 20:55:52 +0000 (13:55 -0700)