KVM: selftests: Add ucall pool based implementation
authorPeter Gonda <pgonda@google.com>
Thu, 6 Oct 2022 00:34:09 +0000 (00:34 +0000)
committerSean Christopherson <seanjc@google.com>
Thu, 17 Nov 2022 00:58:53 +0000 (16:58 -0800)
To play nice with guests whose stack memory is encrypted, e.g. AMD SEV,
introduce a new "ucall pool" implementation that passes the ucall struct
via dedicated memory (which can be mapped shared, a.k.a. as plain text).

Because not all architectures have access to the vCPU index in the guest,
use a bitmap with atomic accesses to track which entries in the pool are
free/used.  A list+lock could also work in theory, but synchronizing the
individual pointers to the guest would be a mess.

Note, there's no need to rewalk the bitmap to ensure success.  If all
vCPUs are simply allocating, success is guaranteed because there are
enough entries for all vCPUs.  If one or more vCPUs are freeing and then
reallocating, success is guaranteed because vCPUs _always_ walk the
bitmap from 0=>N; if vCPU frees an entry and then wins a race to
re-allocate, then either it will consume the entry it just freed (bit is
the first free bit), or the losing vCPU is guaranteed to see the freed
bit (winner consumes an earlier bit, which the loser hasn't yet visited).

Reviewed-by: Andrew Jones <andrew.jones@linux.dev>
Signed-off-by: Peter Gonda <pgonda@google.com>
Co-developed-by: Sean Christopherson <seanjc@google.com>
Signed-off-by: Sean Christopherson <seanjc@google.com>
Link: https://lore.kernel.org/r/20221006003409.649993-8-seanjc@google.com
tools/testing/selftests/kvm/include/ucall_common.h
tools/testing/selftests/kvm/lib/aarch64/ucall.c
tools/testing/selftests/kvm/lib/riscv/ucall.c
tools/testing/selftests/kvm/lib/s390x/ucall.c
tools/testing/selftests/kvm/lib/ucall_common.c
tools/testing/selftests/kvm/lib/x86_64/ucall.c

index 2662a4352a8c0a118821d34d8aad2c08b94ccb2d..bdd373189a77788e3d604a84d1108d68a6a77982 100644 (file)
@@ -22,6 +22,9 @@ enum {
 struct ucall {
        uint64_t cmd;
        uint64_t args[UCALL_MAX_ARGS];
+
+       /* Host virtual address of this struct. */
+       struct ucall *hva;
 };
 
 void ucall_arch_init(struct kvm_vm *vm, vm_paddr_t mmio_gpa);
@@ -30,11 +33,7 @@ void *ucall_arch_get_ucall(struct kvm_vcpu *vcpu);
 
 void ucall(uint64_t cmd, int nargs, ...);
 uint64_t get_ucall(struct kvm_vcpu *vcpu, struct ucall *uc);
-
-static inline void ucall_init(struct kvm_vm *vm, vm_paddr_t mmio_gpa)
-{
-       ucall_arch_init(vm, mmio_gpa);
-}
+void ucall_init(struct kvm_vm *vm, vm_paddr_t mmio_gpa);
 
 #define GUEST_SYNC_ARGS(stage, arg1, arg2, arg3, arg4) \
                                ucall(UCALL_SYNC, 6, "hello", stage, arg1, arg2, arg3, arg4)
index 21d73afcb14fb1c8055e1e0d4769696c7694e132..562c16dfbb002322951f10820d68624edebc94e6 100644 (file)
@@ -32,12 +32,9 @@ void *ucall_arch_get_ucall(struct kvm_vcpu *vcpu)
 
        if (run->exit_reason == KVM_EXIT_MMIO &&
            run->mmio.phys_addr == vcpu->vm->ucall_mmio_addr) {
-               vm_vaddr_t gva;
-
-               TEST_ASSERT(run->mmio.is_write && run->mmio.len == 8,
+               TEST_ASSERT(run->mmio.is_write && run->mmio.len == sizeof(uint64_t),
                            "Unexpected ucall exit mmio address access");
-               memcpy(&gva, run->mmio.data, sizeof(gva));
-               return addr_gva2hva(vcpu->vm, gva);
+               return (void *)(*((uint64_t *)run->mmio.data));
        }
 
        return NULL;
index 78acdb084ab0fbb9310e7de0052d9338cc6b3002..9a3476a2dfca47cf5d538543f06f28c78bad594c 100644 (file)
@@ -55,7 +55,7 @@ void *ucall_arch_get_ucall(struct kvm_vcpu *vcpu)
            run->riscv_sbi.extension_id == KVM_RISCV_SELFTESTS_SBI_EXT) {
                switch (run->riscv_sbi.function_id) {
                case KVM_RISCV_SELFTESTS_SBI_UCALL:
-                       return addr_gva2hva(vcpu->vm, run->riscv_sbi.args[0]);
+                       return (void *)run->riscv_sbi.args[0];
                case KVM_RISCV_SELFTESTS_SBI_UNEXP:
                        vcpu_dump(stderr, vcpu, 2);
                        TEST_ASSERT(0, "Unexpected trap taken by guest");
index cbee520a26f2adff08e3a7dccb3756e48771e492..a7f02dc372cf7eed0e38339abdcfbbe479eb8839 100644 (file)
@@ -26,7 +26,7 @@ void *ucall_arch_get_ucall(struct kvm_vcpu *vcpu)
            (run->s390_sieic.ipb >> 16) == 0x501) {
                int reg = run->s390_sieic.ipa & 0xf;
 
-               return addr_gva2hva(vcpu->vm, run->s.regs.gprs[reg]);
+               return (void *)run->s.regs.gprs[reg];
        }
        return NULL;
 }
index ced48086074631eacb54a8c7f90d94229058054a..fcae96461e460ea2092c3ae6d0709626679f13f7 100644 (file)
@@ -1,22 +1,86 @@
 // SPDX-License-Identifier: GPL-2.0-only
 #include "kvm_util.h"
+#include "linux/types.h"
+#include "linux/bitmap.h"
+#include "linux/atomic.h"
+
+struct ucall_header {
+       DECLARE_BITMAP(in_use, KVM_MAX_VCPUS);
+       struct ucall ucalls[KVM_MAX_VCPUS];
+};
+
+/*
+ * ucall_pool holds per-VM values (global data is duplicated by each VM), it
+ * must not be accessed from host code.
+ */
+static struct ucall_header *ucall_pool;
+
+void ucall_init(struct kvm_vm *vm, vm_paddr_t mmio_gpa)
+{
+       struct ucall_header *hdr;
+       struct ucall *uc;
+       vm_vaddr_t vaddr;
+       int i;
+
+       vaddr = vm_vaddr_alloc(vm, sizeof(*hdr), KVM_UTIL_MIN_VADDR);
+       hdr = (struct ucall_header *)addr_gva2hva(vm, vaddr);
+       memset(hdr, 0, sizeof(*hdr));
+
+       for (i = 0; i < KVM_MAX_VCPUS; ++i) {
+               uc = &hdr->ucalls[i];
+               uc->hva = uc;
+       }
+
+       write_guest_global(vm, ucall_pool, (struct ucall_header *)vaddr);
+
+       ucall_arch_init(vm, mmio_gpa);
+}
+
+static struct ucall *ucall_alloc(void)
+{
+       struct ucall *uc;
+       int i;
+
+       GUEST_ASSERT(ucall_pool);
+
+       for (i = 0; i < KVM_MAX_VCPUS; ++i) {
+               if (!atomic_test_and_set_bit(i, ucall_pool->in_use)) {
+                       uc = &ucall_pool->ucalls[i];
+                       memset(uc->args, 0, sizeof(uc->args));
+                       return uc;
+               }
+       }
+
+       GUEST_ASSERT(0);
+       return NULL;
+}
+
+static void ucall_free(struct ucall *uc)
+{
+       /* Beware, here be pointer arithmetic.  */
+       clear_bit(uc - ucall_pool->ucalls, ucall_pool->in_use);
+}
 
 void ucall(uint64_t cmd, int nargs, ...)
 {
-       struct ucall uc = {};
+       struct ucall *uc;
        va_list va;
        int i;
 
-       WRITE_ONCE(uc.cmd, cmd);
+       uc = ucall_alloc();
+
+       WRITE_ONCE(uc->cmd, cmd);
 
        nargs = min(nargs, UCALL_MAX_ARGS);
 
        va_start(va, nargs);
        for (i = 0; i < nargs; ++i)
-               WRITE_ONCE(uc.args[i], va_arg(va, uint64_t));
+               WRITE_ONCE(uc->args[i], va_arg(va, uint64_t));
        va_end(va);
 
-       ucall_arch_do_ucall((vm_vaddr_t)&uc);
+       ucall_arch_do_ucall((vm_vaddr_t)uc->hva);
+
+       ucall_free(uc);
 }
 
 uint64_t get_ucall(struct kvm_vcpu *vcpu, struct ucall *uc)
index eb8bf55b359a526c5e43b319fa244722849ee96c..4d41dc63cc9edfeed1efca4c22a90c62e6fbf91d 100644 (file)
@@ -26,7 +26,7 @@ void *ucall_arch_get_ucall(struct kvm_vcpu *vcpu)
                struct kvm_regs regs;
 
                vcpu_regs_get(vcpu, &regs);
-               return addr_gva2hva(vcpu->vm, regs.rdi);
+               return (void *)regs.rdi;
        }
        return NULL;
 }