Merge tag 'docs-5.14' of git://git.lwn.net/linux
authorLinus Torvalds <torvalds@linux-foundation.org>
Mon, 28 Jun 2021 23:53:05 +0000 (16:53 -0700)
committerLinus Torvalds <torvalds@linux-foundation.org>
Mon, 28 Jun 2021 23:53:05 +0000 (16:53 -0700)
Pull documentation updates from Jonathan Corbet:
 "This was a reasonably active cycle for documentation; this includes:

   - Some kernel-doc cleanups. That script is still regex onslaught from
     hell, but it has gotten a little better.

   - Improvements to the checkpatch docs, which are also used by the
     tool itself.

   - A major update to the pathname lookup documentation.

   - Elimination of :doc: markup, since our automarkup magic can create
     references from filenames without all the extra noise.

   - The flurry of Chinese translation activity continues.

  Plus, of course, the usual collection of updates, typo fixes, and
  warning fixes"

* tag 'docs-5.14' of git://git.lwn.net/linux: (115 commits)
  docs: path-lookup: use bare function() rather than literals
  docs: path-lookup: update symlink description
  docs: path-lookup: update get_link() ->follow_link description
  docs: path-lookup: update WALK_GET, WALK_PUT desc
  docs: path-lookup: no get_link()
  docs: path-lookup: update i_op->put_link and cookie description
  docs: path-lookup: i_op->follow_link replaced with i_op->get_link
  docs: path-lookup: Add macro name to symlink limit description
  docs: path-lookup: remove filename_mountpoint
  docs: path-lookup: update do_last() part
  docs: path-lookup: update path_mountpoint() part
  docs: path-lookup: update path_to_nameidata() part
  docs: path-lookup: update follow_managed() part
  docs: Makefile: Use CONFIG_SHELL not SHELL
  docs: Take a little noise out of the build process
  docs: x86: avoid using ReST :doc:`foo` markup
  docs: virt: kvm: s390-pv-boot.rst: avoid using ReST :doc:`foo` markup
  docs: userspace-api: landlock.rst: avoid using ReST :doc:`foo` markup
  docs: trace: ftrace.rst: avoid using ReST :doc:`foo` markup
  docs: trace: coresight: coresight.rst: avoid using ReST :doc:`foo` markup
  ...

1  2 
Documentation/admin-guide/kernel-parameters.txt
Documentation/admin-guide/sysctl/kernel.rst
Documentation/virt/kvm/api.rst
Documentation/virt/kvm/vcpu-requests.rst
include/linux/device.h
samples/kprobes/kprobe_example.c

  
        noclflush       [BUGS=X86] Don't use the CLFLUSH instruction
  
 -      nodelayacct     [KNL] Disable per-task delay accounting
 +      delayacct       [KNL] Enable per-task delay accounting
  
        nodsp           [SH] Disable hardware DSP at boot time.
  
  
        nr_uarts=       [SERIAL] maximum number of UARTs to be registered.
  
+       numa=off        [KNL, ARM64, PPC, RISCV, SPARC, X86] Disable NUMA, Only
+                       set up a single NUMA node spanning all memory.
        numa_balancing= [KNL,ARM64,PPC,RISCV,S390,X86] Enable or disable automatic
                        NUMA balancing.
                        Allowed values are enable and disable
                        Reserves a hole at the top of the kernel virtual
                        address space.
  
 -      reservelow=     [X86]
 -                      Format: nn[K]
 -                      Set the amount of memory to reserve for BIOS at
 -                      the bottom of the address space.
 -
        reset_devices   [KNL] Force drivers to reset the underlying device
                        during initialization.
  
                                  exception. Default behavior is by #AC if
                                  both features are enabled in hardware.
  
 +                      ratelimit:N -
 +                                Set system wide rate limit to N bus locks
 +                                per second for bus lock detection.
 +                                0 < N <= 1000.
 +
 +                                N/A for split lock detection.
 +
 +
                        If an #AC exception is hit in the kernel or in
                        firmware (i.e. not while executing in user mode)
                        the kernel will oops in either "warn" or "fatal"
@@@ -9,7 -9,8 +9,8 @@@ Copyright (c) 1998, 1999,  Rik van Rie
  
  Copyright (c) 2009,        Shen Feng<shen@cn.fujitsu.com>
  
- For general info and legal blurb, please look in :doc:`index`.
+ For general info and legal blurb, please look in
+ Documentation/admin-guide/sysctl/index.rst.
  
  ------------------------------------------------------------------------------
  
@@@ -54,7 -55,7 +55,7 @@@ free space valid for 30 seconds
  acpi_video_flags
  ================
  
- See :doc:`/power/video`. This allows the video resume mode to be set,
+ See Documentation/power/video.rst. This allows the video resume mode to be set,
  in a similar fashion to the ``acpi_sleep`` kernel parameter, by
  combining the following values:
  
@@@ -89,7 -90,7 +90,7 @@@ is 0x15 and the full version number is 
  the value 340 = 0x154.
  
  See the ``type_of_loader`` and ``ext_loader_type`` fields in
:doc:`/x86/boot` for additional information.
Documentation/x86/boot.rst for additional information.
  
  
  bootloader_version (x86 only)
@@@ -99,7 -100,7 +100,7 @@@ The complete bootloader version number
  file will contain the value 564 = 0x234.
  
  See the ``type_of_loader`` and ``ext_loader_ver`` fields in
:doc:`/x86/boot` for additional information.
Documentation/x86/boot.rst for additional information.
  
  
  bpf_stats_enabled
@@@ -269,7 -270,7 +270,7 @@@ see the ``hostname(1)`` man page
  firmware_config
  ===============
  
- See :doc:`/driver-api/firmware/fallback-mechanisms`.
+ See Documentation/driver-api/firmware/fallback-mechanisms.rst.
  
  The entries in this directory allow the firmware loader helper
  fallback to be controlled:
@@@ -297,7 -298,7 +298,7 @@@ crashes and outputting them to a seria
  ftrace_enabled, stack_tracer_enabled
  ====================================
  
- See :doc:`/trace/ftrace`.
+ See Documentation/trace/ftrace.rst.
  
  
  hardlockup_all_cpu_backtrace
@@@ -325,7 -326,7 +326,7 @@@ when a hard lockup is detected
  1 Panic on hard lockup.
  = ===========================
  
- See :doc:`/admin-guide/lockup-watchdogs` for more information.
+ See Documentation/admin-guide/lockup-watchdogs.rst for more information.
  This can also be set using the nmi_watchdog kernel parameter.
  
  
@@@ -333,7 -334,12 +334,12 @@@ hotplu
  =======
  
  Path for the hotplug policy agent.
- Default value is "``/sbin/hotplug``".
+ Default value is ``CONFIG_UEVENT_HELPER_PATH``, which in turn defaults
+ to the empty string.
+ This file only exists when ``CONFIG_UEVENT_HELPER`` is enabled. Most
+ modern systems rely exclusively on the netlink-based uevent source and
+ don't need this.
  
  
  hung_task_all_cpu_backtrace
@@@ -483,11 -489,10 +489,11 @@@ modprob
  ========
  
  The full path to the usermode helper for autoloading kernel modules,
 -by default "/sbin/modprobe".  This binary is executed when the kernel
 -requests a module.  For example, if userspace passes an unknown
 -filesystem type to mount(), then the kernel will automatically request
 -the corresponding filesystem module by executing this usermode helper.
 +by default ``CONFIG_MODPROBE_PATH``, which in turn defaults to
 +"/sbin/modprobe".  This binary is executed when the kernel requests a
 +module.  For example, if userspace passes an unknown filesystem type
 +to mount(), then the kernel will automatically request the
 +corresponding filesystem module by executing this usermode helper.
  This usermode helper should insert the needed module into the kernel.
  
  This sysctl only affects module autoloading.  It has no effect on the
@@@ -582,7 -587,8 +588,8 @@@ in a KVM virtual machine. This default 
  
     nmi_watchdog=1
  
- to the guest kernel command line (see :doc:`/admin-guide/kernel-parameters`).
+ to the guest kernel command line (see
+ Documentation/admin-guide/kernel-parameters.rst).
  
  
  numa_balancing
@@@ -1067,7 -1073,7 +1074,7 @@@ that support this feature
  real-root-dev
  =============
  
- See :doc:`/admin-guide/initrd`.
+ See Documentation/admin-guide/initrd.rst.
  
  
  reboot-cmd (SPARC only)
@@@ -1088,13 -1094,6 +1095,13 @@@ Model available). If your platform happ
  requirements for EAS but you do not want to use it, change
  this value to 0.
  
 +task_delayacct
 +===============
 +
 +Enables/disables task delay accounting (see
 +:doc:`accounting/delay-accounting.rst`). Enabling this feature incurs
 +a small amount of overhead in the scheduler but is useful for debugging
 +and performance tuning. It is required by some tools such as iotop.
  
  sched_schedstats
  ================
@@@ -1161,7 -1160,7 +1168,7 @@@ will take effect
  seccomp
  =======
  
- See :doc:`/userspace-api/seccomp_filter`.
+ See Documentation/userspace-api/seccomp_filter.rst.
  
  
  sg-big-buff
@@@ -1332,7 -1331,7 +1339,7 @@@ the boot PROM
  sysrq
  =====
  
- See :doc:`/admin-guide/sysrq`.
+ See Documentation/admin-guide/sysrq.rst.
  
  
  tainted
@@@ -1362,15 -1361,16 +1369,16 @@@ ORed together. The letters are seen in 
  131072  `(T)`  The kernel was built with the struct randomization plugin
  ======  =====  ==============================================================
  
- See :doc:`/admin-guide/tainted-kernels` for more information.
+ See Documentation/admin-guide/tainted-kernels.rst for more information.
  
  Note:
    writes to this sysctl interface will fail with ``EINVAL`` if the kernel is
    booted with the command line option ``panic_on_taint=<bitmask>,nousertaint``
    and any of the ORed together values being written to ``tainted`` match with
    the bitmask declared on panic_on_taint.
-   See :doc:`/admin-guide/kernel-parameters` for more details on that particular
-   kernel command line option and its optional ``nousertaint`` switch.
+   See Documentation/admin-guide/kernel-parameters.rst for more details on
+   that particular kernel command line option and its optional
+   ``nousertaint`` switch.
  
  threads-max
  ===========
@@@ -1394,7 -1394,7 +1402,7 @@@ If a value outside of this range is wri
  traceoff_on_warning
  ===================
  
- When set, disables tracing (see :doc:`/trace/ftrace`) when a
+ When set, disables tracing (see Documentation/trace/ftrace.rst) when a
  ``WARN()`` is hit.
  
  
@@@ -1414,8 -1414,8 +1422,8 @@@ will send them to printk() again
  
  This only works if the kernel was booted with ``tp_printk`` enabled.
  
- See :doc:`/admin-guide/kernel-parameters` and
:doc:`/trace/boottime-trace`.
+ See Documentation/admin-guide/kernel-parameters.rst and
Documentation/trace/boottime-trace.rst.
  
  
  .. _unaligned-dump-stack:
@@@ -1465,22 -1465,11 +1473,22 @@@ unprivileged_bpf_disable
  =========================
  
  Writing 1 to this entry will disable unprivileged calls to ``bpf()``;
 -once disabled, calling ``bpf()`` without ``CAP_SYS_ADMIN`` will return
 -``-EPERM``.
 +once disabled, calling ``bpf()`` without ``CAP_SYS_ADMIN`` or ``CAP_BPF``
 +will return ``-EPERM``. Once set to 1, this can't be cleared from the
 +running kernel anymore.
 +
 +Writing 2 to this entry will also disable unprivileged calls to ``bpf()``,
 +however, an admin can still change this setting later on, if needed, by
 +writing 0 or 1 to this entry.
  
 -Once set, this can't be cleared.
 +If ``BPF_UNPRIV_DEFAULT_OFF`` is enabled in the kernel config, then this
 +entry will default to 2 instead of 0.
  
 += =============================================================
 +0 Unprivileged calls to ``bpf()`` are enabled
 +1 Unprivileged calls to ``bpf()`` are disabled without recovery
 +2 Unprivileged calls to ``bpf()`` are disabled
 += =============================================================
  
  watchdog
  ========
@@@ -688,14 -688,9 +688,14 @@@ MSRs that have been set successfully
  Defines the vcpu responses to the cpuid instruction.  Applications
  should use the KVM_SET_CPUID2 ioctl if available.
  
 -Note, when this IOCTL fails, KVM gives no guarantees that previous valid CPUID
 -configuration (if there is) is not corrupted. Userspace can get a copy of the
 -resulting CPUID configuration through KVM_GET_CPUID2 in case.
 +Caveat emptor:
 +  - If this IOCTL fails, KVM gives no guarantees that previous valid CPUID
 +    configuration (if there is) is not corrupted. Userspace can get a copy
 +    of the resulting CPUID configuration through KVM_GET_CPUID2 in case.
 +  - Using KVM_SET_CPUID{,2} after KVM_RUN, i.e. changing the guest vCPU model
 +    after running the guest, may cause guest instability.
 +  - Using heterogeneous CPUID configurations, modulo APIC IDs, topology, etc...
 +    may cause guest instability.
  
  ::
  
@@@ -4808,7 -4803,7 +4808,7 @@@ KVM_PV_VM_VERIF
  4.126 KVM_X86_SET_MSR_FILTER
  ----------------------------
  
 -:Capability: KVM_X86_SET_MSR_FILTER
 +:Capability: KVM_CAP_X86_MSR_FILTER
  :Architectures: x86
  :Type: vm ioctl
  :Parameters: struct kvm_msr_filter
@@@ -5039,260 -5034,6 +5039,260 @@@ see KVM_XEN_VCPU_SET_ATTR above
  The KVM_XEN_VCPU_ATTR_TYPE_RUNSTATE_ADJUST type may not be used
  with the KVM_XEN_VCPU_GET_ATTR ioctl.
  
 +4.130 KVM_ARM_MTE_COPY_TAGS
 +---------------------------
 +
 +:Capability: KVM_CAP_ARM_MTE
 +:Architectures: arm64
 +:Type: vm ioctl
 +:Parameters: struct kvm_arm_copy_mte_tags
 +:Returns: number of bytes copied, < 0 on error (-EINVAL for incorrect
 +          arguments, -EFAULT if memory cannot be accessed).
 +
 +::
 +
 +  struct kvm_arm_copy_mte_tags {
 +      __u64 guest_ipa;
 +      __u64 length;
 +      void __user *addr;
 +      __u64 flags;
 +      __u64 reserved[2];
 +  };
 +
 +Copies Memory Tagging Extension (MTE) tags to/from guest tag memory. The
 +``guest_ipa`` and ``length`` fields must be ``PAGE_SIZE`` aligned. The ``addr``
 +field must point to a buffer which the tags will be copied to or from.
 +
 +``flags`` specifies the direction of copy, either ``KVM_ARM_TAGS_TO_GUEST`` or
 +``KVM_ARM_TAGS_FROM_GUEST``.
 +
 +The size of the buffer to store the tags is ``(length / 16)`` bytes
 +(granules in MTE are 16 bytes long). Each byte contains a single tag
 +value. This matches the format of ``PTRACE_PEEKMTETAGS`` and
 +``PTRACE_POKEMTETAGS``.
 +
 +If an error occurs before any data is copied then a negative error code is
 +returned. If some tags have been copied before an error occurs then the number
 +of bytes successfully copied is returned. If the call completes successfully
 +then ``length`` is returned.
 +
 +4.131 KVM_GET_SREGS2
 +------------------
 +
 +:Capability: KVM_CAP_SREGS2
 +:Architectures: x86
 +:Type: vcpu ioctl
 +:Parameters: struct kvm_sregs2 (out)
 +:Returns: 0 on success, -1 on error
 +
 +Reads special registers from the vcpu.
 +This ioctl (when supported) replaces the KVM_GET_SREGS.
 +
 +::
 +
 +struct kvm_sregs2 {
 +      /* out (KVM_GET_SREGS2) / in (KVM_SET_SREGS2) */
 +      struct kvm_segment cs, ds, es, fs, gs, ss;
 +      struct kvm_segment tr, ldt;
 +      struct kvm_dtable gdt, idt;
 +      __u64 cr0, cr2, cr3, cr4, cr8;
 +      __u64 efer;
 +      __u64 apic_base;
 +      __u64 flags;
 +      __u64 pdptrs[4];
 +};
 +
 +flags values for ``kvm_sregs2``:
 +
 +``KVM_SREGS2_FLAGS_PDPTRS_VALID``
 +
 +  Indicates thats the struct contain valid PDPTR values.
 +
 +
 +4.132 KVM_SET_SREGS2
 +------------------
 +
 +:Capability: KVM_CAP_SREGS2
 +:Architectures: x86
 +:Type: vcpu ioctl
 +:Parameters: struct kvm_sregs2 (in)
 +:Returns: 0 on success, -1 on error
 +
 +Writes special registers into the vcpu.
 +See KVM_GET_SREGS2 for the data structures.
 +This ioctl (when supported) replaces the KVM_SET_SREGS.
 +
 +4.133 KVM_GET_STATS_FD
 +----------------------
 +
 +:Capability: KVM_CAP_STATS_BINARY_FD
 +:Architectures: all
 +:Type: vm ioctl, vcpu ioctl
 +:Parameters: none
 +:Returns: statistics file descriptor on success, < 0 on error
 +
 +Errors:
 +
 +  ======     ======================================================
 +  ENOMEM     if the fd could not be created due to lack of memory
 +  EMFILE     if the number of opened files exceeds the limit
 +  ======     ======================================================
 +
 +The returned file descriptor can be used to read VM/vCPU statistics data in
 +binary format. The data in the file descriptor consists of four blocks
 +organized as follows:
 +
 ++-------------+
 +|   Header    |
 ++-------------+
 +|  id string  |
 ++-------------+
 +| Descriptors |
 ++-------------+
 +| Stats Data  |
 ++-------------+
 +
 +Apart from the header starting at offset 0, please be aware that it is
 +not guaranteed that the four blocks are adjacent or in the above order;
 +the offsets of the id, descriptors and data blocks are found in the
 +header.  However, all four blocks are aligned to 64 bit offsets in the
 +file and they do not overlap.
 +
 +All blocks except the data block are immutable.  Userspace can read them
 +only one time after retrieving the file descriptor, and then use ``pread`` or
 +``lseek`` to read the statistics repeatedly.
 +
 +All data is in system endianness.
 +
 +The format of the header is as follows::
 +
 +      struct kvm_stats_header {
 +              __u32 flags;
 +              __u32 name_size;
 +              __u32 num_desc;
 +              __u32 id_offset;
 +              __u32 desc_offset;
 +              __u32 data_offset;
 +      };
 +
 +The ``flags`` field is not used at the moment. It is always read as 0.
 +
 +The ``name_size`` field is the size (in byte) of the statistics name string
 +(including trailing '\0') which is contained in the "id string" block and
 +appended at the end of every descriptor.
 +
 +The ``num_desc`` field is the number of descriptors that are included in the
 +descriptor block.  (The actual number of values in the data block may be
 +larger, since each descriptor may comprise more than one value).
 +
 +The ``id_offset`` field is the offset of the id string from the start of the
 +file indicated by the file descriptor. It is a multiple of 8.
 +
 +The ``desc_offset`` field is the offset of the Descriptors block from the start
 +of the file indicated by the file descriptor. It is a multiple of 8.
 +
 +The ``data_offset`` field is the offset of the Stats Data block from the start
 +of the file indicated by the file descriptor. It is a multiple of 8.
 +
 +The id string block contains a string which identifies the file descriptor on
 +which KVM_GET_STATS_FD was invoked.  The size of the block, including the
 +trailing ``'\0'``, is indicated by the ``name_size`` field in the header.
 +
 +The descriptors block is only needed to be read once for the lifetime of the
 +file descriptor contains a sequence of ``struct kvm_stats_desc``, each followed
 +by a string of size ``name_size``.
 +
 +      #define KVM_STATS_TYPE_SHIFT            0
 +      #define KVM_STATS_TYPE_MASK             (0xF << KVM_STATS_TYPE_SHIFT)
 +      #define KVM_STATS_TYPE_CUMULATIVE       (0x0 << KVM_STATS_TYPE_SHIFT)
 +      #define KVM_STATS_TYPE_INSTANT          (0x1 << KVM_STATS_TYPE_SHIFT)
 +      #define KVM_STATS_TYPE_PEAK             (0x2 << KVM_STATS_TYPE_SHIFT)
 +
 +      #define KVM_STATS_UNIT_SHIFT            4
 +      #define KVM_STATS_UNIT_MASK             (0xF << KVM_STATS_UNIT_SHIFT)
 +      #define KVM_STATS_UNIT_NONE             (0x0 << KVM_STATS_UNIT_SHIFT)
 +      #define KVM_STATS_UNIT_BYTES            (0x1 << KVM_STATS_UNIT_SHIFT)
 +      #define KVM_STATS_UNIT_SECONDS          (0x2 << KVM_STATS_UNIT_SHIFT)
 +      #define KVM_STATS_UNIT_CYCLES           (0x3 << KVM_STATS_UNIT_SHIFT)
 +
 +      #define KVM_STATS_BASE_SHIFT            8
 +      #define KVM_STATS_BASE_MASK             (0xF << KVM_STATS_BASE_SHIFT)
 +      #define KVM_STATS_BASE_POW10            (0x0 << KVM_STATS_BASE_SHIFT)
 +      #define KVM_STATS_BASE_POW2             (0x1 << KVM_STATS_BASE_SHIFT)
 +
 +      struct kvm_stats_desc {
 +              __u32 flags;
 +              __s16 exponent;
 +              __u16 size;
 +              __u32 offset;
 +              __u32 unused;
 +              char name[];
 +      };
 +
 +The ``flags`` field contains the type and unit of the statistics data described
 +by this descriptor. Its endianness is CPU native.
 +The following flags are supported:
 +
 +Bits 0-3 of ``flags`` encode the type:
 +  * ``KVM_STATS_TYPE_CUMULATIVE``
 +    The statistics data is cumulative. The value of data can only be increased.
 +    Most of the counters used in KVM are of this type.
 +    The corresponding ``size`` field for this type is always 1.
 +    All cumulative statistics data are read/write.
 +  * ``KVM_STATS_TYPE_INSTANT``
 +    The statistics data is instantaneous. Its value can be increased or
 +    decreased. This type is usually used as a measurement of some resources,
 +    like the number of dirty pages, the number of large pages, etc.
 +    All instant statistics are read only.
 +    The corresponding ``size`` field for this type is always 1.
 +  * ``KVM_STATS_TYPE_PEAK``
 +    The statistics data is peak. The value of data can only be increased, and
 +    represents a peak value for a measurement, for example the maximum number
 +    of items in a hash table bucket, the longest time waited and so on.
 +    The corresponding ``size`` field for this type is always 1.
 +
 +Bits 4-7 of ``flags`` encode the unit:
 +  * ``KVM_STATS_UNIT_NONE``
 +    There is no unit for the value of statistics data. This usually means that
 +    the value is a simple counter of an event.
 +  * ``KVM_STATS_UNIT_BYTES``
 +    It indicates that the statistics data is used to measure memory size, in the
 +    unit of Byte, KiByte, MiByte, GiByte, etc. The unit of the data is
 +    determined by the ``exponent`` field in the descriptor.
 +  * ``KVM_STATS_UNIT_SECONDS``
 +    It indicates that the statistics data is used to measure time or latency.
 +  * ``KVM_STATS_UNIT_CYCLES``
 +    It indicates that the statistics data is used to measure CPU clock cycles.
 +
 +Bits 8-11 of ``flags``, together with ``exponent``, encode the scale of the
 +unit:
 +  * ``KVM_STATS_BASE_POW10``
 +    The scale is based on power of 10. It is used for measurement of time and
 +    CPU clock cycles.  For example, an exponent of -9 can be used with
 +    ``KVM_STATS_UNIT_SECONDS`` to express that the unit is nanoseconds.
 +  * ``KVM_STATS_BASE_POW2``
 +    The scale is based on power of 2. It is used for measurement of memory size.
 +    For example, an exponent of 20 can be used with ``KVM_STATS_UNIT_BYTES`` to
 +    express that the unit is MiB.
 +
 +The ``size`` field is the number of values of this statistics data. Its
 +value is usually 1 for most of simple statistics. 1 means it contains an
 +unsigned 64bit data.
 +
 +The ``offset`` field is the offset from the start of Data Block to the start of
 +the corresponding statistics data.
 +
 +The ``unused`` field is reserved for future support for other types of
 +statistics data, like log/linear histogram. Its value is always 0 for the types
 +defined above.
 +
 +The ``name`` field is the name string of the statistics data. The name string
 +starts at the end of ``struct kvm_stats_desc``.  The maximum length including
 +the trailing ``'\0'``, is indicated by ``name_size`` in the header.
 +
 +The Stats Data block contains an array of 64-bit values in the same order
 +as the descriptors in Descriptors block.
 +
  5. The kvm_run structure
  ========================
  
@@@ -6582,7 -6323,6 +6582,7 @@@ KVM_RUN_BUS_LOCK flag is used to distin
  This capability can be used to check / enable 2nd DAWR feature provided
  by POWER10 processor.
  
 +
  7.24 KVM_CAP_VM_COPY_ENC_CONTEXT_FROM
  -------------------------------------
  
@@@ -6620,68 -6360,8 +6620,68 @@@ system fingerprint.  To prevent userspa
  by running an enclave in a VM, KVM prevents access to privileged attributes by
  default.
  
- See Documentation/x86/sgx/2.Kernel-internals.rst for more details.
+ See Documentation/x86/sgx.rst for more details.
  
 +7.26 KVM_CAP_PPC_RPT_INVALIDATE
 +-------------------------------
 +
 +:Capability: KVM_CAP_PPC_RPT_INVALIDATE
 +:Architectures: ppc
 +:Type: vm
 +
 +This capability indicates that the kernel is capable of handling
 +H_RPT_INVALIDATE hcall.
 +
 +In order to enable the use of H_RPT_INVALIDATE in the guest,
 +user space might have to advertise it for the guest. For example,
 +IBM pSeries (sPAPR) guest starts using it if "hcall-rpt-invalidate" is
 +present in the "ibm,hypertas-functions" device-tree property.
 +
 +This capability is enabled for hypervisors on platforms like POWER9
 +that support radix MMU.
 +
 +7.27 KVM_CAP_EXIT_ON_EMULATION_FAILURE
 +--------------------------------------
 +
 +:Architectures: x86
 +:Parameters: args[0] whether the feature should be enabled or not
 +
 +When this capability is enabled, an emulation failure will result in an exit
 +to userspace with KVM_INTERNAL_ERROR (except when the emulator was invoked
 +to handle a VMware backdoor instruction). Furthermore, KVM will now provide up
 +to 15 instruction bytes for any exit to userspace resulting from an emulation
 +failure.  When these exits to userspace occur use the emulation_failure struct
 +instead of the internal struct.  They both have the same layout, but the
 +emulation_failure struct matches the content better.  It also explicitly
 +defines the 'flags' field which is used to describe the fields in the struct
 +that are valid (ie: if KVM_INTERNAL_ERROR_EMULATION_FLAG_INSTRUCTION_BYTES is
 +set in the 'flags' field then both 'insn_size' and 'insn_bytes' have valid data
 +in them.)
 +
 +7.28 KVM_CAP_ARM_MTE
 +--------------------
 +
 +:Architectures: arm64
 +:Parameters: none
 +
 +This capability indicates that KVM (and the hardware) supports exposing the
 +Memory Tagging Extensions (MTE) to the guest. It must also be enabled by the
 +VMM before creating any VCPUs to allow the guest access. Note that MTE is only
 +available to a guest running in AArch64 mode and enabling this capability will
 +cause attempts to create AArch32 VCPUs to fail.
 +
 +When enabled the guest is able to access tags associated with any memory given
 +to the guest. KVM will ensure that the tags are maintained during swap or
 +hibernation of the host; however the VMM needs to manually save/restore the
 +tags as appropriate if the VM is migrated.
 +
 +When this capability is enabled all memory in memslots must be mapped as
 +not-shareable (no MAP_SHARED), attempts to create a memslot with a
 +MAP_SHARED mmap will result in an -EINVAL return.
 +
 +When enabled the VMM may make use of the ``KVM_ARM_MTE_COPY_TAGS`` ioctl to
 +perform a bulk copy of tags to/from the guest.
 +
  8. Other capabilities.
  ======================
  
@@@ -7035,7 -6715,7 +7035,7 @@@ accesses that would usually trigger a #
  instead get bounced to user space through the KVM_EXIT_X86_RDMSR and
  KVM_EXIT_X86_WRMSR exit notifications.
  
 -8.27 KVM_X86_SET_MSR_FILTER
 +8.27 KVM_CAP_X86_MSR_FILTER
  ---------------------------
  
  :Architectures: x86
@@@ -7211,33 -6891,3 +7211,33 @@@ This capability is always enabled
  This capability indicates that the KVM virtual PTP service is
  supported in the host. A VMM can check whether the service is
  available to the guest on migration.
 +
 +8.33 KVM_CAP_HYPERV_ENFORCE_CPUID
 +-----------------------------
 +
 +Architectures: x86
 +
 +When enabled, KVM will disable emulated Hyper-V features provided to the
 +guest according to the bits Hyper-V CPUID feature leaves. Otherwise, all
 +currently implmented Hyper-V features are provided unconditionally when
 +Hyper-V identification is set in the HYPERV_CPUID_INTERFACE (0x40000001)
 +leaf.
 +
 +8.34 KVM_CAP_EXIT_HYPERCALL
 +---------------------------
 +
 +:Capability: KVM_CAP_EXIT_HYPERCALL
 +:Architectures: x86
 +:Type: vm
 +
 +This capability, if enabled, will cause KVM to exit to userspace
 +with KVM_EXIT_HYPERCALL exit reason to process some hypercalls.
 +
 +Calling KVM_CHECK_EXTENSION for this capability will return a bitmask
 +of hypercalls that can be configured to exit to userspace.
 +Right now, the only such hypercall is KVM_HC_MAP_GPA_RANGE.
 +
 +The argument to KVM_ENABLE_CAP is also a bitmask, and must be a subset
 +of the result of KVM_CHECK_EXTENSION.  KVM will forward to userspace
 +the hypercalls whose corresponding bit is in the argument, and return
 +ENOSYS for the others.
@@@ -118,12 -118,10 +118,12 @@@ KVM_REQ_MMU_RELOA
    necessary to inform each VCPU to completely refresh the tables.  This
    request is used for that.
  
 -KVM_REQ_PENDING_TIMER
 +KVM_REQ_UNBLOCK
  
 -  This request may be made from a timer handler run on the host on behalf
 -  of a VCPU.  It informs the VCPU thread to inject a timer interrupt.
 +  This request informs the vCPU to exit kvm_vcpu_block.  It is used for
 +  example from timer handlers that run on the host on behalf of a vCPU,
 +  or in order to update the interrupt routing and ensure that assigned
 +  devices will wake up the vCPU.
  
  KVM_REQ_UNHALT
  
@@@ -304,6 -302,6 +304,6 @@@ VCPU returns from the call
  References
  ==========
  
- .. [atomic-ops] Documentation/core-api/atomic_ops.rst
+ .. [atomic-ops] Documentation/atomic_bitops.txt and Documentation/atomic_t.txt
  .. [memory-barriers] Documentation/memory-barriers.txt
  .. [lwn-mb] https://lwn.net/Articles/573436/
diff --combined include/linux/device.h
@@@ -399,7 -399,7 +399,7 @@@ struct dev_links_info 
   *            along with subsystem-level and driver-level callbacks.
   * @em_pd:    device's energy model performance domain
   * @pins:     For device pin management.
-  *            See Documentation/driver-api/pinctl.rst for details.
+  *            See Documentation/driver-api/pin-control.rst for details.
   * @msi_list: Hosts MSI descriptors
   * @msi_domain: The generic MSI domain this device is using.
   * @numa_node:        NUMA node this device is close to.
@@@ -570,7 -570,7 +570,7 @@@ struct device 
   * @flags: Link flags.
   * @rpm_active: Whether or not the consumer device is runtime-PM-active.
   * @kref: Count repeated addition of the same link.
 - * @rcu_head: An RCU head to use for deferred execution of SRCU callbacks.
 + * @rm_work: Work structure used for removing the link.
   * @supplier_preactivated: Supplier has been made active before consumer probe.
   */
  struct device_link {
        u32 flags;
        refcount_t rpm_active;
        struct kref kref;
 -#ifdef CONFIG_SRCU
 -      struct rcu_head rcu_head;
 -#endif
 +      struct work_struct rm_work;
        bool supplier_preactivated; /* Owned by consumer probe. */
  };
  
@@@ -10,6 -10,8 +10,8 @@@
   * whenever kernel_clone() is invoked to create a new process.
   */
  
+ #define pr_fmt(fmt) "%s: " fmt, __func__
  #include <linux/kernel.h>
  #include <linux/module.h>
  #include <linux/kprobes.h>
@@@ -27,32 -29,31 +29,31 @@@ static struct kprobe kp = 
  static int __kprobes handler_pre(struct kprobe *p, struct pt_regs *regs)
  {
  #ifdef CONFIG_X86
-       pr_info("<%s> pre_handler: p->addr = 0x%p, ip = %lx, flags = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, ip = %lx, flags = 0x%lx\n",
                p->symbol_name, p->addr, regs->ip, regs->flags);
  #endif
  #ifdef CONFIG_PPC
-       pr_info("<%s> pre_handler: p->addr = 0x%p, nip = 0x%lx, msr = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, nip = 0x%lx, msr = 0x%lx\n",
                p->symbol_name, p->addr, regs->nip, regs->msr);
  #endif
  #ifdef CONFIG_MIPS
-       pr_info("<%s> pre_handler: p->addr = 0x%p, epc = 0x%lx, status = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, epc = 0x%lx, status = 0x%lx\n",
                p->symbol_name, p->addr, regs->cp0_epc, regs->cp0_status);
  #endif
  #ifdef CONFIG_ARM64
-       pr_info("<%s> pre_handler: p->addr = 0x%p, pc = 0x%lx,"
-                       " pstate = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, pc = 0x%lx, pstate = 0x%lx\n",
                p->symbol_name, p->addr, (long)regs->pc, (long)regs->pstate);
  #endif
  #ifdef CONFIG_ARM
-       pr_info("<%s> pre_handler: p->addr = 0x%p, pc = 0x%lx, cpsr = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, pc = 0x%lx, cpsr = 0x%lx\n",
                p->symbol_name, p->addr, (long)regs->ARM_pc, (long)regs->ARM_cpsr);
  #endif
  #ifdef CONFIG_RISCV
-       pr_info("<%s> pre_handler: p->addr = 0x%p, pc = 0x%lx, status = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, pc = 0x%lx, status = 0x%lx\n",
                p->symbol_name, p->addr, regs->epc, regs->status);
  #endif
  #ifdef CONFIG_S390
-       pr_info("<%s> pre_handler: p->addr, 0x%p, ip = 0x%lx, flags = 0x%lx\n",
+       pr_info("<%s> p->addr, 0x%p, ip = 0x%lx, flags = 0x%lx\n",
                p->symbol_name, p->addr, regs->psw.addr, regs->flags);
  #endif
  
@@@ -65,40 -66,55 +66,40 @@@ static void __kprobes handler_post(stru
                                unsigned long flags)
  {
  #ifdef CONFIG_X86
-       pr_info("<%s> post_handler: p->addr = 0x%p, flags = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, flags = 0x%lx\n",
                p->symbol_name, p->addr, regs->flags);
  #endif
  #ifdef CONFIG_PPC
-       pr_info("<%s> post_handler: p->addr = 0x%p, msr = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, msr = 0x%lx\n",
                p->symbol_name, p->addr, regs->msr);
  #endif
  #ifdef CONFIG_MIPS
-       pr_info("<%s> post_handler: p->addr = 0x%p, status = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, status = 0x%lx\n",
                p->symbol_name, p->addr, regs->cp0_status);
  #endif
  #ifdef CONFIG_ARM64
-       pr_info("<%s> post_handler: p->addr = 0x%p, pstate = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, pstate = 0x%lx\n",
                p->symbol_name, p->addr, (long)regs->pstate);
  #endif
  #ifdef CONFIG_ARM
-       pr_info("<%s> post_handler: p->addr = 0x%p, cpsr = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, cpsr = 0x%lx\n",
                p->symbol_name, p->addr, (long)regs->ARM_cpsr);
  #endif
  #ifdef CONFIG_RISCV
-       pr_info("<%s> post_handler: p->addr = 0x%p, status = 0x%lx\n",
+       pr_info("<%s> p->addr = 0x%p, status = 0x%lx\n",
                p->symbol_name, p->addr, regs->status);
  #endif
  #ifdef CONFIG_S390
-       pr_info("<%s> pre_handler: p->addr, 0x%p, flags = 0x%lx\n",
+       pr_info("<%s> p->addr, 0x%p, flags = 0x%lx\n",
                p->symbol_name, p->addr, regs->flags);
  #endif
  }
  
 -/*
 - * fault_handler: this is called if an exception is generated for any
 - * instruction within the pre- or post-handler, or when Kprobes
 - * single-steps the probed instruction.
 - */
 -static int handler_fault(struct kprobe *p, struct pt_regs *regs, int trapnr)
 -{
 -      pr_info("p->addr = 0x%p, trap #%d\n", p->addr, trapnr);
 -      /* Return 0 because we don't handle the fault. */
 -      return 0;
 -}
 -/* NOKPROBE_SYMBOL() is also available */
 -NOKPROBE_SYMBOL(handler_fault);
 -
  static int __init kprobe_init(void)
  {
        int ret;
        kp.pre_handler = handler_pre;
        kp.post_handler = handler_post;
 -      kp.fault_handler = handler_fault;
  
        ret = register_kprobe(&kp);
        if (ret < 0) {