powerpc: Take in account addition CPU node when building kexec FDT
authorLaurent Dufour <ldufour@linux.ibm.com>
Thu, 10 Nov 2022 18:06:19 +0000 (19:06 +0100)
committerMichael Ellerman <mpe@ellerman.id.au>
Wed, 7 Dec 2022 09:19:04 +0000 (20:19 +1100)
On a system with a large number of CPUs, the creation of the FDT for a
kexec kernel may fail because the allocated FDT is not large enough.

When this happens, such a message is displayed on the console:

  Unable to add ibm,processor-vadd-size property: FDT_ERR_NOSPACE

The property's name may change depending when the buffer overwrite is
detected.

Obviously the created FDT is missing information, and it is expected
that system dump or kexec kernel failed to run properly.

When the FDT is allocated, the size of the FDT the kernel received at
boot time is used and an extra size can be applied. Currently, only
memory added after boot time is taken in account, not the CPU nodes.

The extra size should take in account these additional CPU nodes and
compute the required extra space. To achieve that, the size of a CPU
node, including its subnode is computed once and multiplied by the
number of additional CPU nodes.

The assumption is that the size of the CPU node is _same_ for all the
node, the only variable part should be the name "PowerPC,POWERxx@##"
where "##" may vary a little.

Signed-off-by: Laurent Dufour <ldufour@linux.ibm.com>
[mpe: Don't shadow function name w/variable, minor coding style changes]
Signed-off-by: Michael Ellerman <mpe@ellerman.id.au>
Link: https://lore.kernel.org/r/20221110180619.15796-3-ldufour@linux.ibm.com
arch/powerpc/kexec/file_load_64.c

index 349a781cea0b3fdec4034b6c5ce6dfb512c32337..2500c37c628c6f23517493f9bb9f89dd66a21fcd 100644 (file)
@@ -26,6 +26,7 @@
 #include <asm/firmware.h>
 #include <asm/kexec_ranges.h>
 #include <asm/crashdump-ppc64.h>
+#include <asm/prom.h>
 
 struct umem_info {
        u64 *buf;               /* data buffer for usable-memory property */
@@ -928,6 +929,45 @@ out:
        return ret;
 }
 
+/**
+ * get_cpu_node_size - Compute the size of a CPU node in the FDT.
+ *                     This should be done only once and the value is stored in
+ *                     a static variable.
+ * Returns the max size of a CPU node in the FDT.
+ */
+static unsigned int cpu_node_size(void)
+{
+       static unsigned int size;
+       struct device_node *dn;
+       struct property *pp;
+
+       /*
+        * Don't compute it twice, we are assuming that the per CPU node size
+        * doesn't change during the system's life.
+        */
+       if (size)
+               return size;
+
+       dn = of_find_node_by_type(NULL, "cpu");
+       if (WARN_ON_ONCE(!dn)) {
+               // Unlikely to happen
+               return 0;
+       }
+
+       /*
+        * We compute the sub node size for a CPU node, assuming it
+        * will be the same for all.
+        */
+       size += strlen(dn->name) + 5;
+       for_each_property_of_node(dn, pp) {
+               size += strlen(pp->name);
+               size += pp->length;
+       }
+
+       of_node_put(dn);
+       return size;
+}
+
 /**
  * kexec_extra_fdt_size_ppc64 - Return the estimated additional size needed to
  *                              setup FDT for kexec/kdump kernel.
@@ -937,6 +977,8 @@ out:
  */
 unsigned int kexec_extra_fdt_size_ppc64(struct kimage *image)
 {
+       unsigned int cpu_nodes, extra_size;
+       struct device_node *dn;
        u64 usm_entries;
 
        if (image->type != KEXEC_TYPE_CRASH)
@@ -949,7 +991,22 @@ unsigned int kexec_extra_fdt_size_ppc64(struct kimage *image)
         */
        usm_entries = ((memblock_end_of_DRAM() / drmem_lmb_size()) +
                       (2 * (resource_size(&crashk_res) / drmem_lmb_size())));
-       return (unsigned int)(usm_entries * sizeof(u64));
+
+       extra_size = (unsigned int)(usm_entries * sizeof(u64));
+
+       /*
+        * Get the number of CPU nodes in the current DT. This allows to
+        * reserve places for CPU nodes added since the boot time.
+        */
+       cpu_nodes = 0;
+       for_each_node_by_type(dn, "cpu") {
+               cpu_nodes++;
+       }
+
+       if (cpu_nodes > boot_cpu_node_count)
+               extra_size += (cpu_nodes - boot_cpu_node_count) * cpu_node_size();
+
+       return extra_size;
 }
 
 /**