powerpc/pseries: Handle UE event for memcpy_mcsafe
authorGanesh Goudar <ganeshgr@linux.ibm.com>
Thu, 26 Mar 2020 18:49:16 +0000 (00:19 +0530)
committerMichael Ellerman <mpe@ellerman.id.au>
Fri, 27 Mar 2020 03:59:35 +0000 (14:59 +1100)
memcpy_mcsafe has been implemented for power machines which is used
by pmem infrastructure, so that an UE encountered during memcpy from
pmem devices would not result in panic instead a right error code
is returned. The implementation expects machine check handler to ignore
the event and set nip to continue the execution from fixup code.

Appropriate changes are already made to powernv machine check handler,
make similar changes to pseries machine check handler to ignore the
the event and set nip to continue execution at the fixup entry if we
hit UE at an instruction with a fixup entry.

while we are at it, have a common function which searches the exception
table entry and updates nip with fixup address, and any future common
changes can be made in this function that are valid for both architectures.

powernv changes are made by
commit 895e3dceeb97 ("powerpc/mce: Handle UE event for memcpy_mcsafe")

Reviewed-by: Mahesh Salgaonkar <mahesh@linux.vnet.ibm.com>
Reviewed-by: Santosh S <santosh@fossix.org>
Signed-off-by: Ganesh Goudar <ganeshgr@linux.ibm.com>
Signed-off-by: Michael Ellerman <mpe@ellerman.id.au>
Link: https://lore.kernel.org/r/20200326184916.31172-1-ganeshgr@linux.ibm.com
arch/powerpc/include/asm/mce.h
arch/powerpc/kernel/mce.c
arch/powerpc/kernel/mce_power.c
arch/powerpc/platforms/pseries/ras.c

index 6a6ddaabdb34db066cea341d52babd6b830440fb..376a395daf329977176aa5cd465221c35c62ebe6 100644 (file)
@@ -218,6 +218,8 @@ extern void machine_check_queue_event(void);
 extern void machine_check_print_event_info(struct machine_check_event *evt,
                                           bool user_mode, bool in_guest);
 unsigned long addr_to_pfn(struct pt_regs *regs, unsigned long addr);
+extern void mce_common_process_ue(struct pt_regs *regs,
+                                 struct mce_error_info *mce_err);
 #ifdef CONFIG_PPC_BOOK3S_64
 void flush_and_reload_slb(void);
 #endif /* CONFIG_PPC_BOOK3S_64 */
index 34c1001e9e8bf1f9f40724b20f4ce2f2235bb055..8077b5fb18a79e160f4a4ace3df847e1418a13bd 100644 (file)
@@ -15,6 +15,7 @@
 #include <linux/percpu.h>
 #include <linux/export.h>
 #include <linux/irq_work.h>
+#include <linux/extable.h>
 
 #include <asm/machdep.h>
 #include <asm/mce.h>
@@ -251,6 +252,19 @@ void machine_check_queue_event(void)
        /* Queue irq work to process this event later. */
        irq_work_queue(&mce_event_process_work);
 }
+
+void mce_common_process_ue(struct pt_regs *regs,
+                          struct mce_error_info *mce_err)
+{
+       const struct exception_table_entry *entry;
+
+       entry = search_kernel_exception_table(regs->nip);
+       if (entry) {
+               mce_err->ignore_event = true;
+               regs->nip = extable_fixup(entry);
+       }
+}
+
 /*
  * process pending MCE event from the mce event queue. This function will be
  * called during syscall exit.
index 1cbf7f1a4e3d899c6008d12f9d6f683adb3906bf..067b094bfeff5e9256e5310db77ce46116c4146f 100644 (file)
@@ -579,14 +579,10 @@ static long mce_handle_ue_error(struct pt_regs *regs,
                                struct mce_error_info *mce_err)
 {
        long handled = 0;
-       const struct exception_table_entry *entry;
 
-       entry = search_kernel_exception_table(regs->nip);
-       if (entry) {
-               mce_err->ignore_event = true;
-               regs->nip = extable_fixup(entry);
+       mce_common_process_ue(regs, mce_err);
+       if (mce_err->ignore_event)
                return 1;
-       }
 
        /*
         * On specific SCOM read via MMIO we may get a machine check
index 1d7f973c647b37b91b0af7da699fd68d1a6150d0..aa6208c8d4f096525e8bea141d6ceda5d432bc29 100644 (file)
@@ -558,6 +558,9 @@ static int mce_handle_error(struct pt_regs *regs, struct rtas_error_log *errp)
        switch (mce_log->error_type) {
        case MC_ERROR_TYPE_UE:
                mce_err.error_type = MCE_ERROR_TYPE_UE;
+               mce_common_process_ue(regs, &mce_err);
+               if (mce_err.ignore_event)
+                       disposition = RTAS_DISP_FULLY_RECOVERED;
                switch (err_sub_type) {
                case MC_ERROR_UE_IFETCH:
                        mce_err.u.ue_error_type = MCE_UE_ERROR_IFETCH;