x86/MCE/AMD, EDAC/mce_amd: Decode UMC_V2 ECC errors
authorYazen Ghannam <yazen.ghannam@amd.com>
Mon, 15 May 2023 11:35:34 +0000 (11:35 +0000)
committerBorislav Petkov (AMD) <bp@alien8.de>
Mon, 5 Jun 2023 10:27:11 +0000 (12:27 +0200)
commitc35977b00fa76ce5f3fe9afdb9cffda970c943d5
treed49e990c397f8a53059af5213ba32d1db05fd4ed
parentf5e87cd5114e9c6d15a12922f26bdd6e24e508ee
x86/MCE/AMD, EDAC/mce_amd: Decode UMC_V2 ECC errors

The MI200 (Aldebaran) series of devices introduced a new SMCA bank type
for Unified Memory Controllers. The MCE subsystem already has support
for this new type. The MCE decoder module will decode the common MCA
error information for the new bank type, but it will not pass the
information to the AMD64 EDAC module for detailed memory error decoding.

Have the MCE decoder module recognize the new bank type as an SMCA UMC
memory error and pass the MCA information to AMD64 EDAC.

Signed-off-by: Yazen Ghannam <yazen.ghannam@amd.com>
Co-developed-by: Muralidhara M K <muralidhara.mk@amd.com>
Signed-off-by: Muralidhara M K <muralidhara.mk@amd.com>
Signed-off-by: Borislav Petkov (AMD) <bp@alien8.de>
Link: https://lore.kernel.org/r/20230515113537.1052146-3-muralimk@amd.com
arch/x86/kernel/cpu/mce/amd.c
drivers/edac/mce_amd.c