drm/amdgpu: Fix mutex lock from atomic context.
authorAndrey Grodzovsky <andrey.grodzovsky@amd.com>
Tue, 10 Sep 2019 19:34:16 +0000 (15:34 -0400)
committerAlex Deucher <alexander.deucher@amd.com>
Mon, 16 Sep 2019 15:09:59 +0000 (10:09 -0500)
Problem:
amdgpu_ras_reserve_bad_pages was moved to amdgpu_ras_reset_gpu
because writing to EEPROM during ASIC reset was unstable.
But for ERREVENT_ATHUB_INTERRUPT amdgpu_ras_reset_gpu is called
directly from ISR context and so locking is not allowed. Also it's
irrelevant for this partilcular interrupt as this is generic RAS
interrupt and not memory errors specific.

Fix:
Avoid calling amdgpu_ras_reserve_bad_pages if not in task context.

Signed-off-by: Andrey Grodzovsky <andrey.grodzovsky@amd.com>
Reviewed-by: Tao Zhou <tao.zhou1@amd.com>
Reviewed-by: Guchun Chen <guchun.chen@amd.com>
Signed-off-by: Alex Deucher <alexander.deucher@amd.com>
drivers/gpu/drm/amd/amdgpu/amdgpu_ras.h

index 012034d2ae0625565e1e9bd71441a168e9a21558..dd5da3c6327e287e3b190bc06830575d3d7a5ab7 100644 (file)
@@ -504,7 +504,9 @@ static inline int amdgpu_ras_reset_gpu(struct amdgpu_device *adev,
        /* save bad page to eeprom before gpu reset,
         * i2c may be unstable in gpu reset
         */
-       amdgpu_ras_reserve_bad_pages(adev);
+       if (in_task())
+               amdgpu_ras_reserve_bad_pages(adev);
+
        if (atomic_cmpxchg(&ras->in_recovery, 0, 1) == 0)
                schedule_work(&ras->recovery_work);
        return 0;