drm/amdgpu: Prevent race between late signaled fences and GPU reset.

author Andrey Grodzovsky <andrey.grodzovsky@amd.com>

Sat, 18 Jun 2022 04:28:50 +0000 (00:28 -0400)

committer Alex Deucher <alexander.deucher@amd.com>

Tue, 28 Jun 2022 15:24:24 +0000 (11:24 -0400)
author Andrey Grodzovsky <andrey.grodzovsky@amd.com>
Sat, 18 Jun 2022 04:28:50 +0000 (00:28 -0400)
committer Alex Deucher <alexander.deucher@amd.com>
Tue, 28 Jun 2022 15:24:24 +0000 (11:24 -0400)
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c

index f2a4c26..9d2395a 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_device.c
@@ -4606,6 +4606,8 @@ int amdgpu_device_pre_asic_reset(struct amdgpu_device *adev,
                 amdgpu_virt_fini_data_exchange(adev);
         }
  
+       amdgpu_fence_driver_isr_toggle(adev, true);
+
         /* block all schedulers and reset given job's ring */
         for (i = 0; i < AMDGPU_MAX_RINGS; ++i) {
                 struct amdgpu_ring *ring = adev->rings[i];
@@ -4621,6 +4623,8 @@ int amdgpu_device_pre_asic_reset(struct amdgpu_device *adev,
                 amdgpu_fence_driver_force_completion(ring);
         }
  
+       amdgpu_fence_driver_isr_toggle(adev, false);
+
         if (job && job->vm)
                 drm_sched_increase_karma(&job->base);
  
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_fence.c b/drivers/gpu/drm/amd/amdgpu/amdgpu_fence.c

index a9ae3be..c1d04ea 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_fence.c
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_fence.c
@@ -532,6 +532,24 @@ void amdgpu_fence_driver_hw_fini(struct amdgpu_device *adev)
         }
  }
  
+/* Will either stop and flush handlers for amdgpu interrupt or reanble it */
+void amdgpu_fence_driver_isr_toggle(struct amdgpu_device *adev, bool stop)
+{
+       int i;
+
+       for (i = 0; i < AMDGPU_MAX_RINGS; i++) {
+               struct amdgpu_ring *ring = adev->rings[i];
+
+               if (!ring || !ring->fence_drv.initialized || !ring->fence_drv.irq_src)
+                       continue;
+
+               if (stop)
+                       disable_irq(adev->irq.irq);
+               else
+                       enable_irq(adev->irq.irq);
+       }
+}
+
  void amdgpu_fence_driver_sw_fini(struct amdgpu_device *adev)
  {
         unsigned int i, j;
diff --git a/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h b/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h

index 7d89a52..82c178a 100644 (file)
--- a/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h
+++ b/drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h
@@ -143,6 +143,7 @@ signed long amdgpu_fence_wait_polling(struct amdgpu_ring *ring,
                                       uint32_t wait_seq,
                                       signed long timeout);
  unsigned amdgpu_fence_count_emitted(struct amdgpu_ring *ring);
+void amdgpu_fence_driver_isr_toggle(struct amdgpu_device *adev, bool stop);
  
  /*
   * Rings.
author	Andrey Grodzovsky <andrey.grodzovsky@amd.com>
	Sat, 18 Jun 2022 04:28:50 +0000 (00:28 -0400)
committer	Alex Deucher <alexander.deucher@amd.com>
	Tue, 28 Jun 2022 15:24:24 +0000 (11:24 -0400)
drivers/gpu/drm/amd/amdgpu/amdgpu_device.c		patch \| blob \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_fence.c		patch \| blob \| history
drivers/gpu/drm/amd/amdgpu/amdgpu_ring.h		patch \| blob \| history