habanalabs/gaudi2: mark PCIE access error as fatal
authorTomer Tayar <ttayar@habana.ai>
Wed, 20 Jul 2022 17:02:20 +0000 (20:02 +0300)
committerOded Gabbay <ogabbay@kernel.org>
Sun, 18 Sep 2022 10:29:50 +0000 (13:29 +0300)
commit21fc79336b9587fcc251e77246b68b6e20340146
tree864221e079aa6ee381b824bf98adcded51eec7c8
parentf018c54e3de6619c46e33ab1c613761e9fba21d0
habanalabs/gaudi2: mark PCIE access error as fatal

F/W events are enabled in a late phase of the device init, so an event
for a PCIE access error during the init, can be received after the init
is already done and considered as successful.
A resulting device reset, which does the same H/W init, can end
similarly with this event right after the reset is done and considered
as successful, and a loop of this sequence can continue.

To avoid it mark the PCIE access error as a fatal event, so after 2
consecutive events no more resets will be done.

Signed-off-by: Tomer Tayar <ttayar@habana.ai>
Reviewed-by: Oded Gabbay <ogabbay@kernel.org>
Signed-off-by: Oded Gabbay <ogabbay@kernel.org>
drivers/misc/habanalabs/gaudi2/gaudi2.c