net: mana: Fix doorbell out of order violation and avoid unnecessary doorbell rings
authorLong Li <longli@microsoft.com>
Fri, 9 Aug 2024 15:58:58 +0000 (08:58 -0700)
committerPaolo Abeni <pabeni@redhat.com>
Tue, 13 Aug 2024 11:09:54 +0000 (13:09 +0200)
After napi_complete_done() is called when NAPI is polling in the current
process context, another NAPI may be scheduled and start running in
softirq on another CPU and may ring the doorbell before the current CPU
does. When combined with unnecessary rings when there is no need to arm
the CQ, it triggers error paths in the hardware.

This patch fixes this by calling napi_complete_done() after doorbell
rings. It limits the number of unnecessary rings when there is
no need to arm. MANA hardware specifies that there must be one doorbell
ring every 8 CQ wraparounds. This driver guarantees one doorbell ring as
soon as the number of consumed CQEs exceeds 4 CQ wraparounds. In practical
workloads, the 4 CQ wraparounds proves to be big enough that it rarely
exceeds this limit before all the napi weight is consumed.

To implement this, add a per-CQ counter cq->work_done_since_doorbell,
and make sure the CQ is armed as soon as passing 4 wraparounds of the CQ.

Cc: stable@vger.kernel.org
Fixes: e1b5683ff62e ("net: mana: Move NAPI from EQ to CQ")
Reviewed-by: Haiyang Zhang <haiyangz@microsoft.com>
Signed-off-by: Long Li <longli@microsoft.com>
Link: https://patch.msgid.link/1723219138-29887-1-git-send-email-longli@linuxonhyperv.com
Signed-off-by: Paolo Abeni <pabeni@redhat.com>
drivers/net/ethernet/microsoft/mana/mana_en.c
include/net/mana/mana.h

index ae717d06e66f046f018ee819b64f3a6e415c6541..39f56973746d7f70bc5f666f2e4678398fa5cb8b 100644 (file)
@@ -1792,7 +1792,6 @@ static void mana_poll_rx_cq(struct mana_cq *cq)
 static int mana_cq_handler(void *context, struct gdma_queue *gdma_queue)
 {
        struct mana_cq *cq = context;
-       u8 arm_bit;
        int w;
 
        WARN_ON_ONCE(cq->gdma_cq != gdma_queue);
@@ -1803,16 +1802,23 @@ static int mana_cq_handler(void *context, struct gdma_queue *gdma_queue)
                mana_poll_tx_cq(cq);
 
        w = cq->work_done;
-
-       if (w < cq->budget &&
-           napi_complete_done(&cq->napi, w)) {
-               arm_bit = SET_ARM_BIT;
-       } else {
-               arm_bit = 0;
+       cq->work_done_since_doorbell += w;
+
+       if (w < cq->budget) {
+               mana_gd_ring_cq(gdma_queue, SET_ARM_BIT);
+               cq->work_done_since_doorbell = 0;
+               napi_complete_done(&cq->napi, w);
+       } else if (cq->work_done_since_doorbell >
+                  cq->gdma_cq->queue_size / COMP_ENTRY_SIZE * 4) {
+               /* MANA hardware requires at least one doorbell ring every 8
+                * wraparounds of CQ even if there is no need to arm the CQ.
+                * This driver rings the doorbell as soon as we have exceeded
+                * 4 wraparounds.
+                */
+               mana_gd_ring_cq(gdma_queue, 0);
+               cq->work_done_since_doorbell = 0;
        }
 
-       mana_gd_ring_cq(gdma_queue, arm_bit);
-
        return w;
 }
 
index 6439fd8b437b66ac2f704fe11cbb25c86fd525b6..7caa334f48880e500e0f889de9561ae724e5ddc7 100644 (file)
@@ -275,6 +275,7 @@ struct mana_cq {
        /* NAPI data */
        struct napi_struct napi;
        int work_done;
+       int work_done_since_doorbell;
        int budget;
 };