afs: Adjust ACK interpretation to try and cope with NAT
authorDavid Howells <dhowells@redhat.com>
Sat, 21 May 2022 07:45:55 +0000 (08:45 +0100)
committerDavid S. Miller <davem@davemloft.net>
Sun, 22 May 2022 20:03:02 +0000 (21:03 +0100)
If a client's address changes, say if it is NAT'd, this can disrupt an in
progress operation.  For most operations, this is not much of a problem,
but StoreData can be different as some servers modify the target file as
the data comes in, so if a store request is disrupted, the file can get
corrupted on the server.

The problem is that the server doesn't recognise packets that come after
the change of address as belonging to the original client and will bounce
them, either by sending an OUT_OF_SEQUENCE ACK to the apparent new call if
the packet number falls within the initial sequence number window of a call
or by sending an EXCEEDS_WINDOW ACK if it falls outside and then aborting
it.  In both cases, firstPacket will be 1 and previousPacket will be 0 in
the ACK information.

Fix this by the following means:

 (1) If a client call receives an EXCEEDS_WINDOW ACK with firstPacket as 1
     and previousPacket as 0, assume this indicates that the server saw the
     incoming packets from a different peer and thus as a different call.
     Fail the call with error -ENETRESET.

 (2) Also fail the call if a similar OUT_OF_SEQUENCE ACK occurs if the
     first packet has been hard-ACK'd.  If it hasn't been hard-ACK'd, the
     ACK packet will cause it to get retransmitted, so the call will just
     be repeated.

 (3) Make afs_select_fileserver() treat -ENETRESET as a straight fail of
     the operation.

 (4) Prioritise the error code over things like -ECONNRESET as the server
     did actually respond.

 (5) Make writeback treat -ENETRESET as a retryable error and make it
     redirty all the pages involved in a write so that the VM will retry.

Note that there is still a circumstance that I can't easily deal with: if
the operation is fully received and processed by the server, but the reply
is lost due to address change.  There's no way to know if the op happened.
We can examine the server, but a conflicting change could have been made by
a third party - and we can't tell the difference.  In such a case, a
message like:

    kAFS: vnode modified {100058:146266} b7->b8 YFS.StoreData64 (op=2646a)

will be logged to dmesg on the next op to touch the file and the client
will reset the inode state, including invalidating clean parts of the
pagecache.

Reported-by: Marc Dionne <marc.dionne@auristor.com>
Signed-off-by: David Howells <dhowells@redhat.com>
cc: linux-afs@lists.infradead.org
Link: http://lists.infradead.org/pipermail/linux-afs/2021-December/004811.html
Signed-off-by: David S. Miller <davem@davemloft.net>
fs/afs/misc.c
fs/afs/rotate.c
fs/afs/write.c
net/rxrpc/input.c

index 1d1a8de..933e67f 100644 (file)
@@ -163,8 +163,11 @@ void afs_prioritise_error(struct afs_error *e, int error, u32 abort_code)
                return;
 
        case -ECONNABORTED:
+               error = afs_abort_to_error(abort_code);
+               fallthrough;
+       case -ENETRESET: /* Responded, but we seem to have changed address */
                e->responded = true;
-               e->error = afs_abort_to_error(abort_code);
+               e->error = error;
                return;
        }
 }
index 79e1a5f..a840c35 100644 (file)
@@ -292,6 +292,10 @@ bool afs_select_fileserver(struct afs_operation *op)
                op->error = error;
                goto iterate_address;
 
+       case -ENETRESET:
+               pr_warn("kAFS: Peer reset %s (op=%x)\n",
+                       op->type ? op->type->name : "???", op->debug_id);
+               fallthrough;
        case -ECONNRESET:
                _debug("call reset");
                op->error = error;
index 4763132..c1bc52a 100644 (file)
@@ -636,6 +636,7 @@ static ssize_t afs_write_back_from_locked_folio(struct address_space *mapping,
        case -EKEYEXPIRED:
        case -EKEYREJECTED:
        case -EKEYREVOKED:
+       case -ENETRESET:
                afs_redirty_pages(wbc, mapping, start, len);
                mapping_set_error(mapping, ret);
                break;
index 853b869..16c0af4 100644 (file)
@@ -903,6 +903,33 @@ static void rxrpc_input_ack(struct rxrpc_call *call, struct sk_buff *skb)
                                  rxrpc_propose_ack_respond_to_ack);
        }
 
+       /* If we get an EXCEEDS_WINDOW ACK from the server, it probably
+        * indicates that the client address changed due to NAT.  The server
+        * lost the call because it switched to a different peer.
+        */
+       if (unlikely(buf.ack.reason == RXRPC_ACK_EXCEEDS_WINDOW) &&
+           first_soft_ack == 1 &&
+           prev_pkt == 0 &&
+           rxrpc_is_client_call(call)) {
+               rxrpc_set_call_completion(call, RXRPC_CALL_REMOTELY_ABORTED,
+                                         0, -ENETRESET);
+               return;
+       }
+
+       /* If we get an OUT_OF_SEQUENCE ACK from the server, that can also
+        * indicate a change of address.  However, we can retransmit the call
+        * if we still have it buffered to the beginning.
+        */
+       if (unlikely(buf.ack.reason == RXRPC_ACK_OUT_OF_SEQUENCE) &&
+           first_soft_ack == 1 &&
+           prev_pkt == 0 &&
+           call->tx_hard_ack == 0 &&
+           rxrpc_is_client_call(call)) {
+               rxrpc_set_call_completion(call, RXRPC_CALL_REMOTELY_ABORTED,
+                                         0, -ENETRESET);
+               return;
+       }
+
        /* Discard any out-of-order or duplicate ACKs (outside lock). */
        if (!rxrpc_is_ack_valid(call, first_soft_ack, prev_pkt)) {
                trace_rxrpc_rx_discard_ack(call->debug_id, ack_serial,