net/mlx5e: Extend encap entry with reference counter
authorVlad Buslov <vladbu@mellanox.com>
Sun, 3 Jun 2018 17:31:47 +0000 (20:31 +0300)
committerSaeed Mahameed <saeedm@mellanox.com>
Fri, 9 Aug 2019 21:54:10 +0000 (14:54 -0700)
List of flows attached to encap entry is used as implicit reference
counter (encap entry is deallocated when list becomes free) and as a
mechanism to obtain encap entry that flow is attached to (through list
head). This is not safe when concurrent modification of list of flows
attached to encap entry is possible. Proper atomic reference counter is
required to support concurrent access.

As a preparation for extending encap with reference counting, extract code
that lookups and deletes encap entry into standalone put/get helpers. In
order to remove this dependency on external locking, extend encap entry
with reference counter to manage its lifetime and extend flow structure
with direct pointer to encap entry that flow is attached to.

Signed-off-by: Vlad Buslov <vladbu@mellanox.com>
Reviewed-by: Jianbo Liu <jianbol@mellanox.com>
Reviewed-by: Roi Dayan <roid@mellanox.com>
Signed-off-by: Saeed Mahameed <saeedm@mellanox.com>
drivers/net/ethernet/mellanox/mlx5/core/en_rep.c
drivers/net/ethernet/mellanox/mlx5/core/en_rep.h
drivers/net/ethernet/mellanox/mlx5/core/en_tc.c
drivers/net/ethernet/mellanox/mlx5/core/en_tc.h

index b7f113e996e5422a0d4a526b0a08e4e146930c4a..cd957ff4e207a14ddbd64d89e7bfa4258683f00f 100644 (file)
@@ -613,12 +613,17 @@ static void mlx5e_rep_neigh_update(struct work_struct *work)
        neigh_connected = (nud_state & NUD_VALID) && !dead;
 
        list_for_each_entry(e, &nhe->encap_list, encap_list) {
+               if (!mlx5e_encap_take(e))
+                       continue;
+
                encap_connected = !!(e->flags & MLX5_ENCAP_ENTRY_VALID);
                priv = netdev_priv(e->out_dev);
 
                if (encap_connected != neigh_connected ||
                    !ether_addr_equal(e->h_dest, ha))
                        mlx5e_rep_update_flows(priv, e, neigh_connected, ha);
+
+               mlx5e_encap_put(priv, e);
        }
        mlx5e_rep_neigh_entry_release(nhe);
        rtnl_unlock();
index 43eeebe9c8d2d3b1fc0d7b6d23d5dbdd6dd050a2..2e970d0729bea40ae940b1e8450af8035683a163 100644 (file)
@@ -164,6 +164,7 @@ struct mlx5e_encap_entry {
        u8 flags;
        char *encap_header;
        int encap_size;
+       refcount_t refcnt;
 };
 
 struct mlx5e_rep_sq {
index fcaf9ab9e373c77e02057bf0578b2139d8a7bfcb..4e378200a9d26cc4711a6aa3bf3e5367a7716a72 100644 (file)
@@ -103,6 +103,7 @@ enum {
  *        container_of(helper item, containing struct type, helper field[index])
  */
 struct encap_flow_item {
+       struct mlx5e_encap_entry *e; /* attached encap instance */
        struct list_head list;
        int index;
 };
@@ -1433,8 +1434,11 @@ void mlx5e_tc_update_neigh_used_value(struct mlx5e_neigh_hash_entry *nhe)
 
        list_for_each_entry(e, &nhe->encap_list, encap_list) {
                struct encap_flow_item *efi, *tmp;
-               if (!(e->flags & MLX5_ENCAP_ENTRY_VALID))
+
+               if (!(e->flags & MLX5_ENCAP_ENTRY_VALID) ||
+                   !mlx5e_encap_take(e))
                        continue;
+
                list_for_each_entry_safe(efi, tmp, &e->flows, list) {
                        flow = container_of(efi, struct mlx5e_tc_flow,
                                            encaps[efi->index]);
@@ -1453,6 +1457,8 @@ void mlx5e_tc_update_neigh_used_value(struct mlx5e_neigh_hash_entry *nhe)
 
                        mlx5e_flow_put(netdev_priv(e->out_dev), flow);
                }
+
+               mlx5e_encap_put(netdev_priv(e->out_dev), e);
                if (neigh_used)
                        break;
        }
@@ -1472,29 +1478,33 @@ void mlx5e_tc_update_neigh_used_value(struct mlx5e_neigh_hash_entry *nhe)
        }
 }
 
+void mlx5e_encap_put(struct mlx5e_priv *priv, struct mlx5e_encap_entry *e)
+{
+       if (!refcount_dec_and_test(&e->refcnt))
+               return;
+
+       WARN_ON(!list_empty(&e->flows));
+       mlx5e_rep_encap_entry_detach(netdev_priv(e->out_dev), e);
+
+       if (e->flags & MLX5_ENCAP_ENTRY_VALID)
+               mlx5_packet_reformat_dealloc(priv->mdev, e->encap_id);
+
+       hash_del_rcu(&e->encap_hlist);
+       kfree(e->encap_header);
+       kfree(e);
+}
+
 static void mlx5e_detach_encap(struct mlx5e_priv *priv,
                               struct mlx5e_tc_flow *flow, int out_index)
 {
-       struct list_head *next = flow->encaps[out_index].list.next;
-
        /* flow wasn't fully initialized */
-       if (list_empty(&flow->encaps[out_index].list))
+       if (!flow->encaps[out_index].e)
                return;
 
        list_del(&flow->encaps[out_index].list);
-       if (list_empty(next)) {
-               struct mlx5e_encap_entry *e;
-
-               e = list_entry(next, struct mlx5e_encap_entry, flows);
-               mlx5e_rep_encap_entry_detach(netdev_priv(e->out_dev), e);
 
-               if (e->flags & MLX5_ENCAP_ENTRY_VALID)
-                       mlx5_packet_reformat_dealloc(priv->mdev, e->encap_id);
-
-               hash_del_rcu(&e->encap_hlist);
-               kfree(e->encap_header);
-               kfree(e);
-       }
+       mlx5e_encap_put(priv, flow->encaps[out_index].e);
+       flow->encaps[out_index].e = NULL;
 }
 
 static void __mlx5e_tc_del_fdb_peer_flow(struct mlx5e_tc_flow *flow)
@@ -2817,6 +2827,31 @@ static bool is_merged_eswitch_dev(struct mlx5e_priv *priv,
 
 
 
+bool mlx5e_encap_take(struct mlx5e_encap_entry *e)
+{
+       return refcount_inc_not_zero(&e->refcnt);
+}
+
+static struct mlx5e_encap_entry *
+mlx5e_encap_get(struct mlx5e_priv *priv, struct encap_key *key,
+               uintptr_t hash_key)
+{
+       struct mlx5_eswitch *esw = priv->mdev->priv.eswitch;
+       struct mlx5e_encap_entry *e;
+       struct encap_key e_key;
+
+       hash_for_each_possible_rcu(esw->offloads.encap_tbl, e,
+                                  encap_hlist, hash_key) {
+               e_key.ip_tun_key = &e->tun_info->key;
+               e_key.tc_tunnel = e->tunnel;
+               if (!cmp_encap_info(&e_key, key) &&
+                   mlx5e_encap_take(e))
+                       return e;
+       }
+
+       return NULL;
+}
+
 static int mlx5e_attach_encap(struct mlx5e_priv *priv,
                              struct mlx5e_tc_flow *flow,
                              struct net_device *mirred_dev,
@@ -2829,11 +2864,10 @@ static int mlx5e_attach_encap(struct mlx5e_priv *priv,
        struct mlx5_esw_flow_attr *attr = flow->esw_attr;
        struct mlx5e_tc_flow_parse_attr *parse_attr;
        const struct ip_tunnel_info *tun_info;
-       struct encap_key key, e_key;
+       struct encap_key key;
        struct mlx5e_encap_entry *e;
        unsigned short family;
        uintptr_t hash_key;
-       bool found = false;
        int err = 0;
 
        parse_attr = attr->parse_attr;
@@ -2848,24 +2882,17 @@ static int mlx5e_attach_encap(struct mlx5e_priv *priv,
 
        hash_key = hash_encap_info(&key);
 
-       hash_for_each_possible_rcu(esw->offloads.encap_tbl, e,
-                                  encap_hlist, hash_key) {
-               e_key.ip_tun_key = &e->tun_info->key;
-               e_key.tc_tunnel = e->tunnel;
-               if (!cmp_encap_info(&e_key, &key)) {
-                       found = true;
-                       break;
-               }
-       }
+       e = mlx5e_encap_get(priv, &key, hash_key);
 
        /* must verify if encap is valid or not */
-       if (found)
+       if (e)
                goto attach_flow;
 
        e = kzalloc(sizeof(*e), GFP_KERNEL);
        if (!e)
                return -ENOMEM;
 
+       refcount_set(&e->refcnt, 1);
        e->tun_info = tun_info;
        err = mlx5e_tc_tun_init_encap_attr(mirred_dev, priv, e, extack);
        if (err)
@@ -2884,6 +2911,7 @@ static int mlx5e_attach_encap(struct mlx5e_priv *priv,
        hash_add_rcu(esw->offloads.encap_tbl, &e->encap_hlist, hash_key);
 
 attach_flow:
+       flow->encaps[out_index].e = e;
        list_add(&flow->encaps[out_index].list, &e->flows);
        flow->encaps[out_index].index = out_index;
        *encap_dev = e->out_dev;
index 20f045e96c92efd28adf2fca05a1e370c5f8f02a..ea2072e2fe849da505efc6b38256af9de448e006 100644 (file)
@@ -75,6 +75,8 @@ void mlx5e_tc_encap_flows_add(struct mlx5e_priv *priv,
                              struct mlx5e_encap_entry *e);
 void mlx5e_tc_encap_flows_del(struct mlx5e_priv *priv,
                              struct mlx5e_encap_entry *e);
+bool mlx5e_encap_take(struct mlx5e_encap_entry *e);
+void mlx5e_encap_put(struct mlx5e_priv *priv, struct mlx5e_encap_entry *e);
 
 struct mlx5e_neigh_hash_entry;
 void mlx5e_tc_update_neigh_used_value(struct mlx5e_neigh_hash_entry *nhe);