[neurun] Eliminate OperandIndex in Transpose::Param (#9016)

author Sergei Barannikov/AI Tools Lab /SRR/Engineer/Samsung Electronics <s.barannikov@samsung.com>

Wed, 20 Nov 2019 06:23:59 +0000 (09:23 +0300)

committer 오형석/On-Device Lab(SR)/Staff Engineer/삼성전자 <hseok82.oh@samsung.com>

Wed, 20 Nov 2019 06:23:59 +0000 (15:23 +0900)
author Sergei Barannikov/AI Tools Lab /SRR/Engineer/Samsung Electronics <s.barannikov@samsung.com>
Wed, 20 Nov 2019 06:23:59 +0000 (09:23 +0300)
committer 오형석/On-Device Lab(SR)/Staff Engineer/삼성전자 <hseok82.oh@samsung.com>
Wed, 20 Nov 2019 06:23:59 +0000 (15:23 +0900)
diff --git a/runtime/neurun/backend/acl_cl/KernelGenerator.cc b/runtime/neurun/backend/acl_cl/KernelGenerator.cc

index 825318d..b4112b1 100644 (file)
--- a/runtime/neurun/backend/acl_cl/KernelGenerator.cc
+++ b/runtime/neurun/backend/acl_cl/KernelGenerator.cc
@@ -732,25 +732,16 @@ void KernelGenerator::visit(const model::operation::Transpose &node)
  {
    const auto ofm_idx{node.getOutputs().at(0)};
    const auto ifm_idx{node.getInputs().at(model::operation::Transpose::Input::INPUT)};
-  const auto perm{node.param().perm};
+  const auto &perm{node.param().perm};
  
    const auto rank = _ctx.at(ifm_idx).shape().rank();
-  std::vector<int32_t> pv;
-  const auto perm_base = _ctx.at(perm).data().base();
-  const int perm_size = _ctx.at(perm).shape().num_elements();
-
-  assert(perm_base != nullptr);
-  for (int32_t n = 0; n < perm_size; ++n)
-  {
-    int32_t perm_value = *(reinterpret_cast<const int32_t *>(perm_base) + n);
-    assert(perm_value < rank);
-    pv.emplace_back(perm_value);
-  }
  
    auto ofm_alloc = _tensor_builder->at(ofm_idx).get();
    auto ifm_alloc = _tensor_builder->at(ifm_idx).get();
    const auto frontend_layout = _current_subg_layout;
    const auto backend_layout = ifm_alloc->layout();
+
+  std::vector<std::int32_t> pv(perm.cbegin(), perm.cend());
    // Reversed
    auto backend_pv = ::neurun::backend::acl_common::getARMComputePermutationVector(
        rank, pv, frontend_layout, backend_layout);
diff --git a/runtime/neurun/backend/acl_neon/KernelGenerator.cc b/runtime/neurun/backend/acl_neon/KernelGenerator.cc

index 398c65a..4cace9c 100644 (file)
--- a/runtime/neurun/backend/acl_neon/KernelGenerator.cc
+++ b/runtime/neurun/backend/acl_neon/KernelGenerator.cc
@@ -1959,26 +1959,15 @@ void KernelGenerator::visit(const model::operation::Transpose &node)
  {
    const auto ofm_idx{node.getOutputs().at(0)};
    const auto ifm_idx{node.getInputs().at(model::operation::Transpose::Input::INPUT)};
-  const auto perm{node.param().perm};
-
-  const auto rank = _ctx.at(ifm_idx).shape().rank();
-  std::vector<int32_t> pv;
-  const auto perm_base = _ctx.at(perm).data().base();
-  const int perm_size = _ctx.at(perm).shape().num_elements();
-
-  assert(perm_base != nullptr);
-  for (int32_t n = 0; n < perm_size; ++n)
-  {
-    const int32_t perm_value = *(reinterpret_cast<const int32_t *>(perm_base) + n);
-    assert(perm_value < rank);
-    pv.emplace_back(perm_value);
-  }
+  const auto &perm{node.param().perm};
  
    auto ofm_alloc = _tensor_builder->at(ofm_idx).get();
    const auto ifm_alloc = _tensor_builder->at(ifm_idx).get();
    const auto frontend_layout = _current_subg_layout;
    const auto backend_layout = ifm_alloc->layout();
  
+  const auto rank = _ctx.at(ifm_idx).shape().rank();
+  std::vector<std::int32_t> pv(perm.cbegin(), perm.cend());
    auto backend_pv = ::neurun::backend::acl_common::getARMComputePermutationVector(
        rank, pv, frontend_layout, backend_layout);
  
diff --git a/runtime/neurun/core/include/model/operation/Transpose.h b/runtime/neurun/core/include/model/operation/Transpose.h

index 250f67c..9b1d640 100644 (file)
--- a/runtime/neurun/core/include/model/operation/Transpose.h
+++ b/runtime/neurun/core/include/model/operation/Transpose.h
@@ -38,10 +38,7 @@ public:
  
    struct Param
    {
-    // permutation vector is optional.
-    // if permutation vector is provided, set perm.first to true
-    // if permutation vector is NOT provided, set perm.first to false
-    OperandIndex perm;
+    std::vector<int> perm;
    };
  
  public:
diff --git a/runtime/neurun/core/src/compiler/OperationValidator.cc b/runtime/neurun/core/src/compiler/OperationValidator.cc

index 677f9d3..d7c9d02 100644 (file)
--- a/runtime/neurun/core/src/compiler/OperationValidator.cc
+++ b/runtime/neurun/core/src/compiler/OperationValidator.cc
@@ -197,18 +197,16 @@ void OperationValidator::visit(const model::operation::Transpose &node)
  {
    const auto output_index{node.getOutputs().at(0)};
    const auto input_index{node.getInputs().at(model::operation::Transpose::Input::INPUT)};
-  const auto perm_idx{node.param().perm};
+  const auto &perm{node.param().perm};
  
    const auto &output_shape = _ctx.at(output_index).shape();
    const auto &input_shape = _ctx.at(input_index).shape();
-  const auto &perm_shape = _ctx.at(perm_idx).shape();
  
    UNUSED_RELEASE(output_shape);
    UNUSED_RELEASE(input_shape);
-  UNUSED_RELEASE(perm_shape);
+  UNUSED_RELEASE(perm);
  
-  assert(perm_shape.rank() == 1);
-  assert(input_shape.rank() == perm_shape.dim(0));
+  assert(input_shape.rank() == static_cast<int>(perm.size()));
    assert(input_shape.rank() == output_shape.rank());
  }
  
diff --git a/runtime/neurun/frontend/base_loader/base_loader.h b/runtime/neurun/frontend/base_loader/base_loader.h

index f474e85..c28f464 100644 (file)
--- a/runtime/neurun/frontend/base_loader/base_loader.h
+++ b/runtime/neurun/frontend/base_loader/base_loader.h
@@ -658,19 +658,18 @@ void BaseLoader<LoaderDomain, SpecificLoader>::loadTranspose(const Operator *op)
    model::OperandIndexSequence inputs;
    model::OperandIndexSequence outputs;
  
-  const auto input_index = (*op->inputs())[0];
-  inputs.append(model::OperandIndex(input_index));
-  const auto output_index = (*op->outputs())[0];
-  outputs.append(model::OperandIndex(output_index));
+  loadOperationIO(op, inputs, outputs);
+  auto input = inputs.at(0);
+  auto perm = inputs.at(1);
+
+  if (!_graph.operands().at(perm).isConstant())
+    throw std::runtime_error("Transpose: non-constant 'perm' is not supported.");
  
    model::operation::Transpose::Param param;
-  if (op->inputs()->size() == 2)
-  {
-    const auto perm_index = (*op->inputs())[1];
-    param.perm = model::OperandIndex(perm_index);
-  }
+  param.perm = _graph.operands().at(perm).template asVector<int>();
  
-  std::unique_ptr<model::Operation> new_op(new model::operation::Transpose(inputs, outputs, param));
+  std::unique_ptr<model::Operation> new_op(
+      new model::operation::Transpose({input}, outputs, param));
    _graph.addOperation(std::move(new_op));
  }
  
diff --git a/runtime/neurun/frontend/nnapi/wrapper/OperationFactory.cc b/runtime/neurun/frontend/nnapi/wrapper/OperationFactory.cc

index 26288a9..214a56a 100644 (file)
--- a/runtime/neurun/frontend/nnapi/wrapper/OperationFactory.cc
+++ b/runtime/neurun/frontend/nnapi/wrapper/OperationFactory.cc
@@ -600,7 +600,7 @@ OperationFactory::OperationFactory()
    };
  
    _map[ANEURALNETWORKS_TRANSPOSE] = [](const OperationFactory::Param &init_param,
-                                       neurun::model::Operands &) {
+                                       neurun::model::Operands &operands) {
      // TODO make this work with init_param.input_count == 1 (when permutation vector is optional)
  
      // Inputs
@@ -616,9 +616,11 @@ OperationFactory::OperationFactory()
  
      OperandIndexSequence inputs{init_param.inputs[0]};
      OperandIndexSequence outputs{init_param.outputs[0]};
+    std::vector<std::int32_t> perm =
+        operands.at(OperandIndex{init_param.inputs[1]}).asVector<std::int32_t>();
  
      operation::Transpose::Param param;
-    param.perm = OperandIndex{init_param.inputs[1]};
+    param.perm.assign(perm.cbegin(), perm.cend());
  
      return new operation::Transpose{inputs, outputs, param};
    };
author	Sergei Barannikov/AI Tools Lab /SRR/Engineer/Samsung Electronics <s.barannikov@samsung.com>
	Wed, 20 Nov 2019 06:23:59 +0000 (09:23 +0300)
committer	오형석/On-Device Lab(SR)/Staff Engineer/삼성전자 <hseok82.oh@samsung.com>
	Wed, 20 Nov 2019 06:23:59 +0000 (15:23 +0900)
runtime/neurun/backend/acl_cl/KernelGenerator.cc		patch \| blob \| history
runtime/neurun/backend/acl_neon/KernelGenerator.cc		patch \| blob \| history
runtime/neurun/core/include/model/operation/Transpose.h		patch \| blob \| history
runtime/neurun/core/src/compiler/OperationValidator.cc		patch \| blob \| history
runtime/neurun/frontend/base_loader/base_loader.h		patch \| blob \| history
runtime/neurun/frontend/nnapi/wrapper/OperationFactory.cc		patch \| blob \| history