d7f5f8031d81f89ec97b782680cea7463c79871e
[platform/core/ml/nnfw.git] / runtime / onert / backend / acl_cl / ConstantInitializer.cc
1 /*
2  * Copyright (c) 2019 Samsung Electronics Co., Ltd. All Rights Reserved
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  *      http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #include "ConstantInitializer.h"
18
19 namespace onert
20 {
21 namespace backend
22 {
23 namespace acl_cl
24 {
25
26 ConstantInitializer::ConstantInitializer(const ir::Operands &operands,
27                                          const std::shared_ptr<TensorBuilder> &tensor_builder)
28     : IConstantInitializer{operands}, _tensor_builder{tensor_builder}
29 {
30   // DO NOTHING
31 }
32
33 void ConstantInitializer::copyInputInitialize(const ir::Operation &node, uint32_t index)
34 {
35   assert(node.getInputs().size() > index);
36
37   const auto &input_index = node.getInputs().at(index);
38   const auto &input_obj = _operands.at(input_index);
39   registerCopyInitializer(input_index, input_obj);
40 }
41
42 void ConstantInitializer::permuteInputInitialize(const ir::Operation &node, uint32_t index)
43 {
44   assert(node.getInputs().size() > index);
45
46   const auto &input_index = node.getInputs().at(index);
47   const auto &input_obj = _operands.at(input_index);
48   registerPermuteInitializer(input_index, input_obj);
49 }
50
51 void ConstantInitializer::visit(const ir::operation::BatchToSpaceND &node)
52 {
53   const auto &block_size_index = node.getInputs().at(ir::operation::BatchToSpaceND::BLOCK_SIZE);
54   const auto &block_size_obj = _operands.at(block_size_index);
55
56   if (block_size_obj.isConstant())
57   {
58     _init_map[block_size_index] = [](const ir::Operand &model_obj, backend::ITensor &obj) {
59       assert(model_obj.data());
60       const auto &shape = model_obj.shape();
61       const auto base = reinterpret_cast<const int32_t *>(model_obj.data()->base());
62       assert(model_obj.shape().rank() == 1);
63       obj.access([&](ITensor &tensor) {
64         for (size_t i = 0; i < shape.num_elements(); ++i)
65         {
66           const int32_t value = base[shape.num_elements() - i - 1];
67           int32_t *into = reinterpret_cast<int32_t *>(tensor.buffer() +
68                                                       tensor.calcOffset({static_cast<int32_t>(i)}));
69           *into = value;
70         }
71       });
72     };
73   }
74 }
75
76 void ConstantInitializer::visit(const ir::operation::Conv2D &node)
77 {
78   permuteInputInitialize(node, ir::operation::Conv2D::KERNEL);
79   copyInputInitialize(node, ir::operation::Conv2D::BIAS);
80 }
81
82 void ConstantInitializer::visit(const ir::operation::DepthwiseConv2D &node)
83 {
84   permuteInputInitialize(node, ir::operation::DepthwiseConv2D::KERNEL);
85   copyInputInitialize(node, ir::operation::DepthwiseConv2D::BIAS);
86 }
87
88 void ConstantInitializer::visit(const ir::operation::EmbeddingLookup &node)
89 {
90   copyInputInitialize(node, ir::operation::EmbeddingLookup::LOOKUPS);
91 }
92
93 void ConstantInitializer::visit(const ir::operation::FullyConnected &node)
94 {
95   copyInputInitialize(node, ir::operation::FullyConnected::WEIGHT);
96   copyInputInitialize(node, ir::operation::FullyConnected::BIAS);
97 }
98
99 void ConstantInitializer::visit(const ir::operation::Gather &node)
100 {
101   copyInputInitialize(node, ir::operation::Gather::INDICES);
102 }
103
104 void ConstantInitializer::visit(const ir::operation::HashtableLookup &node)
105 {
106   copyInputInitialize(node, ir::operation::HashtableLookup::LOOKUPS);
107   copyInputInitialize(node, ir::operation::HashtableLookup::KEYS);
108 }
109
110 void ConstantInitializer::visit(const ir::operation::LSTM &node)
111 {
112   copyInputInitialize(node, ir::operation::LSTM::INPUT_TO_INPUT_WEIGHTS);
113   copyInputInitialize(node, ir::operation::LSTM::INPUT_TO_FORGET_WEIGHTS);
114   copyInputInitialize(node, ir::operation::LSTM::INPUT_TO_CELL_WEIGHTS);
115   copyInputInitialize(node, ir::operation::LSTM::INPUT_TO_OUTPUT_WEIGHTS);
116   copyInputInitialize(node, ir::operation::LSTM::RECURRENT_TO_INPUT_WEIGHTS);
117   copyInputInitialize(node, ir::operation::LSTM::RECURRENT_TO_FORGET_WEIGHTS);
118   copyInputInitialize(node, ir::operation::LSTM::RECURRENT_TO_CELL_WEIGHTS);
119   copyInputInitialize(node, ir::operation::LSTM::RECURRENT_TO_OUTPUT_WEIGHTS);
120   copyInputInitialize(node, ir::operation::LSTM::CELL_TO_INPUT_WEIGHTS);
121   copyInputInitialize(node, ir::operation::LSTM::CELL_TO_FORGET_WEIGHTS);
122   copyInputInitialize(node, ir::operation::LSTM::CELL_TO_OUTPUT_WEIGHTS);
123   copyInputInitialize(node, ir::operation::LSTM::INPUT_GATE_BIAS);
124   copyInputInitialize(node, ir::operation::LSTM::FORGET_GATE_BIAS);
125   copyInputInitialize(node, ir::operation::LSTM::OUTPUT_GATE_BIAS);
126   copyInputInitialize(node, ir::operation::LSTM::PROJECTION_WEIGHTS);
127   copyInputInitialize(node, ir::operation::LSTM::PROJECTION_BIAS);
128 }
129
130 void ConstantInitializer::visit(const ir::operation::RNN &node)
131 {
132   copyInputInitialize(node, ir::operation::RNN::WEIGHTS);
133   copyInputInitialize(node, ir::operation::RNN::RECURRENT_WEIGHTS);
134   copyInputInitialize(node, ir::operation::RNN::BIAS);
135 }
136
137 void ConstantInitializer::visit(const ir::operation::SpaceToBatchND &node)
138 {
139   const auto &block_size_index = node.getInputs().at(ir::operation::SpaceToBatchND::BLOCK_SIZE);
140   const auto &block_size_obj = _operands.at(block_size_index);
141
142   if (block_size_obj.isConstant())
143   {
144     _init_map[block_size_index] = [](const ir::Operand &model_obj, backend::ITensor &obj) {
145       assert(model_obj.data());
146       const auto &shape = model_obj.shape();
147       const auto base = reinterpret_cast<const int32_t *>(model_obj.data()->base());
148       assert(model_obj.shape().rank() == 1);
149       obj.access([&](ITensor &tensor) {
150         for (size_t i = 0; i < shape.num_elements(); ++i)
151         {
152           const int32_t value = base[shape.num_elements() - i - 1];
153           int32_t *into = reinterpret_cast<int32_t *>(tensor.buffer() +
154                                                       tensor.calcOffset({static_cast<int32_t>(i)}));
155           *into = value;
156         }
157       });
158     };
159   }
160
161   const auto &paddings_index = node.getInputs().at(ir::operation::SpaceToBatchND::PADDINGS);
162   const auto &paddings_obj = _operands.at(paddings_index);
163   if (paddings_obj.isConstant())
164   {
165     _init_map[paddings_index] = [](const ir::Operand &model_obj, backend::ITensor &obj) {
166       assert(model_obj.data());
167       const auto &shape = model_obj.shape();
168       const auto base = reinterpret_cast<const int32_t *>(model_obj.data()->base());
169       assert(model_obj.shape().rank() == 2);
170       assert(obj.dimension(0) == 2);
171       obj.access([&](ITensor &tensor) {
172         for (auto i = 0; i < shape.dim(0); ++i)
173         {
174           for (auto j = 0; j < shape.dim(1); ++j)
175           {
176             const int32_t value = base[i * 2 + j];
177             int32_t *into = reinterpret_cast<int32_t *>(
178                 tensor.buffer() + tensor.calcOffset({shape.dim(0) - i - 1, j}));
179             *into = value;
180           }
181         }
182       });
183     };
184   }
185 }
186
187 void ConstantInitializer::visit(const ir::operation::TransposeConv &node)
188 {
189   const auto &kernel_index = node.getInputs().at(ir::operation::TransposeConv::KERNEL);
190   const auto &kernel_obj = _operands.at(kernel_index);
191   registerPermuteInitializer(kernel_index, kernel_obj);
192 }
193
194 } // namespace acl_cl
195 } // namespace backend
196 } // namespace onert