Publishing R3
[platform/upstream/dldt.git] / inference-engine / thirdparty / clDNN / src / gpu / permute_gpu.cpp
1 /*
2 // Copyright (c) 2016 Intel Corporation
3 //
4 // Licensed under the Apache License, Version 2.0 (the "License");
5 // you may not use this file except in compliance with the License.
6 // You may obtain a copy of the License at
7 //
8 //      http://www.apache.org/licenses/LICENSE-2.0
9 //
10 // Unless required by applicable law or agreed to in writing, software
11 // distributed under the License is distributed on an "AS IS" BASIS,
12 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13 // See the License for the specific language governing permissions and
14 // limitations under the License.
15 */
16
17 #include "permute_inst.h"
18 #include "primitive_gpu_base.h"
19 #include "implementation_map.h"
20 #include "error_handler.h"
21 #include "kernel_selector_helper.h"
22 #include "permute/permute_kernel_selector.h"
23 #include "permute/permute_kernel_ref.h"
24
25 using namespace cldnn;
26
27 namespace cldnn { namespace gpu {
28
29 struct permute_gpu : typed_primitive_gpu_impl<permute>
30 {
31     using parent = typed_primitive_gpu_impl<permute>;
32     using parent::parent;
33
34     static primitive_impl* create(const permute_node& arg)
35     {
36         auto permute_params = get_default_params<kernel_selector::permute_params>(arg);
37         auto permute_optional_params = get_default_optional_params<kernel_selector::permute_optional_params>(arg.get_program());
38
39         uint16_t max_input_index = (uint16_t)(permute_params.inputs[0].GetDims().size() - 1);
40         const auto& permute_order = arg.get_primitive()->permute_order;
41         for (size_t i = 0; i < permute_order.size(); i++)
42         {
43             auto order = permute_order[permute_order.size() - 1 - i];
44             permute_params.order.push_back(max_input_index - order);
45         }
46         auto& kernel_selector = kernel_selector::permute_kernel_selector::Instance();
47         auto best_kernels = kernel_selector.GetBestKernels(permute_params, permute_optional_params);
48
49         CLDNN_ERROR_BOOL(arg.id(), "Best_kernel.empty()", best_kernels.empty(), "Cannot find a proper kernel with this arguments");
50
51         auto permute = new permute_gpu(arg, best_kernels[0]);
52
53         return permute;
54     }
55 };
56
57 namespace {
58     struct attach {
59         attach() {
60             implementation_map<permute>::add({
61                 { engine_types::ocl, permute_gpu::create },
62             });
63         }
64         ~attach() {}
65     };
66     attach attach_impl;
67 }
68 } }