Release 18.03
[platform/upstream/armnn.git] / src / armnn / backends / ClWorkloadFactory.hpp
1 //
2 // Copyright © 2017 Arm Ltd. All rights reserved.
3 // See LICENSE file in the project root for full license information.
4 //
5 #pragma once
6
7 #include "WorkloadFactory.hpp"
8 #include "OutputHandler.hpp"
9 #include "armnn/IRuntime.hpp"
10
11 #ifdef ARMCOMPUTECL_ENABLED
12 #include <arm_compute/runtime/CL/CLTuner.h>
13 #endif
14
15 namespace cl
16 {
17 class Context;
18 class CommandQueue;
19 class Device;
20 }
21
22 namespace armnn
23 {
24
25 class IClTunedParameters;
26 class ClTunedParameters;
27
28 // ARM Compute OpenCL workload factory
29 class ClWorkloadFactory : public IWorkloadFactory
30 {
31 public:
32
33     ClWorkloadFactory(IClTunedParameters* clTunedParameters = nullptr);
34
35     virtual ~ClWorkloadFactory();
36
37     virtual Compute GetCompute() const override { return Compute::GpuAcc; }
38
39     static bool IsLayerSupported(const Layer& layer, DataType dataType, std::string& outReasonIfUnsupported);
40
41     void LoadOpenClRuntime();
42
43     virtual bool SupportsSubTensors() const override { return true; }
44
45     virtual std::unique_ptr<ITensorHandle> CreateSubTensorHandle(ITensorHandle&      parent,
46                                                                  TensorShape const&   subTensorShape,
47                                                                  unsigned int const* subTensorOrigin) const override;
48
49     virtual std::unique_ptr<ITensorHandle> CreateTensorHandle(const TensorInfo& tensorInfo) const override;
50
51     virtual std::unique_ptr<IWorkload> CreateInput(const InputQueueDescriptor& descriptor,
52                                                    const WorkloadInfo& info) const override;
53
54     virtual std::unique_ptr<IWorkload> CreateOutput(const OutputQueueDescriptor& descriptor,
55                                                     const WorkloadInfo& info) const override;
56
57     virtual std::unique_ptr<IWorkload> CreateActivation(const ActivationQueueDescriptor& descriptor,
58                                                         const WorkloadInfo&              info) const override;
59
60     virtual std::unique_ptr<IWorkload> CreateSoftmax(const SoftmaxQueueDescriptor& descriptor,
61                                                      const WorkloadInfo&           info) const override;
62
63     virtual std::unique_ptr<IWorkload> CreateSplitter(const SplitterQueueDescriptor& descriptor,
64                                                       const WorkloadInfo&            info) const override;
65
66     virtual std::unique_ptr<IWorkload> CreateMerger(const MergerQueueDescriptor& descriptor,
67                                                     const WorkloadInfo&          info) const override;
68
69     virtual std::unique_ptr<IWorkload> CreateFullyConnected(const FullyConnectedQueueDescriptor& descriptor,
70                                                             const WorkloadInfo&                  info) const override;
71
72     virtual std::unique_ptr<IWorkload> CreatePermute(const PermuteQueueDescriptor& descriptor,
73                                                      const WorkloadInfo&           info) const override;
74
75     virtual std::unique_ptr<IWorkload> CreatePooling2d(const Pooling2dQueueDescriptor& descriptor,
76                                                        const WorkloadInfo&           info) const override;
77
78     virtual std::unique_ptr<IWorkload> CreateConvolution2d(const Convolution2dQueueDescriptor& descriptor,
79                                                            const WorkloadInfo&               info) const override;
80
81     virtual std::unique_ptr<IWorkload> CreateDepthwiseConvolution2d(
82         const DepthwiseConvolution2dQueueDescriptor& descriptor, const WorkloadInfo& info) const override;
83
84     virtual std::unique_ptr<IWorkload> CreateNormalization(const NormalizationQueueDescriptor& descriptor,
85                                                            const WorkloadInfo&                 info) const override;
86
87     virtual std::unique_ptr<IWorkload> CreateAddition(const AdditionQueueDescriptor& descriptor,
88                                                       const WorkloadInfo&            info) const override;
89
90     virtual std::unique_ptr<IWorkload> CreateMultiplication(const MultiplicationQueueDescriptor& descriptor,
91                                                             const WorkloadInfo&                  info) const override;
92
93     virtual std::unique_ptr<IWorkload> CreateBatchNormalization(const BatchNormalizationQueueDescriptor& descriptor,
94                                                                 const WorkloadInfo& info) const override;
95
96     virtual std::unique_ptr<IWorkload> CreateMemCopy(const MemCopyQueueDescriptor& descriptor,
97                                                      const WorkloadInfo& info) const override;
98
99     virtual std::unique_ptr<IWorkload> CreateResizeBilinear(const ResizeBilinearQueueDescriptor& descriptor,
100                                                             const WorkloadInfo& info) const override;
101
102     virtual std::unique_ptr<IWorkload> CreateFakeQuantization(const FakeQuantizationQueueDescriptor& descriptor,
103                                                               const WorkloadInfo& info) const override;
104
105     virtual std::unique_ptr<IWorkload> CreateL2Normalization(const L2NormalizationQueueDescriptor& descriptor,
106                                                              const WorkloadInfo& info) const override;
107
108     virtual std::unique_ptr<IWorkload> CreateConstant(const ConstantQueueDescriptor& descriptor,
109                                                       const WorkloadInfo& info) const override;
110
111     virtual std::unique_ptr<IWorkload> CreateReshape(const ReshapeQueueDescriptor& descriptor,
112                                                      const WorkloadInfo& info) const override;
113
114     virtual std::unique_ptr<IWorkload> CreateFloor(const FloorQueueDescriptor& descriptor,
115                                                    const WorkloadInfo& info) const override;
116
117 private:
118     ClTunedParameters* m_clTunedParameters;
119 };
120
121 class ClTunedParameters : public IClTunedParameters
122 {
123 public:
124     ClTunedParameters(armnn::IClTunedParameters::Mode mode);
125
126     virtual void Load(const char* filename);
127     virtual void Save(const char* filename) const;
128
129     Mode m_Mode;
130
131 #ifdef ARMCOMPUTECL_ENABLED
132     arm_compute::CLTuner m_Tuner;
133 #endif
134 };
135
136 } // namespace armnn