[acl] Use lws_hint() instead of default parameter (#4745)
author윤지영/On-Device Lab(SR)/Staff Engineer/삼성전자 <jy910.yun@samsung.com>
Thu, 14 Mar 2019 10:28:49 +0000 (19:28 +0900)
committer오형석/On-Device Lab(SR)/Staff Engineer/삼성전자 <hseok82.oh@samsung.com>
Thu, 14 Mar 2019 10:28:49 +0000 (19:28 +0900)
This commit applies `lws_hint()` in the case of below operators.
TensorFlowMax, TensorFlowSum, EXP, GATHER, CAST, PAD

Signed-off-by: Jiyoung Yun <jy910.yun@samsung.com>
libs/ARMComputeEx/src/core/CL/kernels/CLCastKernel.cpp
libs/ARMComputeEx/src/core/CL/kernels/CLExpKernel.cpp
libs/ARMComputeEx/src/core/CL/kernels/CLGatherKernel.cpp
libs/ARMComputeEx/src/core/CL/kernels/CLPadLayerKernel.cpp
libs/ARMComputeEx/src/core/CL/kernels/CLReduceOperationKernel.cpp

index bf7ebae..ac2963f 100644 (file)
@@ -97,6 +97,6 @@ void CLCastKernel::run(const Window &window, cl::CommandQueue &queue)
     unsigned int idx = 0;
     add_3D_tensor_argument(idx, _input, slice);
     add_3D_tensor_argument(idx, _output, slice);
-    enqueue(queue, *this, slice);
+    enqueue(queue, *this, slice, lws_hint());
   } while (collapsed.slide_window_slice_3D(slice));
 }
index b1ee21b..2dc43a3 100644 (file)
@@ -72,6 +72,6 @@ void CLExpKernel::run(const Window &window, cl::CommandQueue &queue)
     unsigned int idx = 0;
     add_3D_tensor_argument(idx, _input, slice);
     add_3D_tensor_argument(idx, _output, slice);
-    enqueue(queue, *this, slice);
+    enqueue(queue, *this, slice, lws_hint());
   } while (collapsed.slide_window_slice_3D(slice));
 }
index 24e3dc9..f90680c 100644 (file)
@@ -174,5 +174,5 @@ void CLGatherKernel::run(const Window &window, cl::CommandQueue &queue)
   add_4D_tensor_argument(idx, _input, window_collapsed);
   add_3D_tensor_argument(idx, _indices, window_collapsed);
   add_4D_tensor_argument(idx, _output, window_collapsed);
-  enqueue(queue, *this, window_collapsed);
+  enqueue(queue, *this, window_collapsed, lws_hint());
 }
index 832b2cc..50f8a39 100644 (file)
@@ -130,6 +130,6 @@ void CLPadLayerKernel::run(const Window &window, cl::CommandQueue &queue)
     add_4D_tensor_argument(idx, _input, slice_in);
     add_4D_tensor_argument(idx, _output, slice_out);
     _kernel.setArg<cl_int4>(idx++, paddingValues);
-    enqueue(queue, *this, slice_out);
+    enqueue(queue, *this, slice_out, lws_hint());
   } while (window.slide_window_slice_4D(slice_out) && window.slide_window_slice_4D(slice_in));
 }
index ed53b88..24e89db 100644 (file)
@@ -172,7 +172,7 @@ void CLReduceOperationKernel::run(const Window &window, cl::CommandQueue &queue)
   idx = 0;
   add_4D_tensor_argument(idx, _input, slice_in);
   add_4D_tensor_argument(idx, _output, slice_out);
-  enqueue(queue, *this, slice_out);
+  enqueue(queue, *this, slice_out, lws_hint());
 
   // Recover output's shape of output tensor
   _output->info()->set_tensor_shape(shape_out);