arm_compute v18.05
[platform/upstream/armcl.git] / src / core / CL / cl_kernels / depth_convert.cl
1 /*
2  * Copyright (c) 2016, 2017 ARM Limited.
3  *
4  * SPDX-License-Identifier: MIT
5  *
6  * Permission is hereby granted, free of charge, to any person obtaining a copy
7  * of this software and associated documentation files (the "Software"), to
8  * deal in the Software without restriction, including without limitation the
9  * rights to use, copy, modify, merge, publish, distribute, sublicense, and/or
10  * sell copies of the Software, and to permit persons to whom the Software is
11  * furnished to do so, subject to the following conditions:
12  *
13  * The above copyright notice and this permission notice shall be included in all
14  * copies or substantial portions of the Software.
15  *
16  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
17  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
18  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
19  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
20  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
21  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
22  * SOFTWARE.
23  */
24 #include "helpers.h"
25
26 #if defined(FIXED_POINT_POSITION)
27
28 #include "fixed_point.h"
29
30 #ifdef SATURATE
31 #define CONVERT_DOWN(x, in_type, out_type, fixed_point_position) CONVERT_DOWN1_SAT(x, in_type, out_type, fixed_point_position)
32 #define CONVERT_DOWN1_SAT(x, in_type, out_type, fixed_point_position) convert_##out_type##_##in_type##_sat(x, fixed_point_position)
33 #else /* SATURATE */
34 #define CONVERT_DOWN(x, in_type, out_type, fixed_point_position) CONVERT_DOWN1(x, in_type, out_type, fixed_point_position)
35 #define CONVERT_DOWN1(x, in_type, out_type, fixed_point_position) convert_##out_type##_##in_type(x, fixed_point_position)
36 #endif /* SATURATE */
37
38 #define CONVERT_UP(x, in_type, out_type, fixed_point_position) CONVERT_UP1(x, in_type, out_type, fixed_point_position)
39 #define CONVERT_UP1(x, in_type, out_type, fixed_point_position) convert_##out_type##_##in_type(x, fixed_point_position)
40
41 #else /* FIXED_POINT_POSITION */
42
43 #ifdef SATURATE
44 #define CONVERT_DOWN(x, type) CONVERT_SAT(x, type)
45 #else /* SATURATE */
46 #define CONVERT_DOWN(x, type) CONVERT(x, type)
47 #endif /* SATURATE */
48
49 #define CONVERT_UP(x, type) CONVERT(x, type)
50
51 #endif /* FIXED_POINT_POSITION */
52
53 /** This function performs a down-scaling depth conversion.
54  *
55  * @attention The input and output data_types need to be passed at compile time using -DDATA_TYPE_IN and -DDATA_TYPE_OUT:
56  * e.g. -DDATA_TYPE_IN=uchar -DDATA_TYPE_OUT=short
57  *
58  * @note In case of fixed-point operation -DFIXED_POINT_POSITION=fixed_point_position must be provided: e.g. -DFIXED_POINT_POSITION=3
59  *
60  * @param[in]  in_ptr                            Pointer to the source image. Supported data types: U8, U16, S16, U32, S32, F16, F32
61  * @param[in]  in_stride_x                       Stride of the source image in X dimension (in bytes)
62  * @param[in]  in_step_x                         in_stride_x * number of elements along X processed per workitem(in bytes)
63  * @param[in]  in_stride_y                       Stride of the source image in Y dimension (in bytes)
64  * @param[in]  in_step_y                         in_stride_y * number of elements along Y processed per workitem(in bytes)
65  * @param[in]  in_offset_first_element_in_bytes  The offset of the first element in the source image
66  * @param[out] out_ptr                           Pointer to the destination image. Supported data types: QS8, U8, QS16, U16, S16, U32, S32
67  * @param[in]  out_stride_x                      Stride of the destination image in X dimension (in bytes)
68  * @param[in]  out_step_x                        out_stride_x * number of elements along X processed per workitem(in bytes)
69  * @param[in]  out_stride_y                      Stride of the destination image in Y dimension (in bytes)
70  * @param[in]  out_step_y                        out_stride_y * number of elements along Y processed per workitem(in bytes)
71  * @param[in]  out_offset_first_element_in_bytes The offset of the first element in the destination image
72  * @param[in]  shift                             The integer shift amount value. Supported data types: S32
73  */
74 __kernel void convert_depth_down(
75     IMAGE_DECLARATION(in),
76     IMAGE_DECLARATION(out),
77     const int shift)
78 {
79     // Get pixels pointer
80     Image in  = CONVERT_TO_IMAGE_STRUCT(in);
81     Image out = CONVERT_TO_IMAGE_STRUCT(out);
82
83     // Load data
84     VEC_DATA_TYPE(DATA_TYPE_IN, 16)
85     in_data = vload16(0, (__global DATA_TYPE_IN *)in.ptr);
86
87 #if defined(FIXED_POINT_POSITION)
88     vstore16(CONVERT_DOWN(in_data, VEC_DATA_TYPE(DATA_TYPE_IN, 16), VEC_DATA_TYPE(DATA_TYPE_OUT, 16), FIXED_POINT_POSITION), 0, (__global DATA_TYPE_OUT *)out.ptr);
89 #else  /* FIXED_POINT_POSITION */
90     vstore16(CONVERT_DOWN(in_data >> shift, VEC_DATA_TYPE(DATA_TYPE_OUT, 16)), 0, (__global DATA_TYPE_OUT *)out.ptr);
91 #endif /* FIXED_POINT_POSITION */
92 }
93
94 /** This function performs a up-scaling depth conversion.
95  *
96  * @attention The input and output data_types need to be passed at compile time using -DDATA_TYPE_IN and -DDATA_TYPE_OUT:
97  * e.g. -DDATA_TYPE_IN=uchar -DDATA_TYPE_OUT=short
98  *
99  * @note In case of fixed-point operation -DFIXED_POINT_POSITION=fixed_point_position must be provided: e.g. -DFIXED_POINT_POSITION=3
100  *
101  * @param[in]  in_ptr                            Pointer to the source image. Supported data types: U8, QS8, U16, S16, QS16, U32 or S32
102  * @param[in]  in_stride_x                       Stride of the source image in X dimension (in bytes)
103  * @param[in]  in_step_x                         in_stride_x * number of elements along X processed per workitem(in bytes)
104  * @param[in]  in_stride_y                       Stride of the source image in Y dimension (in bytes)
105  * @param[in]  in_step_y                         in_stride_y * number of elements along Y processed per workitem(in bytes)
106  * @param[in]  in_offset_first_element_in_bytes  The offset of the first element in the source image
107  * @param[out] out_ptr                           Pointer to the destination image. Supported data types: U8, U16, S16, U32, S32, F16 or F32
108  * @param[in]  out_stride_x                      Stride of the destination image in X dimension (in bytes)
109  * @param[in]  out_step_x                        out_stride_x * number of elements along X processed per workitem(in bytes)
110  * @param[in]  out_stride_y                      Stride of the destination image in Y dimension (in bytes)
111  * @param[in]  out_step_y                        out_stride_y * number of elements along Y processed per workitem(in bytes)
112  * @param[in]  out_offset_first_element_in_bytes The offset of the first element in the destination image
113  * @param[in]  shift                             The integer shift amount value. Supported data types: S32
114  */
115 __kernel void convert_depth_up(
116     IMAGE_DECLARATION(in),
117     IMAGE_DECLARATION(out),
118     const int shift)
119 {
120     // Get pixels pointer
121     Image in  = CONVERT_TO_IMAGE_STRUCT(in);
122     Image out = CONVERT_TO_IMAGE_STRUCT(out);
123
124     // Load data
125     VEC_DATA_TYPE(DATA_TYPE_IN, 16)
126     in_data = vload16(0, (__global DATA_TYPE_IN *)in.ptr);
127
128 #if defined(FIXED_POINT_POSITION)
129     vstore16(CONVERT_UP(in_data, VEC_DATA_TYPE(DATA_TYPE_IN, 16), VEC_DATA_TYPE(DATA_TYPE_OUT, 16), FIXED_POINT_POSITION), 0, (__global DATA_TYPE_OUT *)out.ptr);
130 #else  /* FIXED_POINT_POSITION */
131     vstore16(CONVERT_UP(in_data, VEC_DATA_TYPE(DATA_TYPE_OUT, 16)) << shift, 0, (__global DATA_TYPE_OUT *)out.ptr);
132 #endif /* FIXED_POINT_POSITION */
133 }