Tizen 2.0 Release
[profile/ivi/osmesa.git] / src / gallium / drivers / llvmpipe / lp_tile_image.c
1 /**************************************************************************
2  * 
3  * Copyright 2010 VMware, Inc.  All Rights Reserved.
4  * 
5  * Permission is hereby granted, free of charge, to any person obtaining a
6  * copy of this software and associated documentation files (the
7  * "Software"), to deal in the Software without restriction, including
8  * without limitation the rights to use, copy, modify, merge, publish,
9  * distribute, sub license, and/or sell copies of the Software, and to
10  * permit persons to whom the Software is furnished to do so, subject to
11  * the following conditions:
12  * 
13  * The above copyright notice and this permission notice (including the
14  * next paragraph) shall be included in all copies or substantial portions
15  * of the Software.
16  * 
17  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS
18  * OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
19  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NON-INFRINGEMENT.
20  * IN NO EVENT SHALL THE AUTHORS AND/OR ITS SUPPLIERS BE LIABLE FOR
21  * ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT,
22  * TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE
23  * SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
24  * 
25  **************************************************************************/
26
27
28 /**
29  * Code to convert images from tiled to linear and back.
30  * XXX there are quite a few assumptions about color and z/stencil being
31  * 32bpp.
32  */
33
34
35 #include "util/u_format.h"
36 #include "lp_tile_soa.h"
37 #include "lp_tile_image.h"
38
39
40 #define BYTES_PER_TILE (TILE_SIZE * TILE_SIZE * 4)
41
42
43 /**
44  * Untile a 4x4 block of 32-bit words (all contiguous) to linear layout
45  * at dst, with dst_stride words between rows.
46  */
47 static void
48 untile_4_4_uint32(const uint32_t *src, uint32_t *dst, unsigned dst_stride)
49 {
50    uint32_t *d0 = dst;
51    uint32_t *d1 = d0 + dst_stride;
52    uint32_t *d2 = d1 + dst_stride;
53    uint32_t *d3 = d2 + dst_stride;
54
55    d0[0] = src[0];   d0[1] = src[1];   d0[2] = src[4];   d0[3] = src[5];
56    d1[0] = src[2];   d1[1] = src[3];   d1[2] = src[6];   d1[3] = src[7];
57    d2[0] = src[8];   d2[1] = src[9];   d2[2] = src[12];  d2[3] = src[13];
58    d3[0] = src[10];  d3[1] = src[11];  d3[2] = src[14];  d3[3] = src[15];
59 }
60
61
62
63 /**
64  * Untile a 4x4 block of 16-bit words (all contiguous) to linear layout
65  * at dst, with dst_stride words between rows.
66  */
67 static void
68 untile_4_4_uint16(const uint16_t *src, uint16_t *dst, unsigned dst_stride)
69 {
70    uint16_t *d0 = dst;
71    uint16_t *d1 = d0 + dst_stride;
72    uint16_t *d2 = d1 + dst_stride;
73    uint16_t *d3 = d2 + dst_stride;
74
75    d0[0] = src[0];   d0[1] = src[1];   d0[2] = src[4];   d0[3] = src[5];
76    d1[0] = src[2];   d1[1] = src[3];   d1[2] = src[6];   d1[3] = src[7];
77    d2[0] = src[8];   d2[1] = src[9];   d2[2] = src[12];  d2[3] = src[13];
78    d3[0] = src[10];  d3[1] = src[11];  d3[2] = src[14];  d3[3] = src[15];
79 }
80
81
82
83 /**
84  * Convert a 4x4 rect of 32-bit words from a linear layout into tiled
85  * layout (in which all 16 words are contiguous).
86  */
87 static void
88 tile_4_4_uint32(const uint32_t *src, uint32_t *dst, unsigned src_stride)
89 {
90    const uint32_t *s0 = src;
91    const uint32_t *s1 = s0 + src_stride;
92    const uint32_t *s2 = s1 + src_stride;
93    const uint32_t *s3 = s2 + src_stride;
94
95    dst[0] = s0[0];   dst[1] = s0[1];   dst[4] = s0[2];   dst[5] = s0[3];
96    dst[2] = s1[0];   dst[3] = s1[1];   dst[6] = s1[2];   dst[7] = s1[3];
97    dst[8] = s2[0];   dst[9] = s2[1];   dst[12] = s2[2];  dst[13] = s2[3];
98    dst[10] = s3[0];  dst[11] = s3[1];  dst[14] = s3[2];  dst[15] = s3[3];
99 }
100
101
102
103 /**
104  * Convert a 4x4 rect of 16-bit words from a linear layout into tiled
105  * layout (in which all 16 words are contiguous).
106  */
107 static void
108 tile_4_4_uint16(const uint16_t *src, uint16_t *dst, unsigned src_stride)
109 {
110    const uint16_t *s0 = src;
111    const uint16_t *s1 = s0 + src_stride;
112    const uint16_t *s2 = s1 + src_stride;
113    const uint16_t *s3 = s2 + src_stride;
114
115    dst[0] = s0[0];   dst[1] = s0[1];   dst[4] = s0[2];   dst[5] = s0[3];
116    dst[2] = s1[0];   dst[3] = s1[1];   dst[6] = s1[2];   dst[7] = s1[3];
117    dst[8] = s2[0];   dst[9] = s2[1];   dst[12] = s2[2];  dst[13] = s2[3];
118    dst[10] = s3[0];  dst[11] = s3[1];  dst[14] = s3[2];  dst[15] = s3[3];
119 }
120
121
122
123 /**
124  * Convert a tiled image into a linear image.
125  * \param dst_stride  dest row stride in bytes
126  */
127 void
128 lp_tiled_to_linear(const void *src, void *dst,
129                    unsigned x, unsigned y,
130                    unsigned width, unsigned height,
131                    enum pipe_format format,
132                    unsigned dst_stride,
133                    unsigned tiles_per_row)
134 {
135    assert(x % TILE_SIZE == 0);
136    assert(y % TILE_SIZE == 0);
137    /*assert(width % TILE_SIZE == 0);
138      assert(height % TILE_SIZE == 0);*/
139
140    /* Note that Z/stencil surfaces use a different tiling size than
141     * color surfaces.
142     */
143    if (util_format_is_depth_or_stencil(format)) {
144       const uint bpp = util_format_get_blocksize(format);
145       const uint src_stride = dst_stride * TILE_VECTOR_WIDTH;
146       const uint tile_w = TILE_VECTOR_WIDTH, tile_h = TILE_VECTOR_HEIGHT;
147       const uint tiles_per_row = src_stride / (tile_w * tile_h * bpp);
148
149       dst_stride /= bpp;   /* convert from bytes to words */
150
151       if (bpp == 4) {
152          const uint32_t *src32 = (const uint32_t *) src;
153          uint32_t *dst32 = (uint32_t *) dst;
154          uint i, j;
155
156          for (j = 0; j < height; j += tile_h) {
157             for (i = 0; i < width; i += tile_w) {
158                /* compute offsets in 32-bit words */
159                uint ii = i + x, jj = j + y;
160                uint src_offset = (jj / tile_h * tiles_per_row + ii / tile_w)
161                   * (tile_w * tile_h);
162                uint dst_offset = jj * dst_stride + ii;
163                untile_4_4_uint32(src32 + src_offset,
164                                  dst32 + dst_offset,
165                                  dst_stride);
166             }
167          }
168       }
169       else {
170          const uint16_t *src16 = (const uint16_t *) src;
171          uint16_t *dst16 = (uint16_t *) dst;
172          uint i, j;
173
174          assert(bpp == 2);
175
176          for (j = 0; j < height; j += tile_h) {
177             for (i = 0; i < width; i += tile_w) {
178                /* compute offsets in 16-bit words */
179                uint ii = i + x, jj = j + y;
180                uint src_offset = (jj / tile_h * tiles_per_row + ii / tile_w)
181                   * (tile_w * tile_h);
182                uint dst_offset = jj * dst_stride + ii;
183                untile_4_4_uint16(src16 + src_offset,
184                                  dst16 + dst_offset,
185                                  dst_stride);
186             }
187          }
188       }
189    }
190    else {
191       /* color image */
192       const uint bpp = 4;
193       const uint tile_w = TILE_SIZE, tile_h = TILE_SIZE;
194       const uint bytes_per_tile = tile_w * tile_h * bpp;
195       uint i, j;
196
197       for (j = 0; j < height; j += tile_h) {
198          for (i = 0; i < width; i += tile_w) {
199             uint ii = i + x, jj = j + y;
200             uint tile_offset = ((jj / tile_h) * tiles_per_row + ii / tile_w);
201             uint byte_offset = tile_offset * bytes_per_tile;
202             const uint8_t *src_tile = (uint8_t *) src + byte_offset;
203
204             lp_tile_unswizzle_4ub(format,
205                               src_tile,
206                               dst, dst_stride,
207                               ii, jj);
208          }
209       }
210    }
211 }
212
213
214 /**
215  * Convert a linear image into a tiled image.
216  * \param src_stride  source row stride in bytes
217  */
218 void
219 lp_linear_to_tiled(const void *src, void *dst,
220                    unsigned x, unsigned y,
221                    unsigned width, unsigned height,
222                    enum pipe_format format,
223                    unsigned src_stride,
224                    unsigned tiles_per_row)
225 {
226    assert(x % TILE_SIZE == 0);
227    assert(y % TILE_SIZE == 0);
228    /*
229    assert(width % TILE_SIZE == 0);
230    assert(height % TILE_SIZE == 0);
231    */
232
233    if (util_format_is_depth_or_stencil(format)) {
234       const uint bpp = util_format_get_blocksize(format);
235       const uint dst_stride = src_stride * TILE_VECTOR_WIDTH;
236       const uint tile_w = TILE_VECTOR_WIDTH, tile_h = TILE_VECTOR_HEIGHT;
237       const uint tiles_per_row = dst_stride / (tile_w * tile_h * bpp);
238
239       src_stride /= bpp;   /* convert from bytes to words */
240
241       if (bpp == 4) {
242          const uint32_t *src32 = (const uint32_t *) src;
243          uint32_t *dst32 = (uint32_t *) dst;
244          uint i, j;
245
246          for (j = 0; j < height; j += tile_h) {
247             for (i = 0; i < width; i += tile_w) {
248                /* compute offsets in 32-bit words */
249                uint ii = i + x, jj = j + y;
250                uint src_offset = jj * src_stride + ii;
251                uint dst_offset = (jj / tile_h * tiles_per_row + ii / tile_w)
252                   * (tile_w * tile_h);
253                tile_4_4_uint32(src32 + src_offset,
254                                dst32 + dst_offset,
255                                src_stride);
256             }
257          }
258       }
259       else {
260          const uint16_t *src16 = (const uint16_t *) src;
261          uint16_t *dst16 = (uint16_t *) dst;
262          uint i, j;
263
264          assert(bpp == 2);
265
266          for (j = 0; j < height; j += tile_h) {
267             for (i = 0; i < width; i += tile_w) {
268                /* compute offsets in 16-bit words */
269                uint ii = i + x, jj = j + y;
270                uint src_offset = jj * src_stride + ii;
271                uint dst_offset = (jj / tile_h * tiles_per_row + ii / tile_w)
272                   * (tile_w * tile_h);
273                tile_4_4_uint16(src16 + src_offset,
274                                dst16 + dst_offset,
275                                src_stride);
276             }
277          }
278       }
279    }
280    else {
281       const uint bpp = 4;
282       const uint tile_w = TILE_SIZE, tile_h = TILE_SIZE;
283       const uint bytes_per_tile = tile_w * tile_h * bpp;
284       uint i, j;
285
286       for (j = 0; j < height; j += TILE_SIZE) {
287          for (i = 0; i < width; i += TILE_SIZE) {
288             uint ii = i + x, jj = j + y;
289             uint tile_offset = ((jj / tile_h) * tiles_per_row + ii / tile_w);
290             uint byte_offset = tile_offset * bytes_per_tile;
291             uint8_t *dst_tile = (uint8_t *) dst + byte_offset;
292
293             lp_tile_swizzle_4ub(format,
294                              dst_tile,
295                              src, src_stride,
296                              ii, jj);
297          }
298       }
299    }
300 }
301
302
303 /**
304  * For testing only.
305  */
306 void
307 test_tiled_linear_conversion(void *data,
308                              enum pipe_format format,
309                              unsigned width, unsigned height,
310                              unsigned stride)
311 {
312    /* size in tiles */
313    unsigned wt = (width + TILE_SIZE - 1) / TILE_SIZE;
314    unsigned ht = (height + TILE_SIZE - 1) / TILE_SIZE;
315
316    uint8_t *tiled = malloc(wt * ht * TILE_SIZE * TILE_SIZE * 4);
317
318    /*unsigned tiled_stride = wt * TILE_SIZE * TILE_SIZE * 4;*/
319
320    lp_linear_to_tiled(data, tiled, 0, 0, width, height, format,
321                       stride, wt);
322
323    lp_tiled_to_linear(tiled, data, 0, 0, width, height, format,
324                       stride, wt);
325
326    free(tiled);
327 }
328