Imported Upstream version 0.3.17
[platform/upstream/liboil.git] / liboil / i386_amd64 / convert.c
1 /*
2  * LIBOIL - Library of Optimized Inner Loops
3  * Copyright (c) 2006 David A. Schleef <ds@schleef.org>
4  * All rights reserved.
5  *
6  * Redistribution and use in source and binary forms, with or without
7  * modification, are permitted provided that the following conditions
8  * are met:
9  * 1. Redistributions of source code must retain the above copyright
10  *    notice, this list of conditions and the following disclaimer.
11  * 2. Redistributions in binary form must reproduce the above copyright
12  *    notice, this list of conditions and the following disclaimer in the
13  *    documentation and/or other materials provided with the distribution.
14  * 
15  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR ``AS IS'' AND ANY EXPRESS OR
16  * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
17  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
18  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT,
19  * INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
20  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR
21  * SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
22  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
23  * STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
24  * IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
25  * POSSIBILITY OF SUCH DAMAGE.
26  */
27
28 #ifdef HAVE_CONFIG_H
29 #include "config.h"
30 #endif
31 #include <liboil/liboilfunction.h>
32 #include <liboil/liboilclasses.h>
33
34 static void
35 convert_u8_s16_mmx (uint8_t * dest, const int16_t * src, int n)
36 {
37   while(n&7) {
38     int x;
39     x = src[0];
40     if (x<0) x = 0;
41     if (x>255) x = 255;
42     dest[0] = x;
43     src++;
44     dest++;
45     n--;
46   }
47   if (n==0) return;
48
49   n>>=3;
50   __asm__ __volatile__ ("\n"
51       "1:\n"
52       "  movq 0(%1), %%mm0\n"
53       "  packuswb 8(%1), %%mm0\n"
54       "  movq %%mm0, 0(%0)\n"
55       "  add $16, %1\n"
56       "  add $8, %0\n"
57       "  decl %2\n"
58       "  jg 1b\n"
59       "  emms\n"
60       : "+r" (dest), "+r" (src), "+r" (n));
61 }
62 OIL_DEFINE_IMPL_FULL (convert_u8_s16_mmx, convert_u8_s16, OIL_IMPL_FLAG_MMX);
63
64 static void
65 convert_u8_s16_mmx_2 (uint8_t * dest, const int16_t * src, int n)
66 {
67   while(n&7) {
68     int x;
69     x = src[0];
70     if (x<0) x = 0;
71     if (x>255) x = 255;
72     dest[0] = x;
73     src++;
74     dest++;
75     n--;
76   }
77   if (n==0) return;
78
79   n>>=3;
80   if (n&1) {
81     __asm__ __volatile__ ("\n"
82         "  movq 0(%1), %%mm0\n"
83         "  packuswb 8(%1), %%mm0\n"
84         "  movq %%mm0, 0(%0)\n"
85         "  add $16, %1\n"
86         "  add $8, %0\n"
87         : "+r" (dest), "+r" (src), "+r" (n));
88   }
89
90   n >>= 1;
91   if (n > 0) {
92     __asm__ __volatile__ ("\n"
93         "2:\n"
94         "  movq 0(%1), %%mm0\n"
95         "  packuswb 8(%1), %%mm0\n"
96         "  movq %%mm0, 0(%0)\n"
97         "  movq 16(%1), %%mm0\n"
98         "  packuswb 24(%1), %%mm0\n"
99         "  movq %%mm0, 8(%0)\n"
100         "  add $32, %1\n"
101         "  add $16, %0\n"
102         "  decl %2\n"
103         "  jg 2b\n"
104         : "+r" (dest), "+r" (src), "+r" (n));
105   }
106   __asm__ __volatile__ ("emms\n");
107 }
108 OIL_DEFINE_IMPL_FULL (convert_u8_s16_mmx_2, convert_u8_s16, OIL_IMPL_FLAG_MMX);
109
110 static void
111 convert_s16_u8_mmx (int16_t * dest, const uint8_t * src, int n)
112 {
113   while(n&7) {
114     dest[0] = src[0];
115     src++;
116     dest++;
117     n--;
118   }
119   if (n==0) return;
120
121   n>>=3;
122
123   __asm__ __volatile__ ("\n"
124       "  pxor %%mm0, %%mm0\n"
125       "1:\n"
126       "  movd 0(%1), %%mm1\n"
127       "  punpcklbw %%mm0, %%mm1\n"
128       "  movq %%mm1, 0(%0)\n"
129       "   movd 4(%1), %%mm2\n"
130       "   punpcklbw %%mm0, %%mm2\n"
131       "   movq %%mm2, 8(%0)\n"
132       "  add $8, %1\n"
133       "  add $16, %0\n"
134       "  decl %2\n"
135       "  jg 1b\n"
136       "  emms\n"
137       : "+r" (dest), "+r" (src), "+r" (n));
138 }
139 OIL_DEFINE_IMPL_FULL (convert_s16_u8_mmx, convert_s16_u8, OIL_IMPL_FLAG_MMX);
140