Git init
[external/liboil.git] / liboil / i386 / conv_3dnow.c
1 /*
2  * LIBOIL - Library of Optimized Inner Loops
3  * Copyright (c) 2003,2004 David A. Schleef <ds@schleef.org>
4  * All rights reserved.
5  *
6  * Redistribution and use in source and binary forms, with or without
7  * modification, are permitted provided that the following conditions
8  * are met:
9  * 1. Redistributions of source code must retain the above copyright
10  *    notice, this list of conditions and the following disclaimer.
11  * 2. Redistributions in binary form must reproduce the above copyright
12  *    notice, this list of conditions and the following disclaimer in the
13  *    documentation and/or other materials provided with the distribution.
14  * 
15  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR ``AS IS'' AND ANY EXPRESS OR
16  * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
17  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
18  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT,
19  * INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
20  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR
21  * SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
22  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
23  * STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
24  * IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
25  * POSSIBILITY OF SUCH DAMAGE.
26  */
27
28 #ifdef HAVE_CONFIG_H
29 #include "config.h"
30 #endif
31 #include <liboil/liboilfunction.h>
32 #include <liboil/liboilclasses.h>
33
34
35 /* suboptimal */
36 static void
37 conv_f32_s16_3dnow (float *dst, int dst_stride, int16_t * src, int src_stride,
38     int n)
39 {
40   int i;
41
42   for (i = 0; i < n; i++) {
43     asm volatile ("  movswl 0(%0), %%eax \n"
44         "  movd %%eax, %%mm0 \n"
45         "  pi2fd %%mm0, %%mm0 \n" "  movd %%mm0, 0(%1) \n"
46         ::"r" (src), "r" (dst)
47         :"eax");
48
49     dst = OIL_OFFSET (dst, dst_stride);
50     src = OIL_OFFSET (src, src_stride);
51   }
52   asm volatile ("emms");
53 }
54
55 OIL_DEFINE_IMPL_FULL (conv_f32_s16_3dnow, conv_f32_s16, OIL_IMPL_FLAG_MMX|OIL_IMPL_FLAG_3DNOW);
56
57 #ifdef ENABLE_BROKEN_IMPLS
58 /* suboptimal */
59 /* This appears to fail because of differences in rounding of half
60  * integers. */
61 static void
62 conv_s32_f32_3dnow (int32_t * dst, int dst_stride, float *src, int src_stride,
63     int n)
64 {
65   int i;
66   const float constants[][2] = {
67     { 0.5,  0.5},
68     {-1.0, -1.0}
69   };
70
71   for (i = 0; i < n; i++) {
72     asm volatile (
73         "  movq 0(%0), %%mm0 \n"
74         "  pxor %%mm1, %%mm1 \n"
75         "  pfcmpgt %%mm0, %%mm1 \n"
76         "  movq %%mm0, %%mm2 \n"
77         "  pfadd 0(%2), %%mm0 \n"
78         "  pfcmpeq %%mm0, %%mm2 \n"
79         "  pandn %%mm1, %%mm2 \n"
80         "  pf2id %%mm0, %%mm0 \n"
81         "  paddd %%mm2, %%mm0 \n"
82         "  movd %%mm0, 0(%1) \n"
83         :
84         :"r" (src), "r" (dst), "r" (constants)
85         );
86
87     dst = OIL_OFFSET (dst, dst_stride);
88     src = OIL_OFFSET (src, src_stride);
89   }
90   asm volatile ("emms");
91 }
92
93 OIL_DEFINE_IMPL_FULL (conv_s32_f32_3dnow, conv_s32_f32, OIL_IMPL_FLAG_MMX|OIL_IMPL_FLAG_3DNOW);
94 #endif
95