Git init
[external/liboil.git] / liboil / copy / copy8x8.c
1 /*
2  * LIBOIL - Library of Optimized Inner Loops
3  * Copyright (c) 2004 David A. Schleef <ds@schleef.org>
4  * All rights reserved.
5  *
6  * Redistribution and use in source and binary forms, with or without
7  * modification, are permitted provided that the following conditions
8  * are met:
9  * 1. Redistributions of source code must retain the above copyright
10  *    notice, this list of conditions and the following disclaimer.
11  * 2. Redistributions in binary form must reproduce the above copyright
12  *    notice, this list of conditions and the following disclaimer in the
13  *    documentation and/or other materials provided with the distribution.
14  * 
15  * THIS SOFTWARE IS PROVIDED BY THE AUTHOR ``AS IS'' AND ANY EXPRESS OR
16  * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
17  * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
18  * ARE DISCLAIMED.  IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT,
19  * INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
20  * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR
21  * SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
22  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
23  * STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING
24  * IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
25  * POSSIBILITY OF SUCH DAMAGE.
26  */
27
28 #ifdef HAVE_CONFIG_H
29 #include "config.h"
30 #endif
31
32 #include <liboil/liboilfunction.h>
33
34 OIL_DECLARE_CLASS (copy8x8_u8);
35
36 #ifdef HAVE_UNALIGNED_ACCESS
37 static void
38 copy8x8_u8_ints (uint8_t *d1, int ds, const uint8_t *s1, int ss)
39 {
40   int j;
41   for (j=0;j<8;j++){
42     ((uint32_t*)d1)[0] = ((uint32_t*)s1)[0];
43     ((uint32_t*)d1)[1] = ((uint32_t*)s1)[1];
44
45     d1+=ds;
46     s1+=ss;
47   }
48 }
49 OIL_DEFINE_IMPL (copy8x8_u8_ints, copy8x8_u8);
50 #endif
51
52 #ifdef HAVE_UNALIGNED_ACCESS
53 static void
54 copy8x8_u8_ints_unrolled (uint8_t *d1, int ds, const uint8_t *s1, int ss)
55 {
56   ((uint32_t*)d1)[0] = ((uint32_t*)s1)[0];
57   ((uint32_t*)d1)[1] = ((uint32_t*)s1)[1];
58   d1+=ds; s1+=ss;
59   ((uint32_t*)d1)[0] = ((uint32_t*)s1)[0];
60   ((uint32_t*)d1)[1] = ((uint32_t*)s1)[1];
61   d1+=ds; s1+=ss;
62   ((uint32_t*)d1)[0] = ((uint32_t*)s1)[0];
63   ((uint32_t*)d1)[1] = ((uint32_t*)s1)[1];
64   d1+=ds; s1+=ss;
65   ((uint32_t*)d1)[0] = ((uint32_t*)s1)[0];
66   ((uint32_t*)d1)[1] = ((uint32_t*)s1)[1];
67   d1+=ds; s1+=ss;
68   ((uint32_t*)d1)[0] = ((uint32_t*)s1)[0];
69   ((uint32_t*)d1)[1] = ((uint32_t*)s1)[1];
70   d1+=ds; s1+=ss;
71   ((uint32_t*)d1)[0] = ((uint32_t*)s1)[0];
72   ((uint32_t*)d1)[1] = ((uint32_t*)s1)[1];
73   d1+=ds; s1+=ss;
74   ((uint32_t*)d1)[0] = ((uint32_t*)s1)[0];
75   ((uint32_t*)d1)[1] = ((uint32_t*)s1)[1];
76   d1+=ds; s1+=ss;
77   ((uint32_t*)d1)[0] = ((uint32_t*)s1)[0];
78   ((uint32_t*)d1)[1] = ((uint32_t*)s1)[1];
79 }
80 OIL_DEFINE_IMPL (copy8x8_u8_ints_unrolled, copy8x8_u8);
81 #endif
82