Git init
[external/libjpeg-turbo.git] / simd / jccolss2-64.asm
1 ;
2 ; jccolss2-64.asm - colorspace conversion (64-bit SSE2)
3 ;
4 ; x86 SIMD extension for IJG JPEG library
5 ; Copyright (C) 1999-2006, MIYASAKA Masaru.
6 ; Copyright (C) 2009, D. R. Commander.
7 ; For conditions of distribution and use, see copyright notice in jsimdext.inc
8 ;
9 ; This file should be assembled with NASM (Netwide Assembler),
10 ; can *not* be assembled with Microsoft's MASM or any compatible
11 ; assembler (including Borland's Turbo Assembler).
12 ; NASM is available from http://nasm.sourceforge.net/ or
13 ; http://sourceforge.net/project/showfiles.php?group_id=6208
14 ;
15 ; [TAB8]
16
17 %include "jsimdext.inc"
18
19 ; --------------------------------------------------------------------------
20
21 %define SCALEBITS       16
22
23 F_0_081 equ      5329                   ; FIX(0.08131)
24 F_0_114 equ      7471                   ; FIX(0.11400)
25 F_0_168 equ     11059                   ; FIX(0.16874)
26 F_0_250 equ     16384                   ; FIX(0.25000)
27 F_0_299 equ     19595                   ; FIX(0.29900)
28 F_0_331 equ     21709                   ; FIX(0.33126)
29 F_0_418 equ     27439                   ; FIX(0.41869)
30 F_0_587 equ     38470                   ; FIX(0.58700)
31 F_0_337 equ     (F_0_587 - F_0_250)     ; FIX(0.58700) - FIX(0.25000)
32
33 ; --------------------------------------------------------------------------
34         SECTION SEG_CONST
35
36         alignz  16
37         global  EXTN(jconst_rgb_ycc_convert_sse2)
38
39 EXTN(jconst_rgb_ycc_convert_sse2):
40
41 PW_F0299_F0337  times 4 dw  F_0_299, F_0_337
42 PW_F0114_F0250  times 4 dw  F_0_114, F_0_250
43 PW_MF016_MF033  times 4 dw -F_0_168,-F_0_331
44 PW_MF008_MF041  times 4 dw -F_0_081,-F_0_418
45 PD_ONEHALFM1_CJ times 4 dd  (1 << (SCALEBITS-1)) - 1 + (CENTERJSAMPLE << SCALEBITS)
46 PD_ONEHALF      times 4 dd  (1 << (SCALEBITS-1))
47
48         alignz  16
49
50 ; --------------------------------------------------------------------------
51         SECTION SEG_TEXT
52         BITS    64
53
54 %include "jcclrss2-64.asm"
55
56 %undef RGB_RED
57 %undef RGB_GREEN
58 %undef RGB_BLUE
59 %undef RGB_PIXELSIZE
60 %define RGB_RED 0
61 %define RGB_GREEN 1
62 %define RGB_BLUE 2
63 %define RGB_PIXELSIZE 3
64 %define jsimd_rgb_ycc_convert_sse2 jsimd_extrgb_ycc_convert_sse2
65 %include "jcclrss2-64.asm"
66
67 %undef RGB_RED
68 %undef RGB_GREEN
69 %undef RGB_BLUE
70 %undef RGB_PIXELSIZE
71 %define RGB_RED 0
72 %define RGB_GREEN 1
73 %define RGB_BLUE 2
74 %define RGB_PIXELSIZE 4
75 %define jsimd_rgb_ycc_convert_sse2 jsimd_extrgbx_ycc_convert_sse2
76 %include "jcclrss2-64.asm"
77
78 %undef RGB_RED
79 %undef RGB_GREEN
80 %undef RGB_BLUE
81 %undef RGB_PIXELSIZE
82 %define RGB_RED 2
83 %define RGB_GREEN 1
84 %define RGB_BLUE 0
85 %define RGB_PIXELSIZE 3
86 %define jsimd_rgb_ycc_convert_sse2 jsimd_extbgr_ycc_convert_sse2
87 %include "jcclrss2-64.asm"
88
89 %undef RGB_RED
90 %undef RGB_GREEN
91 %undef RGB_BLUE
92 %undef RGB_PIXELSIZE
93 %define RGB_RED 2
94 %define RGB_GREEN 1
95 %define RGB_BLUE 0
96 %define RGB_PIXELSIZE 4
97 %define jsimd_rgb_ycc_convert_sse2 jsimd_extbgrx_ycc_convert_sse2
98 %include "jcclrss2-64.asm"
99
100 %undef RGB_RED
101 %undef RGB_GREEN
102 %undef RGB_BLUE
103 %undef RGB_PIXELSIZE
104 %define RGB_RED 3
105 %define RGB_GREEN 2
106 %define RGB_BLUE 1
107 %define RGB_PIXELSIZE 4
108 %define jsimd_rgb_ycc_convert_sse2 jsimd_extxbgr_ycc_convert_sse2
109 %include "jcclrss2-64.asm"
110
111 %undef RGB_RED
112 %undef RGB_GREEN
113 %undef RGB_BLUE
114 %undef RGB_PIXELSIZE
115 %define RGB_RED 1
116 %define RGB_GREEN 2
117 %define RGB_BLUE 3
118 %define RGB_PIXELSIZE 4
119 %define jsimd_rgb_ycc_convert_sse2 jsimd_extxrgb_ycc_convert_sse2
120 %include "jcclrss2-64.asm"