Merge pull request #1762 from martin-frbg/issue1710-2
[platform/upstream/openblas.git] / interface / syr2.c
1 /*********************************************************************/
2 /* Copyright 2009, 2010 The University of Texas at Austin.           */
3 /* All rights reserved.                                              */
4 /*                                                                   */
5 /* Redistribution and use in source and binary forms, with or        */
6 /* without modification, are permitted provided that the following   */
7 /* conditions are met:                                               */
8 /*                                                                   */
9 /*   1. Redistributions of source code must retain the above         */
10 /*      copyright notice, this list of conditions and the following  */
11 /*      disclaimer.                                                  */
12 /*                                                                   */
13 /*   2. Redistributions in binary form must reproduce the above      */
14 /*      copyright notice, this list of conditions and the following  */
15 /*      disclaimer in the documentation and/or other materials       */
16 /*      provided with the distribution.                              */
17 /*                                                                   */
18 /*    THIS  SOFTWARE IS PROVIDED  BY THE  UNIVERSITY OF  TEXAS AT    */
19 /*    AUSTIN  ``AS IS''  AND ANY  EXPRESS OR  IMPLIED WARRANTIES,    */
20 /*    INCLUDING, BUT  NOT LIMITED  TO, THE IMPLIED  WARRANTIES OF    */
21 /*    MERCHANTABILITY  AND FITNESS FOR  A PARTICULAR  PURPOSE ARE    */
22 /*    DISCLAIMED.  IN  NO EVENT SHALL THE UNIVERSITY  OF TEXAS AT    */
23 /*    AUSTIN OR CONTRIBUTORS BE  LIABLE FOR ANY DIRECT, INDIRECT,    */
24 /*    INCIDENTAL,  SPECIAL, EXEMPLARY,  OR  CONSEQUENTIAL DAMAGES    */
25 /*    (INCLUDING, BUT  NOT LIMITED TO,  PROCUREMENT OF SUBSTITUTE    */
26 /*    GOODS  OR  SERVICES; LOSS  OF  USE,  DATA,  OR PROFITS;  OR    */
27 /*    BUSINESS INTERRUPTION) HOWEVER CAUSED  AND ON ANY THEORY OF    */
28 /*    LIABILITY, WHETHER  IN CONTRACT, STRICT  LIABILITY, OR TORT    */
29 /*    (INCLUDING NEGLIGENCE OR OTHERWISE)  ARISING IN ANY WAY OUT    */
30 /*    OF  THE  USE OF  THIS  SOFTWARE,  EVEN  IF ADVISED  OF  THE    */
31 /*    POSSIBILITY OF SUCH DAMAGE.                                    */
32 /*                                                                   */
33 /* The views and conclusions contained in the software and           */
34 /* documentation are those of the authors and should not be          */
35 /* interpreted as representing official policies, either expressed   */
36 /* or implied, of The University of Texas at Austin.                 */
37 /*********************************************************************/
38
39 #include <stdio.h>
40 #include <ctype.h>
41 #include "common.h"
42 #ifdef FUNCTION_PROFILE
43 #include "functable.h"
44 #endif
45
46 #ifdef XDOUBLE
47 #define ERROR_NAME "QSYR2 "
48 #elif defined(DOUBLE)
49 #define ERROR_NAME "DSYR2 "
50 #else
51 #define ERROR_NAME "SSYR2 "
52 #endif
53
54 static int (*syr2[])(BLASLONG, FLOAT, FLOAT *, BLASLONG, FLOAT *, BLASLONG, FLOAT *, BLASLONG, FLOAT *) = {
55 #ifdef XDOUBLE
56   qsyr2_U, qsyr2_L,
57 #elif defined(DOUBLE)
58   dsyr2_U, dsyr2_L,
59 #else
60   ssyr2_U, ssyr2_L,
61 #endif
62 };
63
64 #ifdef SMP
65 static int (*syr2_thread[])(BLASLONG, FLOAT, FLOAT *, BLASLONG, FLOAT *, BLASLONG, FLOAT *, BLASLONG, FLOAT *, int) = {
66 #ifdef XDOUBLE
67   qsyr2_thread_U, qsyr2_thread_L,
68 #elif defined(DOUBLE)
69   dsyr2_thread_U, dsyr2_thread_L,
70 #else
71   ssyr2_thread_U, ssyr2_thread_L,
72 #endif
73 };
74 #endif
75
76 #ifndef CBLAS
77
78 void NAME(char *UPLO, blasint *N, FLOAT  *ALPHA,
79          FLOAT  *x, blasint *INCX, FLOAT *y, blasint *INCY, FLOAT *a, blasint *LDA){
80
81   char uplo_arg = *UPLO;
82   blasint n             = *N;
83   FLOAT alpha   = *ALPHA;
84   blasint lda   = *LDA;
85   blasint incx  = *INCX;
86   blasint incy  = *INCY;
87
88   blasint info;
89   int uplo;
90   FLOAT *buffer;
91 #ifdef SMP
92   int nthreads;
93 #endif
94
95   PRINT_DEBUG_NAME;
96
97   TOUPPER(uplo_arg);
98   uplo  = -1;
99
100   if (uplo_arg  == 'U') uplo  = 0;
101   if (uplo_arg  == 'L') uplo  = 1;
102
103   info = 0;
104
105   if (lda  < MAX(1, n))   info =  9;
106   if (incy == 0)          info =  7;
107   if (incx == 0)          info =  5;
108   if (n < 0)              info =  2;
109   if (uplo  < 0)          info =  1;
110
111   if (info != 0) {
112     BLASFUNC(xerbla)(ERROR_NAME, &info, sizeof(ERROR_NAME));
113     return;
114   }
115
116 #else
117
118 void CNAME(enum CBLAS_ORDER order, enum CBLAS_UPLO Uplo, blasint n, FLOAT alpha, FLOAT *x, blasint incx, FLOAT *y, blasint incy, FLOAT *a, blasint lda) {
119
120   FLOAT *buffer;
121   int uplo;
122   blasint info;
123 #ifdef SMP
124   int nthreads;
125 #endif
126
127   PRINT_DEBUG_CNAME;
128
129   uplo  = -1;
130   info  =  0;
131
132   if (order == CblasColMajor) {
133
134     if (Uplo == CblasUpper) uplo  = 0;
135     if (Uplo == CblasLower) uplo  = 1;
136
137     info = -1;
138
139     if (lda  < MAX(1, n))   info =  9;
140     if (incy == 0)          info =  7;
141     if (incx == 0)          info =  5;
142     if (n < 0)              info =  2;
143     if (uplo  < 0)          info =  1;
144   }
145
146   if (order == CblasRowMajor) {
147
148     if (Uplo == CblasUpper) uplo  = 1;
149     if (Uplo == CblasLower) uplo  = 0;
150
151     info = -1;
152
153     if (lda  < MAX(1, n))   info =  9;
154     if (incy == 0)          info =  7;
155     if (incx == 0)          info =  5;
156     if (n < 0)              info =  2;
157     if (uplo  < 0)          info =  1;
158   }
159
160   if (info >= 0) {
161     BLASFUNC(xerbla)(ERROR_NAME, &info, sizeof(ERROR_NAME));
162     return;
163   }
164
165 #endif
166
167   if (n == 0) return;
168
169   if (alpha == ZERO) return;
170
171   IDEBUG_START;
172
173   FUNCTION_PROFILE_START();
174
175   if (incx < 0 ) x -= (n - 1) * incx;
176   if (incy < 0 ) y -= (n - 1) * incy;
177
178   buffer = (FLOAT *)blas_memory_alloc(1);
179
180 #ifdef SMP
181   nthreads = num_cpu_avail(2);
182
183   if (nthreads == 1) {
184 #endif
185
186     (syr2[uplo])(n, alpha, x, incx, y, incy, a, lda, buffer);
187
188 #ifdef SMP
189   } else {
190
191     (syr2_thread[uplo])(n, alpha, x, incx, y, incy, a, lda, buffer, nthreads);
192
193   }
194 #endif
195
196   blas_memory_free(buffer);
197
198   FUNCTION_PROFILE_END(1, n * n / 2 + 2 * n, 2 * n * n);
199
200   IDEBUG_END;
201
202   return;
203 }