ac60eae5b62d454d92849f02bf6afe7678cb5f44
[platform/upstream/openblas.git] / Makefile.system
1 #
2 # Include user definition
3 #
4
5 # TO suppress recursive includes
6 INCLUDED = 1
7
8 ifndef TOPDIR
9 TOPDIR = . 
10 endif
11
12 # we need to use the host system's architecture for getarch compile options even especially when cross-compiling
13 HOSTARCH := $(shell uname -m)
14 ifeq ($(HOSTARCH), amd64)
15 HOSTARCH=x86_64
16 endif
17
18 # Catch conflicting usage of ARCH in some BSD environments
19 ifeq ($(ARCH), amd64)
20 override ARCH=x86_64
21 else ifeq ($(ARCH), powerpc64)
22 override ARCH=power
23 else ifeq ($(ARCH), powerpc64le)
24 override ARCH=power
25 else ifeq ($(ARCH), powerpc)
26 override ARCH=power
27 else ifeq ($(ARCH), i386)
28 override ARCH=x86
29 else ifeq ($(ARCH), armv6)
30 override ARCH=arm
31 else ifeq ($(ARCH), armv7)
32 override ARCH=arm
33 else ifeq ($(ARCH), aarch64)
34 override ARCH=arm64
35 else ifeq ($(ARCH), mipsel)
36 override ARCH=mips
37 else ifeq ($(ARCH), mips64el)
38 override ARCH=mips64
39 else ifeq ($(ARCH), zarch)
40 override ARCH=zarch
41 endif
42
43 NETLIB_LAPACK_DIR = $(TOPDIR)/lapack-netlib
44
45 # Default C compiler
46 # - Only set if not specified on the command line or inherited from the environment.
47 # - CC is an implicit variable so neither '?=' or 'ifndef' can be used.
48 #   http://stackoverflow.com/questions/4029274/mingw-and-make-variables
49 # - Default value is 'cc' which is not always a valid command (e.g. MinGW).
50 ifeq ($(origin CC),default)
51
52 # Check if $(CC) refers to a valid command and set the value to gcc if not
53 ifneq ($(findstring cmd.exe,$(SHELL)),)
54 ifeq ($(shell where $(CC) 2>NUL),)
55 CC = gcc
56 endif
57 else # POSIX-ish
58 ifeq ($(shell command -v $(CC) 2>/dev/null),)
59 ifeq ($(shell uname -s),Darwin)
60 CC = clang
61 # EXTRALIB += -Wl,-no_compact_unwind
62 else
63 CC = gcc
64 endif # Darwin
65 endif # CC exists
66 endif # Shell is sane
67
68 endif # CC is set to default
69
70 # Default Fortran compiler (FC) is selected by f_check.
71
72 ifndef MAKEFILE_RULE
73 include $(TOPDIR)/Makefile.rule
74 else
75 include $(TOPDIR)/$(MAKEFILE_RULE)
76 endif
77
78 #
79 #  Beginning of system configuration
80 #
81 ifneq ($(BUILD_SINGLE),1)
82 ifneq ($(BUILD_DOUBLE),1)
83 ifneq ($(BUILD_COMPLEX),1)
84 ifneq ($(BUILD_COMPLEX16),1)
85 override BUILD_SINGLE=1
86 override BUILD_DOUBLE=1
87 override BUILD_COMPLEX=1
88 override BUILD_COMPLEX16=1
89 endif
90 endif
91 endif
92 endif
93
94 ifndef HOSTCC
95 HOSTCC   = $(CC)
96 endif
97
98 ifdef TARGET
99 GETARCH_FLAGS := -DFORCE_$(TARGET)
100 GETARCH_FLAGS += -DUSER_TARGET
101 ifeq ($(TARGET), GENERIC)
102 ifeq ($(DYNAMIC_ARCH), 1)
103 override NO_EXPRECISION=1
104 export NO_EXPRECISION
105 endif
106 endif
107 endif
108
109 # Force fallbacks for 32bit
110
111 ifeq ($(BINARY), 32)
112 ifeq ($(TARGET), HASWELL)
113 GETARCH_FLAGS := -DFORCE_NEHALEM
114 endif
115 ifeq ($(TARGET), SKYLAKEX)
116 GETARCH_FLAGS := -DFORCE_NEHALEM
117 endif
118 ifeq ($(TARGET), COOPERLAKE)
119 GETARCH_FLAGS := -DFORCE_NEHALEM
120 endif
121 ifeq ($(TARGET), SAPPHIRERAPIDS)
122 GETARCH_FLAGS := -DFORCE_NEHALEM
123 endif
124 ifeq ($(TARGET), SANDYBRIDGE)
125 GETARCH_FLAGS := -DFORCE_NEHALEM
126 endif
127 ifeq ($(TARGET), BULLDOZER)
128 GETARCH_FLAGS := -DFORCE_BARCELONA
129 endif
130 ifeq ($(TARGET), PILEDRIVER)
131 GETARCH_FLAGS := -DFORCE_BARCELONA
132 endif
133 ifeq ($(TARGET), STEAMROLLER)
134 GETARCH_FLAGS := -DFORCE_BARCELONA
135 endif
136 ifeq ($(TARGET), EXCAVATOR)
137 GETARCH_FLAGS := -DFORCE_BARCELONA
138 endif
139 ifeq ($(TARGET), ZEN)
140 GETARCH_FLAGS := -DFORCE_BARCELONA
141 endif
142 ifeq ($(TARGET), ARMV8)
143 GETARCH_FLAGS := -DFORCE_ARMV7
144 endif
145 ifeq ($(TARGET), POWER8)
146 GETARCH_FLAGS := -DFORCE_POWER6
147 endif
148 ifeq ($(TARGET), POWER9)
149 GETARCH_FLAGS := -DFORCE_POWER6
150 endif
151 ifeq ($(TARGET), POWER10)
152 GETARCH_FLAGS := -DFORCE_POWER6
153 endif
154 endif
155
156 #TARGET_CORE will override TARGET which is used in DYNAMIC_ARCH=1.
157 #
158 ifdef TARGET_CORE
159 GETARCH_FLAGS := -DFORCE_$(TARGET_CORE)
160 endif
161
162 # Force fallbacks for 32bit
163
164 ifeq ($(BINARY), 32)
165 ifeq ($(TARGET_CORE), HASWELL)
166 GETARCH_FLAGS := -DFORCE_NEHALEM
167 endif
168 ifeq ($(TARGET_CORE), SKYLAKEX)
169 GETARCH_FLAGS := -DFORCE_NEHALEM
170 endif
171 ifeq ($(TARGET_CORE), COOPERLAKE)
172 GETARCH_FLAGS := -DFORCE_NEHALEM
173 endif
174 ifeq ($(TARGET_CORE), SAPPHIRERAPIDS)
175 GETARCH_FLAGS := -DFORCE_NEHALEM
176 endif
177 ifeq ($(TARGET_CORE), SANDYBRIDGE)
178 GETARCH_FLAGS := -DFORCE_NEHALEM
179 endif
180 ifeq ($(TARGET_CORE), BULLDOZER)
181 GETARCH_FLAGS := -DFORCE_BARCELONA
182 endif
183 ifeq ($(TARGET_CORE), PILEDRIVER)
184 GETARCH_FLAGS := -DFORCE_BARCELONA
185 endif
186 ifeq ($(TARGET_CORE), STEAMROLLER)
187 GETARCH_FLAGS := -DFORCE_BARCELONA
188 endif
189 ifeq ($(TARGET_CORE), EXCAVATOR)
190 GETARCH_FLAGS := -DFORCE_BARCELONA
191 endif
192 ifeq ($(TARGET_CORE), ZEN)
193 GETARCH_FLAGS := -DFORCE_BARCELONA
194 endif
195 endif
196
197
198 # On x86_64 build getarch with march=native unless the compiler is PGI. This is required to detect AVX512 support in getarch.
199 ifeq ($(HOSTARCH), x86_64)
200 ifeq ($(findstring pgcc,$(HOSTCC))$(findstring nvc,$(HOSTCC)),)
201 GETARCH_FLAGS += -march=native
202 endif
203 endif
204
205 ifdef INTERFACE64
206 ifneq ($(INTERFACE64), 0)
207 GETARCH_FLAGS   += -DUSE64BITINT
208 endif
209 endif
210
211 ifndef GEMM_MULTITHREAD_THRESHOLD
212 GEMM_MULTITHREAD_THRESHOLD=4
213 endif
214 GETARCH_FLAGS   += -DGEMM_MULTITHREAD_THRESHOLD=$(GEMM_MULTITHREAD_THRESHOLD)
215
216 ifeq ($(NO_AVX), 1)
217 GETARCH_FLAGS   += -DNO_AVX
218 endif
219
220 ifeq ($(BINARY), 32)
221 GETARCH_FLAGS   += -DNO_AVX -DNO_AVX2 -DNO_AVX512
222 NO_AVX512 = 1
223 endif
224
225 ifeq ($(NO_AVX2), 1)
226 GETARCH_FLAGS   += -DNO_AVX2
227 endif
228
229 ifeq ($(NO_AVX512), 1)
230 GETARCH_FLAGS   += -DNO_AVX512
231 endif
232
233 ifeq ($(DEBUG), 1)
234 GETARCH_FLAGS   += -g
235 endif
236
237 ifeq ($(QUIET_MAKE), 1)
238 MAKE += -s
239 endif
240
241 ifndef NO_PARALLEL_MAKE
242 NO_PARALLEL_MAKE=0
243 endif
244 GETARCH_FLAGS   += -DNO_PARALLEL_MAKE=$(NO_PARALLEL_MAKE)
245
246 ifdef MAKE_NB_JOBS
247 GETARCH_FLAGS += -DMAKE_NB_JOBS=$(MAKE_NB_JOBS)
248 endif
249
250 ifeq ($(HOSTCC), loongcc)
251 GETARCH_FLAGS  += -static
252 endif
253
254 #if don't use Fortran, it will only compile CBLAS.
255 ifeq ($(ONLY_CBLAS), 1)
256 NO_LAPACK = 1
257 else
258 ONLY_CBLAS = 0
259 endif
260
261 #For small matrix optimization
262 ifeq ($(ARCH), x86_64)
263 SMALL_MATRIX_OPT = 1
264 else ifeq ($(CORE), POWER10)
265 SMALL_MATRIX_OPT = 1
266 endif
267 ifeq ($(SMALL_MATRIX_OPT), 1)
268 CCOMMON_OPT += -DSMALL_MATRIX_OPT
269 endif
270
271 # This operation is expensive, so execution should be once.
272 ifndef GOTOBLAS_MAKEFILE
273 export GOTOBLAS_MAKEFILE = 1
274
275 # Determine if the assembler is GNU Assembler
276 HAVE_GAS := $(shell $(AS) -v < /dev/null 2>&1 | grep GNU 2>&1 >/dev/null ; echo $$?)
277 GETARCH_FLAGS += -DHAVE_GAS=$(HAVE_GAS)
278
279 # Generating Makefile.conf and config.h
280 DUMMY := $(shell $(MAKE) -C $(TOPDIR) -f Makefile.prebuild CC="$(CC)" FC="$(FC)" HOSTCC="$(HOSTCC)" HOST_CFLAGS="$(GETARCH_FLAGS)" CFLAGS="$(CFLAGS)" BINARY=$(BINARY) USE_OPENMP=$(USE_OPENMP) DYNAMIC_ARCH=$(DYNAMIC_ARCH) TARGET_CORE=$(TARGET_CORE) ONLY_CBLAS=$(ONLY_CBLAS) TARGET=$(TARGET) all)
281
282 ifndef TARGET_CORE
283 include $(TOPDIR)/Makefile.conf
284 else
285 HAVE_NEON=
286 HAVE_VFP=
287 HAVE_VFPV3=
288 HAVE_VFPV4=
289 HAVE_MMX=
290 HAVE_SSE=
291 HAVE_SSE2=
292 HAVE_SSE3=
293 HAVE_SSSE3=
294 HAVE_SSE4_1=
295 HAVE_SSE4_2=
296 HAVE_SSE4A=
297 HAVE_SSE5=
298 HAVE_AVX=
299 HAVE_AVX2=
300 HAVE_FMA3=
301 include $(TOPDIR)/Makefile_kernel.conf
302 endif
303
304 endif
305
306 ifndef NUM_PARALLEL
307 NUM_PARALLEL = 1
308 endif
309
310 ifndef NUM_THREADS
311 NUM_THREADS = $(NUM_CORES)
312 endif
313
314 ifeq ($(NUM_THREADS), 1)
315 override USE_THREAD = 0
316 override USE_OPENMP = 0
317 endif
318
319 ifdef USE_THREAD
320 ifeq ($(USE_THREAD), 0)
321 SMP =
322 else
323 SMP = 1
324 endif
325 else
326 ifeq ($(NUM_THREADS), 1)
327 SMP =
328 else
329 SMP = 1
330 endif
331 endif
332
333 ifeq ($(SMP), 1)
334 USE_LOCKING = 
335 endif
336
337 ifndef NEED_PIC
338 NEED_PIC = 1
339 endif
340
341 ARFLAGS =
342 CPP     = $(COMPILER) -E
343 AR      ?= $(CROSS_SUFFIX)ar
344 AS      ?= $(CROSS_SUFFIX)as
345 LD      ?= $(CROSS_SUFFIX)ld
346 RANLIB  ?= $(CROSS_SUFFIX)ranlib
347 NM      = $(CROSS_SUFFIX)nm
348 DLLWRAP = $(CROSS_SUFFIX)dllwrap
349 OBJCOPY = $(CROSS_SUFFIX)objcopy
350 OBJCONV = $(CROSS_SUFFIX)objconv
351
352
353 # When fortran support was either not detected or actively deselected, only build BLAS.
354 ifeq ($(NOFORTRAN), 1)
355 C_LAPACK = 1
356 override FEXTRALIB = 
357 endif
358
359 ifeq ($(C_COMPILER), GCC)
360 GCCVERSIONGTEQ4 := $(shell expr `$(CC) -dumpversion | cut -f1 -d.` \>= 4)
361 GCCVERSIONGT4 := $(shell expr `$(CC) -dumpversion | cut -f1 -d.` \> 4)
362 GCCVERSIONGT5 := $(shell expr `$(CC) -dumpversion | cut -f1 -d.` \> 5)
363 GCCVERSIONGTEQ7 := $(shell expr `$(CC) -dumpversion | cut -f1 -d.` \>= 7)
364 GCCVERSIONGTEQ8 := $(shell expr `$(CC) -dumpversion | cut -f1 -d.` \>= 8)
365 GCCVERSIONGTEQ9 := $(shell expr `$(CC) -dumpversion | cut -f1 -d.` \>= 9)
366 GCCVERSIONGTEQ11 := $(shell expr `$(CC) -dumpversion | cut -f1 -d.` \>= 11)
367 GCCVERSIONGTEQ10 := $(shell expr `$(CC) -dumpversion | cut -f1 -d.` \>= 10)
368 # Note that the behavior of -dumpversion is compile-time-configurable for
369 # gcc-7.x and newer. Use -dumpfullversion there
370 ifeq ($(GCCVERSIONGTEQ7),1)
371         GCCDUMPVERSION_PARAM := -dumpfullversion
372 else
373         GCCDUMPVERSION_PARAM := -dumpversion
374 endif
375 GCCMINORVERSIONGTEQ1 := $(shell expr `$(CC) $(GCCDUMPVERSION_PARAM) | cut -f2 -d.` \>= 1)
376 GCCMINORVERSIONGTEQ2 := $(shell expr `$(CC) $(GCCDUMPVERSION_PARAM) | cut -f2 -d.` \>= 2)
377 GCCMINORVERSIONGTEQ4 := $(shell expr `$(CC) $(GCCDUMPVERSION_PARAM) | cut -f2 -d.` \>= 4)
378 GCCMINORVERSIONGTEQ7 := $(shell expr `$(CC) $(GCCDUMPVERSION_PARAM) | cut -f2 -d.` \>= 7)
379 endif
380
381 #
382 #  OS dependent settings
383 #
384
385 ifeq ($(OSNAME), Darwin)
386 ifndef MACOSX_DEPLOYMENT_TARGET
387 export MACOSX_DEPLOYMENT_TARGET=10.8
388 endif
389 MD5SUM = md5 -r
390 endif
391
392 ifneq (,$(findstring $(OSNAME), FreeBSD OpenBSD DragonFly))
393 MD5SUM = md5 -r
394 endif
395
396 ifeq ($(OSNAME), NetBSD)
397 MD5SUM = md5 -n
398 endif
399
400 ifeq ($(OSNAME), Linux)
401 EXTRALIB        += -lm
402 NO_EXPRECISION = 1
403 endif
404
405 ifeq ($(OSNAME), Android)
406 EXTRALIB        += -lm
407 endif
408
409 ifeq ($(OSNAME), AIX)
410 EXTRALIB        += -lm
411 endif
412
413 ifeq ($(OSNAME), FreeBSD)
414 ifeq ($(ARCH), $(filter $(ARCH),arm arm64))
415 EXTRALIB        += -lm
416 endif
417 endif
418
419 ifeq ($(OSNAME), WINNT)
420 NEED_PIC = 0
421 NO_EXPRECISION = 1
422
423 EXTRALIB        += -defaultlib:advapi32
424
425 SUFFIX  = obj
426 PSUFFIX = pobj
427 LIBSUFFIX = a
428
429 ifeq ($(C_COMPILER), CLANG)
430 CCOMMON_OPT     += -DMS_ABI
431 endif
432
433 #Version tests for supporting specific features (MS_ABI, POWER9 intrinsics)
434 ifeq ($(GCCVERSIONGT4), 1)
435 # GCC Major version > 4
436 # It is compatible with MSVC ABI.
437 CCOMMON_OPT     += -DMS_ABI
438 endif
439
440 ifeq ($(GCCVERSIONGTEQ4), 1)
441 ifeq ($(GCCMINORVERSIONGTEQ7), 1)
442 # GCC Version >=4.7
443 # It is compatible with MSVC ABI.
444 CCOMMON_OPT     += -DMS_ABI
445 endif
446 endif
447
448 # Ensure the correct stack alignment on Win32
449 # http://permalink.gmane.org/gmane.comp.lib.openblas.general/97
450 ifeq ($(ARCH), x86)
451 CCOMMON_OPT += -mincoming-stack-boundary=2
452 FCOMMON_OPT += -mincoming-stack-boundary=2
453 endif
454
455 endif
456
457 ifeq ($(OSNAME), Interix)
458 NEED_PIC = 0
459 NO_EXPRECISION = 1
460
461 INTERIX_TOOL_DIR = /opt/gcc.3.3/i586-pc-interix3/bin
462 endif
463
464 ifeq ($(OSNAME), CYGWIN_NT)
465 NEED_PIC = 0
466 NO_EXPRECISION = 1
467 OS_CYGWIN_NT = 1
468 endif
469
470 ifneq ($(OSNAME), WINNT)
471 ifneq ($(OSNAME), CYGWIN_NT)
472 ifneq ($(OSNAME), Interix)
473 ifneq ($(OSNAME), Android)
474 ifdef SMP
475 EXTRALIB   += -lpthread
476 endif
477 endif
478 endif
479 endif
480 endif
481
482 # ifeq logical or
483 ifeq ($(OSNAME), $(filter $(OSNAME),WINNT CYGWIN_NT Interix))
484 OS_WINDOWS=1
485 endif
486
487 ifdef QUAD_PRECISION
488 CCOMMON_OPT     += -DQUAD_PRECISION
489 NO_EXPRECISION = 1
490 endif
491
492 ifneq ($(ARCH), x86)
493 ifneq ($(ARCH), x86_64)
494 NO_EXPRECISION = 1
495 endif
496 endif
497
498 ifdef UTEST_CHECK
499 CCOMMON_OPT     += -DUTEST_CHECK
500 SANITY_CHECK = 1
501 endif
502
503 ifdef SANITY_CHECK
504 CCOMMON_OPT     += -DSANITY_CHECK -DREFNAME=$(*F)f$(BU)
505 endif
506
507 MAX_STACK_ALLOC ?= 2048
508 ifneq ($(MAX_STACK_ALLOC), 0)
509 CCOMMON_OPT     += -DMAX_STACK_ALLOC=$(MAX_STACK_ALLOC)
510 endif
511
512 ifdef USE_LOCKING
513 ifneq ($(USE_LOCKING), 0)
514 CCOMMON_OPT     += -DUSE_LOCKING
515 endif
516 endif
517
518 #
519 #  Architecture dependent settings
520 #
521
522 ifeq ($(ARCH), x86)
523 ifndef BINARY
524 NO_BINARY_MODE  = 1
525 endif
526
527 ifeq ($(CORE), generic)
528 NO_EXPRECISION = 1
529 endif
530
531 ifndef NO_EXPRECISION
532 ifeq ($(F_COMPILER), GFORTRAN)
533 # ifeq logical or. GCC or LSB
534 ifeq ($(C_COMPILER), $(filter $(C_COMPILER),GCC LSB))
535 EXPRECISION     = 1
536 CCOMMON_OPT     += -DEXPRECISION -m128bit-long-double
537 FCOMMON_OPT     += -m128bit-long-double
538 endif
539 ifeq ($(C_COMPILER), CLANG)
540 EXPRECISION     = 1
541 CCOMMON_OPT     += -DEXPRECISION
542 FCOMMON_OPT     += -m128bit-long-double
543 endif
544 endif
545 endif
546 endif
547
548 ifeq ($(ARCH), x86_64)
549
550 ifeq ($(CORE), generic)
551 NO_EXPRECISION = 1
552 endif
553
554 ifndef NO_EXPRECISION
555 ifeq ($(F_COMPILER), GFORTRAN)
556 # ifeq logical or. GCC or LSB
557 ifeq ($(C_COMPILER), $(filter $(C_COMPILER),GCC LSB))
558 EXPRECISION     = 1
559 CCOMMON_OPT     += -DEXPRECISION -m128bit-long-double
560 FCOMMON_OPT     += -m128bit-long-double
561 endif
562 ifeq ($(C_COMPILER), CLANG)
563 EXPRECISION     = 1
564 CCOMMON_OPT     += -DEXPRECISION
565 FCOMMON_OPT     += -m128bit-long-double
566 endif
567 endif
568 endif
569 endif
570
571 ifeq ($(C_COMPILER), INTEL)
572 CCOMMON_OPT    += -wd981
573 endif
574
575
576 ifeq ($(USE_OPENMP), 1)
577
578 #check
579 ifeq ($(USE_THREAD), 0)
580 $(error OpenBLAS: Cannot set both USE_OPENMP=1 and USE_THREAD=0. The USE_THREAD=0 is only for building single thread version.)
581 endif
582
583 # ifeq logical or. GCC or LSB
584 ifeq ($(C_COMPILER), $(filter $(C_COMPILER),GCC LSB))
585 CCOMMON_OPT    += -fopenmp
586 endif
587
588 ifeq ($(C_COMPILER), CLANG)
589 CCOMMON_OPT    += -fopenmp
590 endif
591
592 ifeq ($(C_COMPILER), INTEL)
593 CCOMMON_OPT    += -fopenmp
594 endif
595
596 ifeq ($(C_COMPILER), PGI)
597 CCOMMON_OPT    += -mp
598 endif
599
600 ifeq ($(C_COMPILER), OPEN64)
601 CCOMMON_OPT    += -mp
602 CEXTRALIB   += -lstdc++
603 endif
604
605 ifeq ($(C_COMPILER), PATHSCALE)
606 CCOMMON_OPT    += -mp
607 endif
608 endif
609
610
611 ifeq ($(DYNAMIC_ARCH), 1)
612 ifeq ($(ARCH), x86)
613 DYNAMIC_CORE = KATMAI COPPERMINE NORTHWOOD PRESCOTT BANIAS \
614                CORE2 PENRYN DUNNINGTON NEHALEM ATHLON OPTERON OPTERON_SSE3 BARCELONA BOBCAT ATOM NANO
615 endif
616
617 ifeq ($(ARCH), x86_64)
618 DYNAMIC_CORE = PRESCOTT CORE2 
619 ifeq ($(DYNAMIC_OLDER), 1)
620 DYNAMIC_CORE += PENRYN DUNNINGTON 
621 endif
622 DYNAMIC_CORE += NEHALEM 
623 ifeq ($(DYNAMIC_OLDER), 1)
624 DYNAMIC_CORE += OPTERON OPTERON_SSE3 
625 endif
626 DYNAMIC_CORE += BARCELONA 
627 ifeq ($(DYNAMIC_OLDER), 1)
628 DYNAMIC_CORE += BOBCAT ATOM NANO
629 endif
630 ifneq ($(NO_AVX), 1)
631 DYNAMIC_CORE += SANDYBRIDGE BULLDOZER PILEDRIVER STEAMROLLER EXCAVATOR
632 endif
633 ifneq ($(NO_AVX2), 1)
634 DYNAMIC_CORE += HASWELL ZEN
635 endif
636 ifneq ($(NO_AVX512), 1)
637 ifneq ($(NO_AVX2), 1)
638 DYNAMIC_CORE += SKYLAKEX COOPERLAKE
639 endif
640 endif
641 endif
642
643 ifdef DYNAMIC_LIST
644 override DYNAMIC_CORE = PRESCOTT $(DYNAMIC_LIST)
645 XCCOMMON_OPT = -DDYNAMIC_LIST -DDYN_PRESCOTT
646 XCCOMMON_OPT += $(foreach dcore,$(DYNAMIC_LIST),-DDYN_$(dcore))
647 CCOMMON_OPT += $(XCCOMMON_OPT)
648 #CCOMMON_OPT    += -DDYNAMIC_LIST='$(DYNAMIC_LIST)'
649 endif
650
651 ifeq ($(ARCH), arm64)
652 DYNAMIC_CORE =  ARMV8
653 DYNAMIC_CORE += CORTEXA53
654 DYNAMIC_CORE += CORTEXA57
655 DYNAMIC_CORE += CORTEXA72
656 DYNAMIC_CORE += CORTEXA73
657 DYNAMIC_CORE += NEOVERSEN1
658 DYNAMIC_CORE += NEOVERSEV1
659 DYNAMIC_CORE += NEOVERSEN2
660 DYNAMIC_CORE += CORTEXA55
661 DYNAMIC_CORE += FALKOR
662 DYNAMIC_CORE += THUNDERX
663 DYNAMIC_CORE += THUNDERX2T99
664 DYNAMIC_CORE += TSV110
665 DYNAMIC_CORE += EMAG8180
666 DYNAMIC_CORE += THUNDERX3T110
667 ifdef DYNAMIC_LIST
668 override DYNAMIC_CORE = ARMV8 $(DYNAMIC_LIST)
669 XCCOMMON_OPT = -DDYNAMIC_LIST -DDYN_ARMV8
670 XCCOMMON_OPT += $(foreach dcore,$(DYNAMIC_LIST),-DDYN_$(dcore))
671 endif
672 endif
673
674 ifeq ($(ARCH), mips64)
675 DYNAMIC_CORE = LOONGSON3R3 LOONGSON3R4
676 endif
677
678 ifeq ($(ARCH), zarch)
679 DYNAMIC_CORE = ZARCH_GENERIC
680
681 # if the compiler accepts -march=arch11 or -march=z13 and can compile a file
682 # with z13-specific inline assembly, then we can include support for Z13.
683 # note: -march=z13 is equivalent to -march=arch11 yet some compiler releases
684 # only support one or the other.
685 # note: LLVM version 6.x supported -march=z13 yet could not handle vector
686 # registers in inline assembly, so the check for supporting the -march flag is
687 # not enough.
688 ZARCH_TEST_COMPILE=-c $(TOPDIR)/kernel/zarch/damin_z13.c -I$(TOPDIR) -o /dev/null > /dev/null 2> /dev/null
689 ZARCH_CC_SUPPORTS_ARCH11=$(shell $(CC) -march=arch11 $(ZARCH_TEST_COMPILE) && echo 1)
690 ZARCH_CC_SUPPORTS_Z13=$(shell $(CC) -march=z13 $(ZARCH_TEST_COMPILE) && echo 1)
691
692 ifeq ($(or $(ZARCH_CC_SUPPORTS_ARCH11), $(ZARCH_CC_SUPPORTS_Z13)), 1)
693 DYNAMIC_CORE += Z13
694 CCOMMON_OPT += -DDYN_Z13
695 else
696 $(info OpenBLAS: Not building Z13 kernels because the compiler $(CC) does not support it)
697 endif
698
699 # as above for z13, check for -march=arch12 and z14 support in the compiler.
700 ZARCH_CC_SUPPORTS_ARCH12=$(shell $(CC) -march=arch12 $(ZARCH_TEST_COMPILE) && echo 1)
701 ZARCH_CC_SUPPORTS_Z14=$(shell $(CC) -march=z14 $(ZARCH_TEST_COMPILE) && echo 1)
702 ifeq ($(or $(ZARCH_CC_SUPPORTS_ARCH12), $(ZARCH_CC_SUPPORTS_Z14)), 1)
703 DYNAMIC_CORE += Z14
704 CCOMMON_OPT += -DDYN_Z14
705 else
706 $(info OpenBLAS: Not building Z14 kernels because the compiler $(CC) does not support it)
707 endif
708
709 endif # ARCH zarch
710
711 ifeq ($(ARCH), power)
712 ifneq ($(C_COMPILER), PGI)
713 DYNAMIC_CORE = POWER6
714 DYNAMIC_CORE += POWER8
715 ifneq ($(C_COMPILER), GCC)
716 DYNAMIC_CORE += POWER9
717 DYNAMIC_CORE += POWER10
718 CCOMMON_OPT += -DHAVE_P10_SUPPORT
719 endif
720 ifeq ($(C_COMPILER), GCC)
721 ifeq ($(GCCVERSIONGT5), 1)
722 DYNAMIC_CORE += POWER9
723 else
724 $(info, OpenBLAS: Your gcc version is too old to build the POWER9 kernels.)
725 endif
726 LDVERSIONGTEQ35 := $(shell expr `$(CC) -Wl,--version 2> /dev/null | head -1 | cut -f2 -d "." | cut -f1 -d "-"` \>= 35)
727 ifeq ($(GCCVERSIONGTEQ11)$(LDVERSIONGTEQ35), 11)
728 DYNAMIC_CORE += POWER10
729 CCOMMON_OPT += -DHAVE_P10_SUPPORT
730 else ifeq ($(GCCVERSIONGTEQ10), 1)
731 ifeq ($(GCCMINORVERSIONGTEQ2)$(LDVERSIONGTEQ35), 11)
732 DYNAMIC_CORE += POWER10
733 CCOMMON_OPT += -DHAVE_P10_SUPPORT
734 endif
735 else
736 $(info, OpenBLAS: Your gcc version is too old to build the POWER10 kernels.)
737 endif
738 endif
739 else
740 DYNAMIC_CORE = POWER8
741 DYNAMIC_CORE += POWER9
742 endif
743 endif
744
745 # If DYNAMIC_CORE is not set, DYNAMIC_ARCH cannot do anything, so force it to empty
746 ifndef DYNAMIC_CORE
747 override DYNAMIC_ARCH=
748 endif
749 endif
750
751 ifeq ($(ARCH), ia64)
752 NO_BINARY_MODE  = 1
753 BINARY_DEFINED  = 1
754
755 ifeq ($(F_COMPILER), GFORTRAN)
756 ifeq ($(C_COMPILER), GCC)
757 # EXPRECISION   = 1
758 # CCOMMON_OPT   += -DEXPRECISION
759 endif
760 endif
761 endif
762
763 ifeq ($(ARCH), $(filter $(ARCH),mips64 mips))
764 NO_BINARY_MODE  = 1
765 endif
766
767 ifeq ($(ARCH), alpha)
768 NO_BINARY_MODE  = 1
769 BINARY_DEFINED  = 1
770 endif
771
772 ifeq ($(ARCH), arm)
773 NO_BINARY_MODE  = 1
774 BINARY_DEFINED  = 1
775
776 CCOMMON_OPT += -marm
777 FCOMMON_OPT += -marm
778
779 # If softfp abi is mentioned on the command line, force it.
780 ifeq ($(ARM_SOFTFP_ABI), 1)
781 CCOMMON_OPT += -mfloat-abi=softfp
782 FCOMMON_OPT += -mfloat-abi=softfp
783 endif
784
785 ifeq ($(OSNAME), Android)
786 ifeq ($(ARM_SOFTFP_ABI), 1)
787 EXTRALIB        += -lm
788 else
789 EXTRALIB        += -Wl,-lm_hard
790 endif
791 endif
792 endif
793
794 ifeq ($(ARCH), arm64)
795 NO_BINARY_MODE  = 1
796 BINARY_DEFINED  = 1
797 ifdef INTERFACE64
798 ifneq ($(INTERFACE64), 0)
799 ifeq ($(F_COMPILER), GFORTRAN)
800 FCOMMON_OPT +=  -fdefault-integer-8
801 endif
802 ifeq ($(F_COMPILER), FLANG)
803 FCOMMON_OPT += -i8
804 endif
805 endif
806 endif
807 endif
808
809 ifeq ($(ARCH), riscv64)
810 NO_BINARY_MODE  = 1
811 BINARY_DEFINED  = 1
812 endif
813
814 ifeq ($(ARCH), loongarch64)
815 NO_BINARY_MODE  = 1
816 BINARY_DEFINED  = 1
817 endif
818
819
820 #
821 #  C Compiler dependent settings
822 #
823
824
825 # ifeq logical or. GCC or CLANG or LSB
826 # http://stackoverflow.com/questions/7656425/makefile-ifeq-logical-or
827 ifeq ($(C_COMPILER), $(filter $(C_COMPILER),GCC CLANG LSB))
828 CCOMMON_OPT += -Wall
829 COMMON_PROF += -fno-inline
830 NO_UNINITIALIZED_WARN =  -Wno-uninitialized
831
832 ifeq ($(QUIET_MAKE), 1)
833 CCOMMON_OPT += $(NO_UNINITIALIZED_WARN) -Wno-unused
834 endif
835
836 ifdef NO_BINARY_MODE
837
838 ifeq ($(ARCH), $(filter $(ARCH),mips64))
839 ifdef BINARY64
840 CCOMMON_OPT += -mabi=64
841 else
842 CCOMMON_OPT += -mabi=n32
843 endif
844 BINARY_DEFINED = 1
845 else ifeq ($(ARCH), $(filter $(ARCH),mips))
846 CCOMMON_OPT += -mabi=32
847 BINARY_DEFINED = 1
848 endif
849
850 ifeq ($(CORE), $(filter $(CORE),LOONGSON3R3 LOONGSON3R4))
851 CCOMMON_OPT += -march=loongson3a
852 FCOMMON_OPT += -march=loongson3a
853 endif
854
855 ifeq ($(CORE), MIPS24K)
856 CCOMMON_OPT += -mips32r2 -mtune=24kc  $(MSA_FLAGS)
857 FCOMMON_OPT += -mips32r2 -mtune=24kc  $(MSA_FLAGS)
858 endif
859
860 ifeq ($(CORE), MIPS1004K)
861 CCOMMON_OPT += -mips32r2   $(MSA_FLAGS)
862 FCOMMON_OPT += -mips32r2   $(MSA_FLAGS)
863 endif
864
865 ifeq ($(CORE), P5600)
866 CCOMMON_OPT += -mips32r5 -mnan=2008 -mtune=p5600  $(MSA_FLAGS)
867 FCOMMON_OPT += -mips32r5 -mnan=2008 -mtune=p5600  $(MSA_FLAGS)
868 endif
869
870 ifeq ($(CORE), I6400)
871 CCOMMON_OPT += -mips64r6 -mnan=2008 -mtune=i6400 $(MSA_FLAGS)
872 FCOMMON_OPT += -mips64r6 -mnan=2008 -mtune=i6400 $(MSA_FLAGS)
873 endif
874
875 ifeq ($(CORE), P6600)
876 CCOMMON_OPT += -mips64r6 -mnan=2008 -mtune=p6600 $(MSA_FLAGS)
877 FCOMMON_OPT += -mips64r6 -mnan=2008 -mtune=p6600 $(MSA_FLAGS)
878 endif
879
880 ifeq ($(CORE), I6500)
881 CCOMMON_OPT += -mips64r6 -mnan=2008 -mtune=i6400 $(MSA_FLAGS)
882 FCOMMON_OPT += -mips64r6 -mnan=2008 -mtune=i6400 $(MSA_FLAGS)
883 endif
884
885 ifeq ($(OSNAME), AIX)
886 BINARY_DEFINED = 1
887 endif
888
889 ifeq ($(ARCH), loongarch64)
890 ifeq ($(CORE), LOONGSON3R5)
891 CCOMMON_OPT += -march=loongarch64 -mabi=lp64
892 FCOMMON_OPT += -march=loongarch64 -mabi=lp64
893 endif
894 endif
895
896 endif
897
898 ifndef BINARY_DEFINED
899 ifneq ($(OSNAME), AIX)
900 ifdef BINARY64
901 ifneq ($(ARCH), riscv64)
902 CCOMMON_OPT += -m64
903 endif
904 else
905 CCOMMON_OPT += -m32
906 endif
907 endif
908 endif
909
910 endif
911
912 ifeq ($(C_COMPILER), PGI)
913 PGCVERSIONGT20 := $(shell expr `$(CC) --version|sed -n "2p" |sed -e "s/[^0-9.]//g" |cut -d "." -f 1` \> 20)
914 PGCVERSIONEQ20 := $(shell expr `$(CC) --version|sed -n "2p" |sed -e "s/[^0-9.]//g" |cut -d "." -f 1` == 20)
915 PGCMINORVERSIONGE11 := $(shell expr `$(CC) --version|sed -n "2p" |cut -d "-" -f 1 |sed -e "s/[^0-9.]//g" |cut -c 4-5` \>= 11)
916 PGCVERSIONCHECK := $(PGCVERSIONGT20)$(PGCVERSIONEQ20)$(PGCMINORVERSIONGE11)
917 ifeq ($(PGCVERSIONCHECK), $(filter $(PGCVERSIONCHECK), 100 101 011))
918 NEWPGI := 1
919 PGCVERSIONGT21 := $(shell expr `$(CC) --version|sed -n "2p" |sed -e "s/[^0-9.]//g" |cut -d "." -f 1` \> 21)
920 PGCVERSIONEQ21 := $(shell expr `$(CC) --version|sed -n "2p" |sed -e "s/[^0-9.]//g" |cut -d "." -f 1` == 21)
921 PGCVERSIONCHECK2 := $(PGCVERSIONGT21)$(PGCVERSIONEQ21)$(PGCMINORVERSIONGE11)
922 ifeq ($(PGCVERSIONCHECK2), $(filter $(PGCVERSIONCHECK2), 100 101 011))
923 NEWPGI2 := 1
924 endif
925 endif
926 ifdef BINARY64
927 ifeq ($(ARCH), x86_64)
928 ifneq ($(NEWPGI2),1)
929 CCOMMON_OPT += -tp p7-64
930 else
931 CCOMMON_OPT += -tp px
932 endif
933 ifneq ($(NEWPGI),1)
934 CCOMMON_OPT +=  -D__MMX__ -Mnollvm
935 endif
936 else
937 ifeq ($(ARCH), power)
938 ifeq ($(CORE), POWER8)
939 CCOMMON_OPT += -tp pwr8
940 endif
941 ifeq ($(CORE), POWER9)
942 CCOMMON_OPT += -tp pwr9
943 endif
944 endif
945 endif
946 else
947 ifneq ($(NEWPGI2),1)
948 CCOMMON_OPT += -tp p7
949 else
950 CCOMMON_OPT += -tp px
951 endif
952 endif
953 endif
954
955 ifeq ($(C_COMPILER), PATHSCALE)
956 ifdef BINARY64
957 CCOMMON_OPT += -m64
958 else
959 CCOMMON_OPT += -m32
960 endif
961 endif
962
963 #
964 #  Fortran Compiler dependent settings
965 #
966
967 ifeq ($(F_COMPILER), NAG)
968 FCOMMON_OPT += -dcfuns -recursive -ieee=full -w=obs -thread_safe
969 ifdef INTERFACE64
970 ifneq ($(INTERFACE64), 0)
971 FCOMMON_OPT += -i8
972 endif
973 endif
974 ifeq ($(USE_OPENMP), 1)
975 FCOMMON_OPT += -openmp
976 endif
977 endif
978
979 ifeq ($(F_COMPILER), FLANG)
980 CCOMMON_OPT += -DF_INTERFACE_FLANG
981 FCOMMON_OPT += -Mrecursive -Kieee
982 ifeq ($(OSNAME), Linux)
983 ifeq ($(ARCH), x86_64)
984 FLANG_VENDOR := $(shell $(FC) --version|head -1 |cut -f 1 -d " ")
985 ifeq ($(FLANG_VENDOR), AMD)
986 FCOMMON_OPT += -fno-unroll-loops
987 endif
988 endif
989 endif
990 ifdef BINARY64
991 ifdef INTERFACE64
992 ifneq ($(INTERFACE64), 0)
993 FCOMMON_OPT += -i8
994 endif
995 endif
996 FCOMMON_OPT += -Wall
997 else
998 FCOMMON_OPT += -Wall
999 endif
1000 ifeq ($(USE_OPENMP), 1)
1001 FCOMMON_OPT += -fopenmp
1002 endif
1003 endif
1004
1005 ifeq ($(F_COMPILER), G77)
1006 CCOMMON_OPT += -DF_INTERFACE_G77
1007 FCOMMON_OPT += -Wall
1008 ifndef NO_BINARY_MODE
1009 ifneq ($(OSNAME), AIX)
1010 ifdef BINARY64
1011 FCOMMON_OPT += -m64
1012 else
1013 FCOMMON_OPT += -m32
1014 endif
1015 endif
1016 endif
1017 endif
1018
1019 ifeq ($(F_COMPILER), G95)
1020 CCOMMON_OPT += -DF_INTERFACE_G95
1021 FCOMMON_OPT += -Wall
1022 ifneq ($(OSNAME), AIX)
1023 ifndef NO_BINARY_MODE
1024 ifdef BINARY64
1025 FCOMMON_OPT += -m64
1026 else
1027 FCOMMON_OPT += -m32
1028 endif
1029 endif
1030 ifneq ($(NO_LAPACKE), 1)
1031 FCOMMON_OPT += -fno-second-underscore
1032 endif
1033 endif
1034 endif
1035
1036 ifeq ($(F_COMPILER), GFORTRAN)
1037 CCOMMON_OPT += -DF_INTERFACE_GFORT
1038 FCOMMON_OPT += -Wall
1039 # make single-threaded LAPACK calls thread-safe #1847
1040 FCOMMON_OPT += -frecursive
1041 # work around ABI problem with passing single-character arguments
1042 FCOMMON_OPT += -fno-optimize-sibling-calls
1043 #Don't include -lgfortran, when NO_LAPACK=1 or lsbcc
1044 ifneq ($(NO_LAPACK), 1)
1045 EXTRALIB += -lgfortran
1046 endif
1047 ifdef NO_BINARY_MODE
1048 ifeq ($(ARCH), $(filter $(ARCH),mips64))
1049 ifdef BINARY64
1050 FCOMMON_OPT += -mabi=64
1051 else
1052 FCOMMON_OPT += -mabi=n32
1053 endif
1054 else ifeq ($(ARCH), $(filter $(ARCH),mips))
1055 FCOMMON_OPT += -mabi=32
1056 endif
1057 else
1058 ifdef BINARY64
1059 ifneq ($(OSNAME), AIX)
1060 ifneq ($(ARCH), riscv64)
1061 FCOMMON_OPT += -m64
1062 endif
1063 endif
1064 ifdef INTERFACE64
1065 ifneq ($(INTERFACE64), 0)
1066 FCOMMON_OPT +=  -fdefault-integer-8
1067 endif
1068 endif
1069 else
1070 ifneq ($(OSNAME), AIX)
1071 FCOMMON_OPT += -m32
1072 endif
1073 endif
1074 endif
1075 ifeq ($(USE_OPENMP), 1)
1076 FCOMMON_OPT += -fopenmp
1077 endif
1078 endif
1079
1080 ifeq ($(F_COMPILER), INTEL)
1081 CCOMMON_OPT += -DF_INTERFACE_INTEL
1082 ifdef INTERFACE64
1083 ifneq ($(INTERFACE64), 0)
1084 FCOMMON_OPT += -i8
1085 endif
1086 endif
1087 FCOMMON_OPT += -recursive -fp-model strict -assume protect-parens
1088 ifeq ($(USE_OPENMP), 1)
1089 FCOMMON_OPT += -fopenmp
1090 endif
1091 endif
1092
1093 ifeq ($(F_COMPILER), FUJITSU)
1094 CCOMMON_OPT += -DF_INTERFACE_FUJITSU
1095 ifeq ($(USE_OPENMP), 1)
1096 FCOMMON_OPT += -openmp
1097 endif
1098 endif
1099
1100 ifeq ($(F_COMPILER), IBM)
1101 CCOMMON_OPT += -DF_INTERFACE_IBM
1102 # FCOMMON_OPT   += -qarch=440
1103 ifdef BINARY64
1104 FCOMMON_OPT += -q64
1105 ifdef INTERFACE64
1106 ifneq ($(INTERFACE64), 0)
1107 FCOMMON_OPT += -qintsize=8
1108 endif
1109 endif
1110 else
1111 FCOMMON_OPT += -q32
1112 endif
1113 ifeq ($(USE_OPENMP), 1)
1114 FCOMMON_OPT += -openmp
1115 endif
1116 endif
1117
1118 ifeq ($(F_COMPILER), PGI)
1119 CCOMMON_OPT  += -DF_INTERFACE_PGI
1120 COMMON_PROF +=  -DPGICOMPILER
1121 ifdef BINARY64
1122 ifdef INTERFACE64
1123 ifneq ($(INTERFACE64), 0)
1124 FCOMMON_OPT += -i8
1125 endif
1126 endif
1127 ifeq ($(ARCH), x86_64)
1128 ifneq ($(NEWPGI2),1)
1129 FCOMMON_OPT += -tp p7-64
1130 else
1131 FCOMMON_OPT += -tp px
1132 endif
1133 else
1134 ifeq ($(ARCH), power)
1135 ifeq ($(CORE), POWER6)
1136 $(warning NVIDIA HPC compilers do not support POWER6.)
1137 endif
1138 ifeq ($(CORE), POWER8)
1139 FCOMMON_OPT += -tp pwr8
1140 endif
1141 ifeq ($(CORE), POWER9)
1142 FCOMMON_OPT += -tp pwr9
1143 endif
1144 ifeq ($(CORE), POWER10)
1145 $(warning NVIDIA HPC compilers do not support POWER10.)
1146 endif
1147 endif
1148 endif
1149 else
1150 FCOMMON_OPT += -tp p7
1151 endif
1152 FCOMMON_OPT += -Mrecursive -Kieee
1153 ifeq ($(USE_OPENMP), 1)
1154 FCOMMON_OPT += -mp
1155 endif
1156 endif
1157
1158 ifeq ($(F_COMPILER), PATHSCALE)
1159 CCOMMON_OPT  += -DF_INTERFACE_PATHSCALE
1160 ifdef BINARY64
1161 ifdef INTERFACE64
1162 ifneq ($(INTERFACE64), 0)
1163 FCOMMON_OPT += -i8
1164 endif
1165 endif
1166 endif
1167  
1168 ifeq ($(USE_OPENMP), 1)
1169 FCOMMON_OPT += -mp
1170 endif
1171 endif
1172
1173 ifeq ($(F_COMPILER), OPEN64)
1174 CCOMMON_OPT  += -DF_INTERFACE_OPEN64
1175 ifdef BINARY64
1176 ifdef INTERFACE64
1177 ifneq ($(INTERFACE64), 0)
1178 FCOMMON_OPT += -i8
1179 endif
1180 endif
1181 endif
1182
1183 ifeq ($(ARCH), $(filter $(ARCH),mips64 mips))
1184 ifndef BINARY64
1185 FCOMMON_OPT += -n32
1186 else
1187 FCOMMON_OPT += -n64
1188 endif
1189 ifeq ($(CORE), LOONGSON3R3)
1190 FCOMMON_OPT += -loongson3 -static
1191 endif
1192
1193 ifeq ($(CORE), LOONGSON3R4)
1194 FCOMMON_OPT += -loongson3 -static
1195 endif
1196
1197 else
1198 ifndef BINARY64
1199 FCOMMON_OPT += -m32
1200 else
1201 FCOMMON_OPT += -m64
1202 endif
1203 endif
1204
1205 ifeq ($(USE_OPENMP), 1)
1206 FEXTRALIB   += -lstdc++
1207 FCOMMON_OPT += -mp
1208 endif
1209 endif
1210
1211 ifeq ($(C_COMPILER), OPEN64)
1212
1213 ifeq ($(ARCH), $(filter $(ARCH),mips64 mips))
1214 ifndef BINARY64
1215 CCOMMON_OPT += -n32
1216 else
1217 CCOMMON_OPT += -n64
1218 endif
1219 ifeq ($(CORE), LOONGSON3R3)
1220 CCOMMON_OPT += -loongson3 -static
1221 endif
1222
1223 ifeq ($(CORE), LOONGSON3R4)
1224 CCOMMON_OPT += -loongson3 -static
1225 endif
1226
1227 else
1228
1229 ifndef BINARY64
1230 CCOMMON_OPT += -m32
1231 else
1232 CCOMMON_OPT += -m64
1233 endif
1234 endif
1235 endif
1236
1237 ifeq ($(C_COMPILER), SUN)
1238 CCOMMON_OPT  += -w
1239 ifeq ($(ARCH), x86)
1240 CCOMMON_OPT  += -m32
1241 else
1242 ifdef BINARY64
1243 CCOMMON_OPT  += -m64
1244 else
1245 CCOMMON_OPT  += -m32
1246 endif
1247 endif
1248 endif
1249
1250 ifeq ($(F_COMPILER), SUN)
1251 CCOMMON_OPT  += -DF_INTERFACE_SUN
1252 FCOMMON_OPT  += -ftrap=%none -xrecursive
1253 ifeq ($(ARCH), x86)
1254 FCOMMON_OPT  += -m32
1255 else
1256 ifdef BINARY64
1257 FCOMMON_OPT  += -m64
1258 else
1259 FCOMMON_OPT  += -m32
1260 endif
1261 endif
1262 ifeq ($(USE_OPENMP), 1)
1263 FCOMMON_OPT += -xopenmp=parallel
1264 endif
1265 endif
1266
1267 ifeq ($(F_COMPILER), COMPAQ)
1268 CCOMMON_OPT  += -DF_INTERFACE_COMPAQ
1269 ifeq ($(USE_OPENMP), 1)
1270 FCOMMON_OPT += -openmp
1271 endif
1272 endif
1273
1274 ifdef BINARY64
1275 ifdef INTERFACE64
1276 ifneq ($(INTERFACE64), 0)
1277 CCOMMON_OPT     +=
1278 #-DUSE64BITINT
1279 endif
1280 endif
1281 endif
1282
1283 ifeq ($(NEED_PIC), 1)
1284 ifeq ($(C_COMPILER), IBM)
1285 CCOMMON_OPT += -qpic=large
1286 else
1287 CCOMMON_OPT += -fPIC
1288 endif
1289 ifeq ($(F_COMPILER), SUN)
1290 FCOMMON_OPT  += -pic
1291 else ifeq ($(F_COMPILER), NAG)
1292 FCOMMON_OPT += -PIC
1293 else
1294 FCOMMON_OPT += -fPIC
1295 endif
1296 endif
1297
1298 ifeq ($(DYNAMIC_ARCH), 1)
1299 CCOMMON_OPT     += -DDYNAMIC_ARCH
1300 endif
1301
1302 ifeq ($(DYNAMIC_OLDER), 1)
1303 CCOMMON_OPT     += -DDYNAMIC_OLDER
1304 endif
1305
1306 ifeq ($(C_LAPACK), 1)
1307 CCOMMON_OPT     += -DC_LAPACK
1308 endif
1309
1310 ifeq ($(NO_LAPACK), 1)
1311 CCOMMON_OPT     += -DNO_LAPACK
1312 #Disable LAPACK C interface
1313 NO_LAPACKE = 1
1314 endif
1315
1316 ifeq ($(NO_LAPACKE), 1)
1317 CCOMMON_OPT     += -DNO_LAPACKE
1318 endif
1319
1320 ifeq ($(NO_AVX), 1)
1321 CCOMMON_OPT     += -DNO_AVX
1322 endif
1323
1324 ifeq ($(ARCH), x86)
1325 CCOMMON_OPT     += -DNO_AVX
1326 endif
1327
1328 ifeq ($(NO_AVX2), 1)
1329 CCOMMON_OPT     += -DNO_AVX2
1330 endif
1331
1332 ifeq ($(NO_AVX512), 1)
1333 CCOMMON_OPT     += -DNO_AVX512
1334 endif
1335
1336 ifdef SMP
1337 CCOMMON_OPT     += -DSMP_SERVER
1338
1339 ifeq ($(ARCH), mips64)
1340 USE_SIMPLE_THREADED_LEVEL3 = 1
1341 endif
1342
1343 ifeq ($(USE_OPENMP), 1)
1344 # USE_SIMPLE_THREADED_LEVEL3 = 1
1345 # NO_AFFINITY = 1
1346 CCOMMON_OPT     += -DUSE_OPENMP
1347 endif
1348
1349 ifeq ($(BIGNUMA), 1)
1350 CCOMMON_OPT     += -DBIGNUMA
1351 endif
1352
1353 endif
1354
1355 ifeq ($(NO_WARMUP), 1)
1356 CCOMMON_OPT     += -DNO_WARMUP
1357 endif
1358
1359 ifeq ($(CONSISTENT_FPCSR), 1)
1360 CCOMMON_OPT     += -DCONSISTENT_FPCSR
1361 endif
1362
1363 # Only for development
1364 # CCOMMON_OPT    += -DPARAMTEST
1365 # CCOMMON_OPT    += -DPREFETCHTEST
1366 # CCOMMON_OPT    += -DNO_SWITCHING
1367 # USE_PAPI = 1
1368
1369 ifdef USE_PAPI
1370 CCOMMON_OPT      += -DUSE_PAPI
1371 EXTRALIB         += -lpapi -lperfctr
1372 endif
1373
1374 ifdef BUFFERSIZE
1375 CCOMMON_OPT      += -DBUFFERSIZE=$(BUFFERSIZE)
1376 endif
1377
1378 ifdef DYNAMIC_THREADS
1379 CCOMMON_OPT      += -DDYNAMIC_THREADS
1380 endif
1381
1382 CCOMMON_OPT     += -DMAX_CPU_NUMBER=$(NUM_THREADS)
1383
1384 CCOMMON_OPT     += -DMAX_PARALLEL_NUMBER=$(NUM_PARALLEL)
1385
1386 ifdef USE_SIMPLE_THREADED_LEVEL3
1387 CCOMMON_OPT     += -DUSE_SIMPLE_THREADED_LEVEL3
1388 endif
1389
1390 ifeq ($(USE_TLS), 1)
1391 CCOMMON_OPT += -DUSE_TLS
1392 endif
1393
1394 ifeq ($(BUILD_BFLOAT16), 1)
1395 CCOMMON_OPT += -DBUILD_BFLOAT16
1396 endif
1397 ifeq ($(BUILD_SINGLE), 1)
1398 CCOMMON_OPT += -DBUILD_SINGLE=1
1399 endif
1400 ifeq ($(BUILD_DOUBLE), 1)
1401 CCOMMON_OPT += -DBUILD_DOUBLE=1
1402 endif
1403 ifeq ($(BUILD_COMPLEX), 1)
1404 CCOMMON_OPT += -DBUILD_COMPLEX=1
1405 endif
1406 ifeq ($(BUILD_COMPLEX16), 1)
1407 CCOMMON_OPT += -DBUILD_COMPLEX16=1
1408 endif
1409
1410 CCOMMON_OPT += -DVERSION=\"$(VERSION)\"
1411
1412 ifndef SYMBOLPREFIX
1413 SYMBOLPREFIX =
1414 endif
1415
1416 ifndef SYMBOLSUFFIX
1417 SYMBOLSUFFIX =
1418 endif
1419
1420 ifndef LIBSONAMEBASE
1421 LIBSONAMEBASE = openblas
1422 endif
1423
1424 ifndef LIBNAMESUFFIX
1425 LIBNAMEBASE = $(SYMBOLPREFIX)$(LIBSONAMEBASE)$(SYMBOLSUFFIX)
1426 else
1427 LIBNAMEBASE = $(SYMBOLPREFIX)$(LIBSONAMEBASE)$(SYMBOLSUFFIX)_$(LIBNAMESUFFIX)
1428 endif
1429
1430 ifeq ($(OSNAME), CYGWIN_NT)
1431 LIBPREFIX = cyg$(LIBNAMEBASE)
1432 else
1433 LIBPREFIX = lib$(LIBNAMEBASE)
1434 endif
1435
1436 KERNELDIR       = $(TOPDIR)/kernel/$(ARCH)
1437
1438 include $(TOPDIR)/Makefile.$(ARCH)
1439
1440 ifneq ($(C_COMPILER), PGI)
1441 ifneq ($(C_COMPILER), SUN)
1442 CCOMMON_OPT     += -UASMNAME -UASMFNAME -UNAME -UCNAME -UCHAR_NAME -UCHAR_CNAME
1443 endif
1444 endif
1445 CCOMMON_OPT     += -DASMNAME=$(FU)$(*F) -DASMFNAME=$(FU)$(*F)$(BU) -DNAME=$(*F)$(BU) -DCNAME=$(*F) -DCHAR_NAME=\"$(*F)$(BU)\" -DCHAR_CNAME=\"$(*F)\"
1446
1447 ifeq ($(CORE), PPC440)
1448 CCOMMON_OPT     += -DALLOC_QALLOC
1449 endif
1450
1451 ifeq ($(CORE), PPC440FP2)
1452 STATIC_ALLOCATION = 1
1453 endif
1454
1455 ifneq ($(OSNAME), Linux)
1456 NO_AFFINITY = 1
1457 endif
1458
1459 ifneq ($(ARCH), x86_64)
1460 ifneq ($(ARCH), x86)
1461 NO_AFFINITY = 1
1462 endif
1463 endif
1464
1465 ifdef NO_AFFINITY
1466 ifeq ($(NO_AFFINITY), 0)
1467 override undefine NO_AFFINITY
1468 else
1469 CCOMMON_OPT     += -DNO_AFFINITY
1470 endif
1471 endif
1472
1473 ifdef FUNCTION_PROFILE
1474 CCOMMON_OPT     += -DFUNCTION_PROFILE
1475 endif
1476
1477 ifdef HUGETLB_ALLOCATION
1478 CCOMMON_OPT     += -DALLOC_HUGETLB
1479 endif
1480
1481 ifdef HUGETLBFILE_ALLOCATION
1482 CCOMMON_OPT     += -DALLOC_HUGETLBFILE -DHUGETLB_FILE_NAME=$(HUGETLBFILE_ALLOCATION)
1483 endif
1484
1485 ifdef STATIC_ALLOCATION
1486 CCOMMON_OPT     += -DALLOC_STATIC
1487 endif
1488
1489 ifdef DEVICEDRIVER_ALLOCATION
1490 CCOMMON_OPT     += -DALLOC_DEVICEDRIVER -DDEVICEDRIVER_NAME=\"/dev/mapper\"
1491 endif
1492
1493 ifdef MIXED_MEMORY_ALLOCATION
1494 CCOMMON_OPT     += -DMIXED_MEMORY_ALLOCATION
1495 endif
1496
1497 ifeq ($(OSNAME), SunOS)
1498 TAR     = gtar
1499 PATCH   = gpatch
1500 GREP    = ggrep
1501 AWK     = nawk
1502 else
1503 TAR     = tar
1504 PATCH   = patch
1505 GREP    = grep
1506 AWK     = awk
1507 endif
1508
1509 ifndef MD5SUM
1510 MD5SUM  = md5sum
1511 endif
1512
1513
1514 REVISION = -r$(VERSION)
1515 MAJOR_VERSION = $(word 1,$(subst ., ,$(VERSION)))
1516
1517 ifeq ($(DEBUG), 1)
1518 COMMON_OPT += -g
1519 endif
1520
1521 ifeq ($(DEBUG), 1)
1522 FCOMMON_OPT += -g
1523 endif
1524
1525 ifndef COMMON_OPT
1526 COMMON_OPT = -O2
1527 endif
1528
1529 ifndef FCOMMON_OPT
1530 FCOMMON_OPT = -O2 -frecursive
1531 endif
1532
1533 override CFLAGS     += $(COMMON_OPT) $(CCOMMON_OPT) -I$(TOPDIR)
1534 override PFLAGS     += $(COMMON_OPT) $(CCOMMON_OPT) -I$(TOPDIR) -DPROFILE $(COMMON_PROF)
1535 override FFLAGS     += $(COMMON_OPT) $(FCOMMON_OPT)
1536 override FPFLAGS    += $(FCOMMON_OPT) $(COMMON_PROF)
1537 #MAKEOVERRIDES =
1538
1539 ifeq ($(NEED_PIC), 1)
1540 ifeq (,$(findstring PIC,$(FFLAGS)))
1541 override FFLAGS += -fPIC
1542 endif
1543 endif
1544
1545 #For LAPACK Fortran codes.
1546 #Disable -fopenmp for LAPACK Fortran codes on Windows.
1547 ifdef OS_WINDOWS
1548 LAPACK_FFLAGS := $(filter-out -fopenmp -mp -openmp -xopenmp=parallel,$(FFLAGS))
1549 LAPACK_FPFLAGS := $(filter-out -fopenmp -mp -openmp -xopenmp=parallel,$(FPFLAGS))
1550 else
1551 LAPACK_FFLAGS := $(FFLAGS)
1552 LAPACK_FPFLAGS := $(FPFLAGS)
1553 endif
1554
1555 ifeq ($(F_COMPILER),NAG)
1556 LAPACK_FFLAGS := $(filter-out -msse3 -mssse3 -msse4.1 -mavx -mavx2 -mskylake-avx512 ,$(FFLAGS))
1557 endif
1558
1559 LAPACK_CFLAGS = $(CFLAGS)
1560 LAPACK_CFLAGS += -DHAVE_LAPACK_CONFIG_H
1561 ifdef INTERFACE64
1562 ifneq ($(INTERFACE64), 0)
1563 LAPACK_CFLAGS +=  -DLAPACK_ILP64
1564 endif
1565 endif
1566
1567 ifdef OS_WINDOWS
1568 LAPACK_CFLAGS +=  -DOPENBLAS_OS_WINDOWS
1569 LAPACK_CFLAGS +=  -DLAPACK_COMPLEX_STRUCTURE
1570 endif
1571 ifeq ($(C_COMPILER), LSB)
1572 LAPACK_CFLAGS +=  -DLAPACK_COMPLEX_STRUCTURE
1573 endif
1574
1575 ifndef SUFFIX
1576 SUFFIX  = o
1577 endif
1578
1579 ifndef PSUFFIX
1580 PSUFFIX = po
1581 endif
1582
1583 ifndef LIBSUFFIX
1584 LIBSUFFIX = a
1585 endif
1586
1587 ifneq ($(DYNAMIC_ARCH), 1)
1588 ifndef SMP
1589 LIBNAME         = $(LIBPREFIX)_$(LIBCORE)$(REVISION).$(LIBSUFFIX)
1590 LIBNAME_P       = $(LIBPREFIX)_$(LIBCORE)$(REVISION)_p.$(LIBSUFFIX)
1591 else
1592 LIBNAME         = $(LIBPREFIX)_$(LIBCORE)p$(REVISION).$(LIBSUFFIX)
1593 LIBNAME_P       = $(LIBPREFIX)_$(LIBCORE)p$(REVISION)_p.$(LIBSUFFIX)
1594 endif
1595 else
1596 ifndef SMP
1597 LIBNAME         = $(LIBPREFIX)$(REVISION).$(LIBSUFFIX)
1598 LIBNAME_P       = $(LIBPREFIX)$(REVISION)_p.$(LIBSUFFIX)
1599 else
1600 LIBNAME         = $(LIBPREFIX)p$(REVISION).$(LIBSUFFIX)
1601 LIBNAME_P       = $(LIBPREFIX)p$(REVISION)_p.$(LIBSUFFIX)
1602 endif
1603 endif
1604
1605
1606 LIBDLLNAME   = $(LIBPREFIX).dll
1607 IMPLIBNAME   = lib$(LIBNAMEBASE).dll.a
1608 ifneq ($(OSNAME), AIX)
1609 LIBSONAME    = $(LIBNAME:.$(LIBSUFFIX)=.so)
1610 else
1611 LIBSONAME    = $(LIBNAME:.$(LIBSUFFIX)=.a)
1612 endif
1613 LIBDYNNAME   = $(LIBNAME:.$(LIBSUFFIX)=.dylib)
1614 LIBDEFNAME   = $(LIBNAME:.$(LIBSUFFIX)=.def)
1615 LIBEXPNAME   = $(LIBNAME:.$(LIBSUFFIX)=.exp)
1616 LIBZIPNAME   = $(LIBNAME:.$(LIBSUFFIX)=.zip)
1617
1618 LIBS            = $(TOPDIR)/$(LIBNAME)
1619 LIBS_P          = $(TOPDIR)/$(LIBNAME_P)
1620
1621
1622 LIB_COMPONENTS = BLAS
1623 ifneq ($(NO_CBLAS), 1)
1624 LIB_COMPONENTS += CBLAS
1625 endif
1626
1627 ifneq ($(NO_LAPACK), 1)
1628 LIB_COMPONENTS += LAPACK
1629 ifneq ($(NO_LAPACKE), 1)
1630 LIB_COMPONENTS += LAPACKE
1631 endif
1632 ifeq ($(BUILD_RELAPACK), 1)
1633 LIB_COMPONENTS += ReLAPACK
1634 endif
1635 endif
1636
1637 ifeq ($(ONLY_CBLAS), 1)
1638 LIB_COMPONENTS = CBLAS
1639 endif
1640
1641 export OSNAME
1642 export ARCH
1643 export CORE
1644 export LIBCORE
1645 export __BYTE_ORDER__
1646 export ELF_VERSION
1647 export PGCPATH
1648 export CONFIG
1649 export CC
1650 export FC
1651 export BU
1652 export FU
1653 export NEED2UNDERSCORES
1654 export USE_THREAD
1655 export NUM_THREADS
1656 export NUM_CORES
1657 export SMP
1658 export MAKEFILE_RULE
1659 export NEED_PIC
1660 export BINARY
1661 export BINARY32
1662 export BINARY64
1663 export F_COMPILER
1664 export C_COMPILER
1665 export USE_OPENMP
1666 export CROSS
1667 export CROSS_SUFFIX
1668 export NOFORTRAN
1669 export C_LAPACK
1670 export NO_FBLAS
1671 export EXTRALIB
1672 export CEXTRALIB
1673 export FEXTRALIB
1674 export HAVE_SSE
1675 export HAVE_SSE2
1676 export HAVE_SSE3
1677 export HAVE_SSSE3
1678 export HAVE_SSE4_1
1679 export HAVE_SSE4_2
1680 export HAVE_SSE4A
1681 export HAVE_SSE5
1682 export HAVE_AVX
1683 export HAVE_AVX2
1684 export HAVE_FMA3
1685 export HAVE_VFP
1686 export HAVE_VFPV3
1687 export HAVE_VFPV4
1688 export HAVE_NEON
1689 ifndef NO_MSA
1690   export HAVE_MSA
1691   export MSA_FLAGS
1692 endif
1693 export KERNELDIR
1694 export FUNCTION_PROFILE
1695 export TARGET_CORE
1696 export NO_AVX512
1697 export NO_AVX2
1698 export BUILD_BFLOAT16
1699
1700 export SBGEMM_UNROLL_M
1701 export SBGEMM_UNROLL_N
1702 export SGEMM_UNROLL_M
1703 export SGEMM_UNROLL_N
1704 export DGEMM_UNROLL_M
1705 export DGEMM_UNROLL_N
1706 export QGEMM_UNROLL_M
1707 export QGEMM_UNROLL_N
1708 export CGEMM_UNROLL_M
1709 export CGEMM_UNROLL_N
1710 export ZGEMM_UNROLL_M
1711 export ZGEMM_UNROLL_N
1712 export XGEMM_UNROLL_M
1713 export XGEMM_UNROLL_N
1714 export CGEMM3M_UNROLL_M
1715 export CGEMM3M_UNROLL_N
1716 export ZGEMM3M_UNROLL_M
1717 export ZGEMM3M_UNROLL_N
1718 export XGEMM3M_UNROLL_M
1719 export XGEMM3M_UNROLL_N
1720
1721
1722 ifdef USE_CUDA
1723 export CUDADIR
1724 export CUCC
1725 export CUFLAGS
1726 export CULIB
1727 endif
1728
1729 .SUFFIXES: .$(PSUFFIX) .$(SUFFIX) .f
1730
1731 .f.$(SUFFIX):
1732         $(FC) $(FFLAGS) -c $<  -o $(@F)
1733
1734 .f.$(PSUFFIX):
1735         $(FC) $(FPFLAGS) -pg -c $<  -o $(@F)
1736
1737
1738 ifdef BINARY64
1739 PATHSCALEPATH   = /opt/pathscale/lib/3.1
1740 PGIPATH         = /opt/pgi/linux86-64/7.1-5/lib
1741 else
1742 PATHSCALEPATH   = /opt/pathscale/lib/3.1/32
1743 PGIPATH         = /opt/pgi/linux86/7.1-5/lib
1744 endif
1745
1746 ACMLPATH        = /opt/acml/4.3.0
1747 ifneq ($(OSNAME), Darwin)
1748 MKLPATH         = /opt/intel/mkl/10.2.2.025/lib
1749 else
1750 MKLPATH         = /Library/Frameworks/Intel_MKL.framework/Versions/10.0.1.014/lib
1751 endif
1752 ATLASPATH       = /opt/atlas/3.9.17/opteron
1753 FLAMEPATH       = $(HOME)/flame/lib
1754 ifneq ($(OSNAME), SunOS)
1755 SUNPATH         = /opt/sunstudio12.1
1756 else
1757 SUNPATH         = /opt/SUNWspro
1758 endif