[z]ger: increase multithread threshold
authorJerome Robert <jeromerobert@gmx.com>
Fri, 15 Jan 2016 17:40:13 +0000 (18:40 +0100)
committerJerome Robert <jeromerobert@gmx.com>
Sun, 24 Jan 2016 09:46:35 +0000 (10:46 +0100)
The ones given in 3ae30cd was by far to low because I
mixed m and m*n in my measures. Note that the new ones
are closed to the [z]gemv ones which is comforting
that both are right.

interface/ger.c
interface/zger.c

index b2f803d..8cf1614 100644 (file)
@@ -175,7 +175,7 @@ void CNAME(enum CBLAS_ORDER order,
 
 #ifdef SMPTEST
   // Threshold chosen so that speed-up is > 1 on a Xeon E5-2630
-  if(1L * m * n > 24L * GEMM_MULTITHREAD_THRESHOLD)
+  if(1L * m * n > 2048L * GEMM_MULTITHREAD_THRESHOLD)
     nthreads = num_cpu_avail(2);
   else
     nthreads = 1;
index 5bcbfc0..f7354d2 100644 (file)
@@ -214,7 +214,7 @@ void CNAME(enum CBLAS_ORDER order,
 
 #ifdef SMPTEST
   // Threshold chosen so that speed-up is > 1 on a Xeon E5-2630
-  if(1L * m * n > 3L * sizeof(FLOAT) * GEMM_MULTITHREAD_THRESHOLD)
+  if(1L * m * n > 36L * sizeof(FLOAT) * sizeof(FLOAT) * GEMM_MULTITHREAD_THRESHOLD)
     nthreads = num_cpu_avail(2);
   else
     nthreads = 1;