[OpenMP] Remove implicit data sharing using device shared memory from libomptarget

author Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>

Wed, 7 Mar 2018 22:10:10 +0000 (22:10 +0000)

committer Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>

Wed, 7 Mar 2018 22:10:10 +0000 (22:10 +0000)
author Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
Wed, 7 Mar 2018 22:10:10 +0000 (22:10 +0000)
committer Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
Wed, 7 Mar 2018 22:10:10 +0000 (22:10 +0000)
diff --git a/openmp/libomptarget/deviceRTLs/nvptx/src/interface.h b/openmp/libomptarget/deviceRTLs/nvptx/src/interface.h

index 4005353b17c41aa2e9b77cfe55f4db063daab924..f314443a8f2013812b95476b823d7752fa64b5f7 100644 (file)
--- a/openmp/libomptarget/deviceRTLs/nvptx/src/interface.h
+++ b/openmp/libomptarget/deviceRTLs/nvptx/src/interface.h
@@ -470,9 +470,8 @@ EXTERN void __kmpc_spmd_kernel_init(int ThreadLimit, int16_t RequiresOMPRuntime,
                                      int16_t RequiresDataSharing);
  EXTERN void __kmpc_spmd_kernel_deinit();
  EXTERN void __kmpc_kernel_prepare_parallel(void *WorkFn,
-                                           void ***SharedArgs, int32_t nArgs,
                                             int16_t IsOMPRuntimeInitialized);
-EXTERN bool __kmpc_kernel_parallel(void **WorkFn, void ***SharedArgs,
+EXTERN bool __kmpc_kernel_parallel(void **WorkFn,
                                     int16_t IsOMPRuntimeInitialized);
  EXTERN void __kmpc_kernel_end_parallel();
  EXTERN bool __kmpc_kernel_convergent_parallel(void *buffer, uint32_t Mask,
diff --git a/openmp/libomptarget/deviceRTLs/nvptx/src/omp_data.cu b/openmp/libomptarget/deviceRTLs/nvptx/src/omp_data.cu

index 8ff8f7b4723cd93bf558a6144be2e7af5857be43..adedc0b3aa5ab70839b9912c32efaa84fefc4e55 100644 (file)
--- a/openmp/libomptarget/deviceRTLs/nvptx/src/omp_data.cu
+++ b/openmp/libomptarget/deviceRTLs/nvptx/src/omp_data.cu
@@ -46,8 +46,3 @@ __device__ __shared__ DataSharingStateTy DataSharingState;
  // Scratchpad for teams reduction.
  ////////////////////////////////////////////////////////////////////////////////
  __device__ __shared__ void *ReductionScratchpadPtr;
-
-////////////////////////////////////////////////////////////////////////////////
-// Data sharing related variables.
-////////////////////////////////////////////////////////////////////////////////
-__device__ __shared__ omptarget_nvptx_SharedArgs omptarget_nvptx_sharedArgs;
diff --git a/openmp/libomptarget/deviceRTLs/nvptx/src/omptarget-nvptx.cu b/openmp/libomptarget/deviceRTLs/nvptx/src/omptarget-nvptx.cu

index fca2aa0e4ac565d74b885d6ed432deb907c8e6a9..5c5c88b2cb64ebca821b73c6f5e9ddb5a7899c0e 100644 (file)
--- a/openmp/libomptarget/deviceRTLs/nvptx/src/omptarget-nvptx.cu
+++ b/openmp/libomptarget/deviceRTLs/nvptx/src/omptarget-nvptx.cu
@@ -54,9 +54,6 @@ EXTERN void __kmpc_kernel_init(int ThreadLimit, int16_t RequiresOMPRuntime) {
    PRINT(LD_IO, "call to __kmpc_kernel_init with version %f\n",
          OMPTARGET_NVPTX_VERSION);
  
-  // init parallel work arguments
-  omptarget_nvptx_sharedArgs.Init();
-
    if (!RequiresOMPRuntime) {
      // If OMP runtime is not required don't initialize OMP state.
      setExecutionParameters(Generic, RuntimeUninitialized);
@@ -110,9 +107,6 @@ EXTERN void __kmpc_kernel_deinit(int16_t IsOMPRuntimeInitialized) {
    }
    // Done with work.  Kill the workers.
    omptarget_nvptx_workFn = 0;
-
-  // Deinit parallel work arguments
-  omptarget_nvptx_sharedArgs.DeInit();
  }
  
  EXTERN void __kmpc_spmd_kernel_init(int ThreadLimit, int16_t RequiresOMPRuntime,
diff --git a/openmp/libomptarget/deviceRTLs/nvptx/src/omptarget-nvptx.h b/openmp/libomptarget/deviceRTLs/nvptx/src/omptarget-nvptx.h

index 43b8dd27bf5d89a1ee0fc96fac79a2e93d8b42c5..3ee32f96480a600273bf18b6edfaf4d91c5c1fd8 100644 (file)
--- a/openmp/libomptarget/deviceRTLs/nvptx/src/omptarget-nvptx.h
+++ b/openmp/libomptarget/deviceRTLs/nvptx/src/omptarget-nvptx.h
@@ -62,46 +62,6 @@
  #define __ACTIVEMASK() __ballot(1)
  #endif
  
-// arguments needed for L0 parallelism only.
-class omptarget_nvptx_SharedArgs {
-public:
-  // All these methods must be called by the master thread only.
-  INLINE void Init() {
-    args  = buffer;
-    nArgs = MAX_SHARED_ARGS;
-  }
-  INLINE void DeInit() {
-    // Free any memory allocated for outlined parallel function with a large
-    // number of arguments.
-    if (nArgs > MAX_SHARED_ARGS) {
-      SafeFree(args, (char *)"new extended args");
-      Init();
-    }
-  }
-  INLINE void EnsureSize(int size) {
-    if (size > nArgs) {
-      if (nArgs > MAX_SHARED_ARGS) {
-        SafeFree(args, (char *)"new extended args");
-      }
-      args = (void **) SafeMalloc(size * sizeof(void *),
-                                  (char *)"new extended args");
-      nArgs = size;
-    }
-  }
-  // Called by all threads.
-  INLINE void **GetArgs() { return args; };
-private:
-  // buffer of pre-allocated arguments.
-  void *buffer[MAX_SHARED_ARGS];
-  // pointer to arguments buffer.
-  // starts off as a pointer to 'buffer' but can be dynamically allocated.
-  void **args;
-  // starts off as MAX_SHARED_ARGS but can increase in size.
-  uint32_t nArgs;
-};
-
-extern __device__ __shared__ omptarget_nvptx_SharedArgs omptarget_nvptx_sharedArgs;
-
  // Data sharing related quantities, need to match what is used in the compiler.
  enum DATA_SHARING_SIZES {
    // The maximum number of workers in a kernel.
diff --git a/openmp/libomptarget/deviceRTLs/nvptx/src/option.h b/openmp/libomptarget/deviceRTLs/nvptx/src/option.h

index 43172ad45d0797e7c0c4b918a7d3ac3355de9fc7..c5f5d9c04fb59dd91f6fd54788a39d045da5b834 100644 (file)
--- a/openmp/libomptarget/deviceRTLs/nvptx/src/option.h
+++ b/openmp/libomptarget/deviceRTLs/nvptx/src/option.h
@@ -28,10 +28,6 @@
  // region to synchronize with each other.
  #define L1_BARRIER (1)
  
-// Maximum number of preallocated arguments to an outlined parallel/simd function.
-// Anything more requires dynamic memory allocation.
-#define MAX_SHARED_ARGS 20
-
  // Maximum number of omp state objects per SM allocated statically in global
  // memory.
  #if __CUDA_ARCH__ >= 600
diff --git a/openmp/libomptarget/deviceRTLs/nvptx/src/parallel.cu b/openmp/libomptarget/deviceRTLs/nvptx/src/parallel.cu

index 0b9ebd401f848fa6adf80a5eb8f59d70b93f7551..d4546284fac4f46601f4e1c9e16519323a297a9e 100644 (file)
--- a/openmp/libomptarget/deviceRTLs/nvptx/src/parallel.cu
+++ b/openmp/libomptarget/deviceRTLs/nvptx/src/parallel.cu
@@ -214,16 +214,10 @@ EXTERN void __kmpc_kernel_end_convergent_parallel(void *buffer) {
  //
  // This routine is always called by the team master..
  EXTERN void __kmpc_kernel_prepare_parallel(void *WorkFn,
-                                           void ***SharedArgs, int32_t nArgs,
                                             int16_t IsOMPRuntimeInitialized) {
    PRINT0(LD_IO, "call to __kmpc_kernel_prepare_parallel\n");
    omptarget_nvptx_workFn = WorkFn;
  
-  if (nArgs > 0) {
-    omptarget_nvptx_sharedArgs.EnsureSize(nArgs);
-    *SharedArgs = omptarget_nvptx_sharedArgs.GetArgs();
-  }
-
    if (!IsOMPRuntimeInitialized)
      return;
  
@@ -323,13 +317,11 @@ EXTERN void __kmpc_kernel_prepare_parallel(void *WorkFn,
  //
  // Only the worker threads call this routine.
  EXTERN bool __kmpc_kernel_parallel(void **WorkFn,
-                                   void ***SharedArgs,
                                     int16_t IsOMPRuntimeInitialized) {
    PRINT0(LD_IO | LD_PAR, "call to __kmpc_kernel_parallel\n");
  
    // Work function and arguments for L1 parallel region.
    *WorkFn = omptarget_nvptx_workFn;
-  *SharedArgs = omptarget_nvptx_sharedArgs.GetArgs();
  
    if (!IsOMPRuntimeInitialized)
      return true;
author	Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
	Wed, 7 Mar 2018 22:10:10 +0000 (22:10 +0000)
committer	Gheorghe-Teodor Bercea <gheorghe-teod.bercea@ibm.com>
	Wed, 7 Mar 2018 22:10:10 +0000 (22:10 +0000)
openmp/libomptarget/deviceRTLs/nvptx/src/interface.h		patch \| blob \| history
openmp/libomptarget/deviceRTLs/nvptx/src/omp_data.cu		patch \| blob \| history
openmp/libomptarget/deviceRTLs/nvptx/src/omptarget-nvptx.cu		patch \| blob \| history
openmp/libomptarget/deviceRTLs/nvptx/src/omptarget-nvptx.h		patch \| blob \| history
openmp/libomptarget/deviceRTLs/nvptx/src/option.h		patch \| blob \| history
openmp/libomptarget/deviceRTLs/nvptx/src/parallel.cu		patch \| blob \| history