[mlir][GPU] Initialize LLVM exactly once during GPU compiles

author Krzysztof Drewniak <Krzysztof.Drewniak@amd.com>

Tue, 11 Jul 2023 20:28:29 +0000 (20:28 +0000)

committer Krzysztof Drewniak <Krzysztof.Drewniak@amd.com>

Fri, 14 Jul 2023 19:10:52 +0000 (19:10 +0000)
author Krzysztof Drewniak <Krzysztof.Drewniak@amd.com>
Tue, 11 Jul 2023 20:28:29 +0000 (20:28 +0000)
committer Krzysztof Drewniak <Krzysztof.Drewniak@amd.com>
Fri, 14 Jul 2023 19:10:52 +0000 (19:10 +0000)
diff --git a/mlir/lib/Dialect/GPU/Transforms/SerializeToCubin.cpp b/mlir/lib/Dialect/GPU/Transforms/SerializeToCubin.cpp

index 172f006..0077deb 100644 (file)
--- a/mlir/lib/Dialect/GPU/Transforms/SerializeToCubin.cpp
+++ b/mlir/lib/Dialect/GPU/Transforms/SerializeToCubin.cpp
@@ -19,6 +19,7 @@
  #include "mlir/Target/LLVMIR/Dialect/NVVM/NVVMToLLVMIRTranslation.h"
  #include "mlir/Target/LLVMIR/Export.h"
  #include "llvm/Support/TargetSelect.h"
+#include "llvm/Support/Threading.h"
  
  #include <cuda.h>
  
@@ -46,6 +47,8 @@ static void emitCudaError(const llvm::Twine &expr, const char *buffer,
  namespace {
  class SerializeToCubinPass
      : public PassWrapper<SerializeToCubinPass, gpu::SerializeToBlobPass> {
+  static llvm::once_flag initializeBackendOnce;
+
  public:
    MLIR_DEFINE_EXPLICIT_INTERNAL_INLINE_TYPE_ID(SerializeToCubinPass)
  
@@ -73,9 +76,21 @@ static void maybeSetOption(Pass::Option<std::string> &option, StringRef value) {
      option = value.str();
  }
  
+llvm::once_flag SerializeToCubinPass::initializeBackendOnce;
+
  SerializeToCubinPass::SerializeToCubinPass(StringRef triple, StringRef chip,
                                             StringRef features, int optLevel,
                                             bool dumpPtx) {
+  // No matter how this pass is constructed, ensure that the NVPTX backend
+  // is initialized exactly once.
+  llvm::call_once(initializeBackendOnce, []() {
+    // Initialize LLVM NVPTX backend.
+    LLVMInitializeNVPTXTarget();
+    LLVMInitializeNVPTXTargetInfo();
+    LLVMInitializeNVPTXTargetMC();
+    LLVMInitializeNVPTXAsmPrinter();
+  });
+
    maybeSetOption(this->triple, triple);
    maybeSetOption(this->chip, chip);
    maybeSetOption(this->features, features);
@@ -144,15 +159,8 @@ SerializeToCubinPass::serializeISA(const std::string &isa) {
  
  // Register pass to serialize GPU kernel functions to a CUBIN binary annotation.
  void mlir::registerGpuSerializeToCubinPass() {
-  PassRegistration<SerializeToCubinPass> registerSerializeToCubin([] {
-    // Initialize LLVM NVPTX backend.
-    LLVMInitializeNVPTXTarget();
-    LLVMInitializeNVPTXTargetInfo();
-    LLVMInitializeNVPTXTargetMC();
-    LLVMInitializeNVPTXAsmPrinter();
-
-    return std::make_unique<SerializeToCubinPass>();
-  });
+  PassRegistration<SerializeToCubinPass> registerSerializeToCubin(
+      [] { return std::make_unique<SerializeToCubinPass>(); });
  }
  
  std::unique_ptr<Pass> mlir::createGpuSerializeToCubinPass(StringRef triple,
diff --git a/mlir/lib/Dialect/GPU/Transforms/SerializeToHsaco.cpp b/mlir/lib/Dialect/GPU/Transforms/SerializeToHsaco.cpp

index 108b8ab..e204a23 100644 (file)
--- a/mlir/lib/Dialect/GPU/Transforms/SerializeToHsaco.cpp
+++ b/mlir/lib/Dialect/GPU/Transforms/SerializeToHsaco.cpp
@@ -47,6 +47,7 @@
  #include "llvm/Support/Program.h"
  #include "llvm/Support/SourceMgr.h"
  #include "llvm/Support/TargetSelect.h"
+#include "llvm/Support/Threading.h"
  #include "llvm/Support/WithColor.h"
  
  #include "llvm/Target/TargetMachine.h"
@@ -54,7 +55,6 @@
  
  #include "llvm/Transforms/IPO/Internalize.h"
  
-#include <mutex>
  #include <optional>
  
  using namespace mlir;
@@ -62,6 +62,8 @@ using namespace mlir;
  namespace {
  class SerializeToHsacoPass
      : public PassWrapper<SerializeToHsacoPass, gpu::SerializeToBlobPass> {
+  static llvm::once_flag initializeBackendOnce;
+
  public:
    MLIR_DEFINE_EXPLICIT_INTERNAL_INLINE_TYPE_ID(SerializeToHsacoPass)
  
@@ -122,8 +124,20 @@ static void maybeSetOption(Pass::Option<std::string> &option,
      option = getValue();
  }
  
+llvm::once_flag SerializeToHsacoPass::initializeBackendOnce;
+
  SerializeToHsacoPass::SerializeToHsacoPass(StringRef triple, StringRef arch,
                                             StringRef features, int optLevel) {
+  // No matter how this pass is constructed, ensure that the AMDGPU backend
+  // is initialized exactly once.
+  llvm::call_once(initializeBackendOnce, []() {
+    // Initialize LLVM AMDGPU backend.
+    LLVMInitializeAMDGPUAsmParser();
+    LLVMInitializeAMDGPUAsmPrinter();
+    LLVMInitializeAMDGPUTarget();
+    LLVMInitializeAMDGPUTargetInfo();
+    LLVMInitializeAMDGPUTargetMC();
+  });
    maybeSetOption(this->triple, [&triple] { return triple.str(); });
    maybeSetOption(this->chip, [&arch] { return arch.str(); });
    maybeSetOption(this->features, [&features] { return features.str(); });
@@ -437,13 +451,6 @@ SerializeToHsacoPass::serializeISA(const std::string &isa) {
  // Register pass to serialize GPU kernel functions to a HSACO binary annotation.
  void mlir::registerGpuSerializeToHsacoPass() {
    PassRegistration<SerializeToHsacoPass> registerSerializeToHSACO([] {
-    // Initialize LLVM AMDGPU backend.
-    LLVMInitializeAMDGPUAsmParser();
-    LLVMInitializeAMDGPUAsmPrinter();
-    LLVMInitializeAMDGPUTarget();
-    LLVMInitializeAMDGPUTargetInfo();
-    LLVMInitializeAMDGPUTargetMC();
-
      return std::make_unique<SerializeToHsacoPass>("amdgcn-amd-amdhsa", "", "",
                                                    2);
    });
author	Krzysztof Drewniak <Krzysztof.Drewniak@amd.com>
	Tue, 11 Jul 2023 20:28:29 +0000 (20:28 +0000)
committer	Krzysztof Drewniak <Krzysztof.Drewniak@amd.com>
	Fri, 14 Jul 2023 19:10:52 +0000 (19:10 +0000)
mlir/lib/Dialect/GPU/Transforms/SerializeToCubin.cpp		patch \| blob \| history
mlir/lib/Dialect/GPU/Transforms/SerializeToHsaco.cpp		patch \| blob \| history