[DDP][Grad compression] Fix fp16 cpp hook (#63375)

author Rohan Varma <rvarm1@fb.com>

Wed, 18 Aug 2021 18:38:11 +0000 (11:38 -0700)

committer Facebook GitHub Bot <facebook-github-bot@users.noreply.github.com>

Wed, 18 Aug 2021 18:49:35 +0000 (11:49 -0700)
author Rohan Varma <rvarm1@fb.com>
Wed, 18 Aug 2021 18:38:11 +0000 (11:38 -0700)
committer Facebook GitHub Bot <facebook-github-bot@users.noreply.github.com>
Wed, 18 Aug 2021 18:49:35 +0000 (11:49 -0700)
diff --git a/torch/csrc/distributed/c10d/default_comm_hooks.cpp b/torch/csrc/distributed/c10d/default_comm_hooks.cpp

index 9d13099c424c655ddbce8908db9d8ab9aebd8f1c..91700baa2e4a584754e3eb15eeb51c774a8d30c6 100644 (file)
--- a/torch/csrc/distributed/c10d/default_comm_hooks.cpp
+++ b/torch/csrc/distributed/c10d/default_comm_hooks.cpp
@@ -16,21 +16,23 @@ c10::intrusive_ptr<c10::ivalue::Future> AllReduceCommHook::runHook(
  
  c10::intrusive_ptr<c10::ivalue::Future> FP16CompressCommHook::runHook(
      GradBucket& bucket) {
-  auto& tensor = bucket.getBufferRef();
-  tensor.copy_(tensor.to(torch::kFloat16));
-  std::vector<at::Tensor> tensors = {tensor};
+
+  auto compressed_tensor = bucket.getBufferRef().to(torch::kFloat16);
    // Apply the division first to avoid overflow.
-  tensors[0] /= state_->getSize();
+  compressed_tensor /= state_->getSize();
+  std::vector<at::Tensor> tensors = {compressed_tensor};
  
    auto allreduce_fut = state_->allreduce(tensors)->getFuture();
-  auto decompress = [](c10::ivalue::Future& allreduce_fut) {
+  auto decompressed_tensor = bucket.getBufferRef();
+  auto decompress = [decompressed_tensor](c10::ivalue::Future& allreduce_fut) {
      auto result = allreduce_fut.value();
      TORCH_INTERNAL_ASSERT(
          result.isTensorList(),
          "ProcessGroup::allreduce should return TensorList");
+
      auto reduce_tensor = result.toTensorVector()[0];
-    reduce_tensor.copy_(reduce_tensor.to(torch::kFloat));
-    return c10::IValue(reduce_tensor);
+    decompressed_tensor.copy_(reduce_tensor);
+    return c10::IValue(decompressed_tensor);
    };
  
    return allreduce_fut->then(decompress, allreduce_fut->elementType());
author	Rohan Varma <rvarm1@fb.com>
	Wed, 18 Aug 2021 18:38:11 +0000 (11:38 -0700)
committer	Facebook GitHub Bot <facebook-github-bot@users.noreply.github.com>
	Wed, 18 Aug 2021 18:49:35 +0000 (11:49 -0700)