Eliminate type dispatch from copy_kernel, and use memcpy directly rather than impleme...

author Owen Anderson <owen.anderson@oculus.com>

Wed, 17 Apr 2019 22:33:07 +0000 (15:33 -0700)

committer Facebook Github Bot <facebook-github-bot@users.noreply.github.com>

Wed, 17 Apr 2019 22:39:13 +0000 (15:39 -0700)
author Owen Anderson <owen.anderson@oculus.com>
Wed, 17 Apr 2019 22:33:07 +0000 (15:33 -0700)
committer Facebook Github Bot <facebook-github-bot@users.noreply.github.com>
Wed, 17 Apr 2019 22:39:13 +0000 (15:39 -0700)
diff --git a/aten/src/ATen/native/cpu/CopyKernel.cpp b/aten/src/ATen/native/cpu/CopyKernel.cpp

index 4f157bc..38f6ee6 100644 (file)
--- a/aten/src/ATen/native/cpu/CopyKernel.cpp
+++ b/aten/src/ATen/native/cpu/CopyKernel.cpp
@@ -14,20 +14,17 @@ namespace {
  constexpr int64_t COPY_GRAIN_SIZE = 20000;
  
  static void copy_kernel_impl(Tensor& dst, const Tensor& src) {
-  AT_DISPATCH_ALL_TYPES_AND2(
-    at::ScalarType::Half, at::ScalarType::Bool, dst.scalar_type(), "copy_kernel_impl", [&]() {
-      scalar_t* self_ptr = dst.data<scalar_t>();
-      scalar_t* src_ptr = src.data<scalar_t>();
-
-      auto sample = [&](int64_t begin, int64_t end) {
-        int64_t len = end - begin;
-        scalar_t* self_seg = self_ptr + begin;
-        scalar_t* src_seg = src_ptr + begin;
-        at::vec256::convert<scalar_t, scalar_t>(src_seg, self_seg, len);
-    };
-
-    parallel_for(0, dst.numel(), COPY_GRAIN_SIZE, sample);
-  });
+  char* self_ptr = (char*)dst.data_ptr();
+  char* src_ptr = (char*)src.data_ptr();
+
+  auto sample = [=](int64_t begin, int64_t end) {
+    int64_t len = end - begin;
+    char* self_seg = self_ptr + begin;
+    char* src_seg = src_ptr + begin;
+    memcpy(self_seg, src_seg, len);
+  };
+
+  parallel_for(0, dst.nbytes(), COPY_GRAIN_SIZE, sample);
  }
  
  } // anonymous namespace
author	Owen Anderson <owen.anderson@oculus.com>
	Wed, 17 Apr 2019 22:33:07 +0000 (15:33 -0700)
committer	Facebook Github Bot <facebook-github-bot@users.noreply.github.com>
	Wed, 17 Apr 2019 22:39:13 +0000 (15:39 -0700)