Moved LIBXSMM convolutions to a separate --define flag so that they are disabled...

author A. Unique TensorFlower <gardener@tensorflow.org>

Fri, 23 Feb 2018 01:19:49 +0000 (17:19 -0800)

committer TensorFlower Gardener <gardener@tensorflow.org>

Fri, 23 Feb 2018 01:24:47 +0000 (17:24 -0800)
author A. Unique TensorFlower <gardener@tensorflow.org>
Fri, 23 Feb 2018 01:19:49 +0000 (17:19 -0800)
committer TensorFlower Gardener <gardener@tensorflow.org>
Fri, 23 Feb 2018 01:24:47 +0000 (17:24 -0800)
diff --git a/tensorflow/core/kernels/BUILD b/tensorflow/core/kernels/BUILD

index dd0de78..3426cf6 100644 (file)
--- a/tensorflow/core/kernels/BUILD
+++ b/tensorflow/core/kernels/BUILD
@@ -56,8 +56,8 @@ load("@local_config_cuda//cuda:build_defs.bzl", "if_cuda")
  
  config_setting(
      # Add "--define tensorflow_xsmm=1" to your build command to use libxsmm for
-    # convolutions (and possibly more in the future). You will also need
-    # appropriate -mavx*, as required by specific op you use.
+    # sparse matrix multiplications. You will also need appropriate -mavx*
+    # options, as required by specific op you use.
      name = "xsmm",
      values = {
          "define": "tensorflow_xsmm=1",
@@ -65,12 +65,23 @@ config_setting(
  )
  
  config_setting(
-    # Add "--define tensorflow_xsmm_backward=1" to your build command to use
-    # libxsmm for backward convolutions (and possibly more in the future). You
-    # will also need appropriate -mavx*, as required by specific op you use.
-    name = "xsmm_backward",
+    # Add "--define tensorflow_xsmm_convolutions=1" to your build command to
+    # use libxsmm for forward convolutions. You will also need appropriate
+    # -mavx* # options, as required by specific op you use.
+    name = "xsmm_convolutions",
      values = {
-        "define": "tensorflow_xsmm_backward=1",
+        "define": "tensorflow_xsmm_convolutions=1",
+    },
+)
+
+config_setting(
+    # Add "--define tensorflow_xsmm_convolutions=1 --define
+    # tensorflow_xsmm_backward_convolutions=1" to your build command to use libxsmm for
+    # backward convolutions (and possibly more in the future). You will also
+    # need appropriate -mavx* options, as required by specific op you use.
+    name = "xsmm_backward_convolutions",
+    values = {
+        "define": "tensorflow_xsmm_backward_convolutions=1",
      },
  )
  
@@ -1017,7 +1028,7 @@ tf_cc_test(
      name = "xsmm_conv2d_test",
      size = "small",
      srcs = select({
-        ":xsmm": ["xsmm_conv2d_test.cc"],
+        ":xsmm_convolutions": ["xsmm_conv2d_test.cc"],
          "//conditions:default": [],
      }),
      deps = [
@@ -1032,7 +1043,7 @@ tf_cc_test(
          "//tensorflow/core:test_main",
          "//tensorflow/core:testlib",
      ] + select({
-        ":xsmm": [
+        ":xsmm_convolutions": [
              "@libxsmm_archive//:xsmm_avx",
          ],
          "//conditions:default": [],
@@ -3138,7 +3149,7 @@ tf_kernel_library(
          "conv_grad_ops_3d.cc",
          "deep_conv2d.cc",
      ] + select({
-        ":xsmm": ["xsmm_conv2d.cc"],
+        ":xsmm_convolutions": ["xsmm_conv2d.cc"],
          "//conditions:default": [],
      }),
      hdrs = [
@@ -3148,7 +3159,7 @@ tf_kernel_library(
          "gemm_functors.h",
          "winograd_transform.h",
      ] + select({
-        ":xsmm": ["xsmm_conv2d.h"],
+        ":xsmm_convolutions": ["xsmm_conv2d.h"],
          "//conditions:default": [],
      }),
      # Override EIGEN_STRONG_INLINE to inline when --define=override_eigen_strong_inline=true,
@@ -3156,13 +3167,15 @@ tf_kernel_library(
      # on Windows. See https://github.com/tensorflow/tensorflow/issues/10521
      copts = if_override_eigen_strong_inline(["/DEIGEN_STRONG_INLINE=inline"]),
      defines = select({
-        ":xsmm": [
-            "TENSORFLOW_USE_LIBXSMM",
-            "EIGEN_USE_LIBXSMM",
+        ":xsmm_convolutions": [
+            "TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS",
          ],
          "//conditions:default": [],
      }) + select({
-        ":xsmm_backward": ["TENSORFLOW_USE_LIBXSMM_BACKWARD"],
+        ":xsmm": ["EIGEN_USE_LIBXSMM"],
+        "//conditions:default": [],
+    }) + select({
+        ":xsmm_backward_convolutions": ["TENSORFLOW_USE_LIBXSMM_BACKWARD_CONVOLUTIONS"],
          "//conditions:default": [],
      }),
      prefix = "conv_ops",
@@ -3179,7 +3192,7 @@ tf_kernel_library(
          "//tensorflow/core:lib_internal",
          "//tensorflow/core:nn_ops_op_lib",
      ] + select({
-        ":xsmm": [
+        ":xsmm_convolutions": [
              "@libxsmm_archive//:xsmm_avx",
          ],
          "//conditions:default": [],
@@ -4868,7 +4881,7 @@ filegroup(
          "winograd_transform.h",
          ":android_extended_ops_headers",
      ] + select({
-        ":xsmm": [
+        ":xsmm_convolutions": [
              "xsmm_conv2d.h",
              "xsmm_conv2d.cc",
          ],
diff --git a/tensorflow/core/kernels/conv_grad_filter_ops.cc b/tensorflow/core/kernels/conv_grad_filter_ops.cc

index b8a5ae6..e6ae595 100644 (file)
--- a/tensorflow/core/kernels/conv_grad_filter_ops.cc
+++ b/tensorflow/core/kernels/conv_grad_filter_ops.cc
@@ -31,7 +31,7 @@ limitations under the License.
  #include "tensorflow/core/framework/tensor_slice.h"
  #include "tensorflow/core/kernels/conv_2d.h"
  #include "tensorflow/core/kernels/fill_functor.h"
-#ifdef TENSORFLOW_USE_LIBXSMM
+#ifdef TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS
  #include "tensorflow/core/kernels/xsmm_conv2d.h"
  #endif
  #include "tensorflow/core/kernels/ops_util.h"
@@ -106,7 +106,7 @@ struct LaunchConv2DBackpropFilterOp<CPUDevice, T> {
    }
  };
  
-#ifdef TENSORFLOW_USE_LIBXSMM
+#ifdef TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS
  template <typename Device, class T>
  struct LaunchXsmmBackwardFilter {
    bool operator()(OpKernelContext* context, const Device& d,
@@ -243,7 +243,8 @@ class Conv2DFastBackpropFilterOp : public OpKernel {
        return;
      }
  
-#if defined TENSORFLOW_USE_LIBXSMM && defined TENSORFLOW_USE_LIBXSMM_BACKWARD
+#if defined TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS && \
+    defined TENSORFLOW_USE_LIBXSMM_BACKWARD_CONVOLUTIONS
      int64 pad_top, pad_bottom;
      int64 pad_left, pad_right;
      OP_REQUIRES_OK(
@@ -371,7 +372,8 @@ class Conv2DCustomBackpropFilterOp : public OpKernel {
              dims.spatial_dims[1].input_size, dims.spatial_dims[1].filter_size,
              dims.spatial_dims[1].stride, padding_,
              &dims.spatial_dims[1].output_size, &pad_left, &pad_right));
-#if defined TENSORFLOW_USE_LIBXSMM && defined TENSORFLOW_USE_LIBXSMM_BACKWARD
+#if defined TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS && \
+    defined TENSORFLOW_USE_LIBXSMM_BACKWARD_CONVOLUTIONS
      if (pad_left == pad_right && pad_top == pad_bottom) {
        if (LaunchXsmmBackwardFilter<Device, T>()(
                context, context->eigen_device<Device>(), input.tensor<T, 4>(),
diff --git a/tensorflow/core/kernels/conv_grad_input_ops.cc b/tensorflow/core/kernels/conv_grad_input_ops.cc

index b87c789..15c55e4 100644 (file)
--- a/tensorflow/core/kernels/conv_grad_input_ops.cc
+++ b/tensorflow/core/kernels/conv_grad_input_ops.cc
@@ -30,7 +30,7 @@ limitations under the License.
  #include "tensorflow/core/framework/tensor_shape.h"
  #include "tensorflow/core/framework/tensor_slice.h"
  #include "tensorflow/core/kernels/conv_2d.h"
-#ifdef TENSORFLOW_USE_LIBXSMM
+#ifdef TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS
  #include "tensorflow/core/kernels/xsmm_conv2d.h"
  #endif
  #include "tensorflow/core/kernels/ops_util.h"
@@ -111,7 +111,7 @@ struct LaunchConv2DBackpropInputOp<CPUDevice, T> {
    }
  };
  
-#ifdef TENSORFLOW_USE_LIBXSMM
+#ifdef TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS
  template <typename Device, class T>
  struct LaunchXsmmBackwardInputConvolution {
    bool operator()(OpKernelContext* context, const Device& d,
@@ -246,7 +246,8 @@ class Conv2DFastBackpropInputOp : public OpKernel {
        return;
      }
  
-#if defined TENSORFLOW_USE_LIBXSMM && defined TENSORFLOW_USE_LIBXSMM_BACKWARD
+#if defined TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS && \
+    defined TENSORFLOW_USE_LIBXSMM_BACKWARD_CONVOLUTIONS
      int64 pad_top, pad_bottom;
      int64 pad_left, pad_right;
      OP_REQUIRES_OK(
@@ -363,7 +364,8 @@ class Conv2DCustomBackpropInputOp : public OpKernel {
  
  // TODO(andydavis) Consider moving code shared with
  // Conv2DCustomBackpropFilterOp into a shared helper function.
-#if defined TENSORFLOW_USE_LIBXSMM && defined TENSORFLOW_USE_LIBXSMM_BACKWARD
+#if defined TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS && \
+    defined TENSORFLOW_USE_LIBXSMM_BACKWARD_CONVOLUTIONS
      int64 pad_top, pad_bottom;
      int64 pad_left, pad_right;
      OP_REQUIRES_OK(
diff --git a/tensorflow/core/kernels/conv_ops.cc b/tensorflow/core/kernels/conv_ops.cc

index 2b81e14..47f6907 100644 (file)
--- a/tensorflow/core/kernels/conv_ops.cc
+++ b/tensorflow/core/kernels/conv_ops.cc
@@ -32,7 +32,7 @@ limitations under the License.
  #include "tensorflow/core/kernels/conv_2d.h"
  #include "tensorflow/core/kernels/deep_conv2d.h"
  #include "tensorflow/core/kernels/ops_util.h"
-#ifdef TENSORFLOW_USE_LIBXSMM
+#ifdef TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS
  #include "tensorflow/core/kernels/xsmm_conv2d.h"
  #endif
  #include "tensorflow/core/lib/core/errors.h"
@@ -185,7 +185,7 @@ class LaunchDeepConvOp<CPUDevice, float> {
    }
  };
  
-#ifdef TENSORFLOW_USE_LIBXSMM
+#ifdef TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS
  template <typename Device, typename T>
  class LaunchXsmmConvOp {
   public:
@@ -401,7 +401,7 @@ class Conv2DOp : public BinaryOp<T> {
        return;
      }
  
-#ifdef TENSORFLOW_USE_LIBXSMM
+#ifdef TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS
      if (LaunchXsmmConvOp<Device, T>::Run(
              context, input, filter, batch, input_rows, input_cols, in_depth,
              filter_rows, filter_cols, pad_rows, pad_cols, out_rows, out_cols,
diff --git a/tensorflow/core/kernels/xsmm_conv2d.cc b/tensorflow/core/kernels/xsmm_conv2d.cc

index ba03357..f8c0698 100644 (file)
--- a/tensorflow/core/kernels/xsmm_conv2d.cc
+++ b/tensorflow/core/kernels/xsmm_conv2d.cc
@@ -16,7 +16,7 @@ limitations under the License.
  // Make this file empty (or nearly empty) so that it can be compiled even when
  // libxsmm is not available.
  
-#ifndef TENSORFLOW_USE_LIBXSMM
+#ifndef TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS
  void dummy_xsmm_conv2d_ensure_file_is_not_empty();
  #else
  
@@ -32,9 +32,9 @@ void dummy_xsmm_conv2d_ensure_file_is_not_empty();
  #include "tensorflow/core/lib/core/blocking_counter.h"
  #include "tensorflow/core/lib/core/threadpool.h"
  
-#include "libxsmm_main.h"  // TODO(bsteiner): API to avoid incl. header from src/
  #include "include/libxsmm_cpuid.h"
  #include "include/libxsmm_malloc.h"
+#include "third_party/libxsmm/src/libxsmm_main.h"  // TODO(bsteiner): API to avoid incl. header from src/
  
  namespace tensorflow {
  
@@ -173,8 +173,16 @@ static bool CallLibxsmmConvGeneric(OpKernelContext* ctx,
                                     InputPtr input, FilterPtr filter,
                                     OutputPtr output) {
  #if defined(LIBXSMM_DETAILED_TIMING)
-  unsigned long long l_tick1, l_tick2, l_tick3, l_tick4, l_tick5, l_tick6,
-      l_tick7, l_tick8, l_tick9, l_tick10;
+  uint64 l_tick1;
+  uint64 l_tick2;
+  uint64 l_tick3;
+  uint64 l_tick4;
+  uint64 l_tick5;
+  uint64 l_tick6;
+  uint64 l_tick7;
+  uint64 l_tick8;
+  uint64 l_tick9;
+  uint64 l_tick10;
    l_tick1 = libxsmm_timer_tick();
  #endif
    // setup scoped allocator, which adopts the allocator from the context
@@ -453,6 +461,7 @@ static bool CallLibxsmmConvGeneric(OpKernelContext* ctx,
    return true;  // Succeeded
  }
  
+#ifdef TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS
  template <typename T>
  struct XsmmFwdConv2D<CPUDevice, T> {
    bool operator()(OpKernelContext* ctx, const libxsmm_dnn_conv_desc& desc,
@@ -461,7 +470,9 @@ struct XsmmFwdConv2D<CPUDevice, T> {
                                    input, filter, output);
    }
  };
+#endif
  
+#ifdef TENSORFLOW_USE_LIBXSMM_BACKWARD_CONVOLUTIONS
  template <typename T>
  struct XsmmBkwInputConv2D<CPUDevice, T> {
    bool operator()(OpKernelContext* ctx, const libxsmm_dnn_conv_desc& desc,
@@ -479,6 +490,7 @@ struct XsmmBkwFilterConv2D<CPUDevice, T> {
                                    input, filter, output);
    }
  };
+#endif
  
  }  // namespace functor
  
@@ -488,4 +500,4 @@ template struct functor::XsmmBkwFilterConv2D<CPUDevice, float>;
  
  }  // namespace tensorflow
  
-#endif  // TENSORFLOW_USE_LIBXSMM
+#endif  // TENSORFLOW_USE_LIBXSMM_CONVOLUTIONS
author	A. Unique TensorFlower <gardener@tensorflow.org>
	Fri, 23 Feb 2018 01:19:49 +0000 (17:19 -0800)
committer	TensorFlower Gardener <gardener@tensorflow.org>
	Fri, 23 Feb 2018 01:24:47 +0000 (17:24 -0800)
tensorflow/core/kernels/BUILD		patch \| blob \| history
tensorflow/core/kernels/conv_grad_filter_ops.cc		patch \| blob \| history
tensorflow/core/kernels/conv_grad_input_ops.cc		patch \| blob \| history
tensorflow/core/kernels/conv_ops.cc		patch \| blob \| history
tensorflow/core/kernels/xsmm_conv2d.cc		patch \| blob \| history