Bool tensor. Part 0: Boolean storage implementation (#16810)

author Iurii Zdebskyi <iuriiz@fb.com>

Tue, 19 Feb 2019 16:17:49 +0000 (08:17 -0800)

committer Facebook Github Bot <facebook-github-bot@users.noreply.github.com>

Tue, 19 Feb 2019 16:22:13 +0000 (08:22 -0800)
author Iurii Zdebskyi <iuriiz@fb.com>
Tue, 19 Feb 2019 16:17:49 +0000 (08:17 -0800)
committer Facebook Github Bot <facebook-github-bot@users.noreply.github.com>
Tue, 19 Feb 2019 16:22:13 +0000 (08:22 -0800)
diff --git a/aten/src/ATen/DLConvertor.cpp b/aten/src/ATen/DLConvertor.cpp

index 721516f..8c1bab7 100644 (file)
--- a/aten/src/ATen/DLConvertor.cpp
+++ b/aten/src/ATen/DLConvertor.cpp
@@ -37,6 +37,9 @@ static DLDataType getDLDataType(const Type& type) {
      case ScalarType::Half:
        dtype.code = DLDataTypeCode::kDLFloat;
        break;
+    case ScalarType::Bool:
+      dtype.code = DLDataTypeCode::kDLUInt;
+      break;
      case ScalarType::ComplexHalf:
        throw std::logic_error("ComplexHalf is not supported by dlpack");
      case ScalarType::ComplexFloat:
diff --git a/aten/src/ATen/core/Type.h b/aten/src/ATen/core/Type.h

index b90dd26..1b300f1 100644 (file)
--- a/aten/src/ATen/core/Type.h
+++ b/aten/src/ATen/core/Type.h
@@ -44,6 +44,7 @@ struct Generator;
  static inline void noop_deleter(void*) {}
  
  enum class TypeID {
+  CPUBool,
    CPUByte,
    CPUChar,
    CPUDouble,
@@ -52,6 +53,7 @@ enum class TypeID {
    CPULong,
    CPUShort,
    CPUHalf,
+  SparseCPUBool,
    SparseCPUByte,
    SparseCPUChar,
    SparseCPUDouble,
@@ -59,6 +61,7 @@ enum class TypeID {
    SparseCPUInt,
    SparseCPULong,
    SparseCPUShort,
+  CUDABool,
    CUDAByte,
    CUDAChar,
    CUDADouble,
@@ -67,6 +70,7 @@ enum class TypeID {
    CUDALong,
    CUDAShort,
    CUDAHalf,
+  SparseCUDABool,
    SparseCUDAByte,
    SparseCUDAChar,
    SparseCUDADouble,
diff --git a/aten/src/ATen/gen.py b/aten/src/ATen/gen.py

index 9f5fad1..e153041 100644 (file)
--- a/aten/src/ATen/gen.py
+++ b/aten/src/ATen/gen.py
@@ -178,6 +178,7 @@ extension_backends = ['MSNPU', 'XLA']
  
  # scalar_name, c_type, accreal, th_scalar_type, is_floating_type
  scalar_types = [
+    ('Bool', 'uint8_t', 'BoolAccrealNotDefined', 'uint8_t', False),
      ('Byte', 'uint8_t', 'Long', 'uint8_t', False),
      ('Char', 'int8_t', 'Long', 'int8_t', False),
      ('Double', 'double', 'Double', 'double', True),
diff --git a/aten/src/TH/CMakeLists.txt b/aten/src/TH/CMakeLists.txt

index 463792b..b4d72ac 100644 (file)
--- a/aten/src/TH/CMakeLists.txt
+++ b/aten/src/TH/CMakeLists.txt
@@ -64,6 +64,7 @@ INSTALL(FILES
    THFilePrivate.h
    ${CMAKE_CURRENT_BINARY_DIR}/THGeneral.h
    THGenerateAllTypes.h
+  THGenerateBoolType.h
    THGenerateDoubleType.h
    THGenerateFloatType.h
    THGenerateHalfType.h
diff --git a/aten/src/TH/THFile.h b/aten/src/TH/THFile.h

index bb0f19e..144cec4 100644 (file)
--- a/aten/src/TH/THFile.h
+++ b/aten/src/TH/THFile.h
@@ -46,6 +46,7 @@ TH_API size_t THFile_readInt(THFile *self, THIntStorage *storage);
  TH_API size_t THFile_readLong(THFile *self, THLongStorage *storage);
  TH_API size_t THFile_readFloat(THFile *self, THFloatStorage *storage);
  TH_API size_t THFile_readDouble(THFile *self, THDoubleStorage *storage);
+TH_API size_t THFile_readBool(THFile *self, THBoolStorage *storage);
  
  TH_API size_t THFile_writeByte(THFile *self, THByteStorage *storage);
  TH_API size_t THFile_writeChar(THFile *self, THCharStorage *storage);
@@ -54,6 +55,7 @@ TH_API size_t THFile_writeInt(THFile *self, THIntStorage *storage);
  TH_API size_t THFile_writeLong(THFile *self, THLongStorage *storage);
  TH_API size_t THFile_writeFloat(THFile *self, THFloatStorage *storage);
  TH_API size_t THFile_writeDouble(THFile *self, THDoubleStorage *storage);
+TH_API size_t THFile_writeBool(THFile *self, THBoolStorage *storage);
  
  /* raw */
  TH_API size_t THFile_readByteRaw(THFile *self, uint8_t *data, size_t n);
diff --git a/aten/src/TH/THGenerateBoolType.h b/aten/src/TH/THGenerateBoolType.h

new file mode 100644 (file)

index 0000000..e18bd60
--- /dev/null
+++ b/aten/src/TH/THGenerateBoolType.h
@@ -0,0 +1,22 @@
+#ifndef TH_GENERIC_FILE
+#error "You must define TH_GENERIC_FILE before including THGenerateBoolType.h"
+#endif
+
+// TODO: define accreal type once the correct value is known.
+#define scalar_t bool
+#define ureal bool
+#define Real Bool
+#define TH_CONVERT_ACCREAL_TO_REAL(_val) (scalar_t)(_val)
+#define TH_REAL_IS_BOOL
+#line 1 TH_GENERIC_FILE
+#include TH_GENERIC_FILE
+#undef scalar_t
+#undef ureal
+#undef Real
+#undef TH_REAL_IS_BOOL
+#undef TH_CONVERT_REAL_TO_ACCREAL
+#undef TH_CONVERT_ACCREAL_TO_REAL
+
+#ifndef THGenerateManyTypes
+#undef TH_GENERIC_FILE
+#endif
diff --git a/aten/src/TH/THStorageFunctions.cpp b/aten/src/TH/THStorageFunctions.cpp

index 5fac244..2d99613 100644 (file)
--- a/aten/src/TH/THStorageFunctions.cpp
+++ b/aten/src/TH/THStorageFunctions.cpp
@@ -9,12 +9,18 @@
  #include <TH/generic/THStorage.cpp>
  #include <TH/THGenerateHalfType.h>
  
+#include <TH/generic/THStorage.cpp>
+#include <TH/THGenerateBoolType.h>
+
  #include <TH/generic/THStorageCopy.cpp>
  #include <TH/THGenerateAllTypes.h>
  
  #include <TH/generic/THStorageCopy.cpp>
  #include <TH/THGenerateHalfType.h>
  
+#include <TH/generic/THStorageCopy.cpp>
+#include <TH/THGenerateBoolType.h>
+
  THStorage* THStorage_new(caffe2::TypeMeta data_type) {
    THStorage* storage = c10::make_intrusive<at::StorageImpl>(
        data_type,
diff --git a/aten/src/TH/THStorageFunctions.h b/aten/src/TH/THStorageFunctions.h

index 40ca8cb..4a2c324 100644 (file)
--- a/aten/src/TH/THStorageFunctions.h
+++ b/aten/src/TH/THStorageFunctions.h
@@ -11,11 +11,17 @@
  #include <TH/generic/THStorage.h>
  #include <TH/THGenerateHalfType.h>
  
+#include <TH/generic/THStorage.h>
+#include <TH/THGenerateBoolType.h>
+
  #include <TH/generic/THStorageCopy.h>
  #include <TH/THGenerateAllTypes.h>
  
  #include <TH/generic/THStorageCopy.h>
  #include <TH/THGenerateHalfType.h>
  
+#include <TH/generic/THStorageCopy.h>
+#include <TH/THGenerateBoolType.h>
+
  // This exists to have a data-type independent way of freeing (necessary for THPPointer).
  TH_API void THStorage_free(THStorage *storage);
diff --git a/aten/src/TH/THTensor.cpp b/aten/src/TH/THTensor.cpp

index 2a249e8..bef67f9 100644 (file)
--- a/aten/src/TH/THTensor.cpp
+++ b/aten/src/TH/THTensor.cpp
@@ -6,6 +6,9 @@
  #include <TH/generic/THTensor.cpp>
  #include <TH/THGenerateHalfType.h>
  
+#include <TH/generic/THTensor.cpp>
+#include <TH/THGenerateBoolType.h>
+
  #include <ATen/native/Resize.h>
  
  #include <numeric>
diff --git a/aten/src/TH/THTensor.h b/aten/src/TH/THTensor.h

index 9dd6162..18b14cb 100644 (file)
--- a/aten/src/TH/THTensor.h
+++ b/aten/src/TH/THTensor.h
@@ -13,6 +13,9 @@
  #include <TH/generic/THTensor.h>
  #include <TH/THGenerateHalfType.h>
  
+#include <TH/generic/THTensor.h>
+#include <TH/THGenerateBoolType.h>
+
  /* random numbers */
  #include <TH/THRandom.h>
  #include <TH/generic/THTensorRandom.h>
diff --git a/aten/src/TH/THTensor.hpp b/aten/src/TH/THTensor.hpp

index 5e255a1..2a6a55d 100644 (file)
--- a/aten/src/TH/THTensor.hpp
+++ b/aten/src/TH/THTensor.hpp
@@ -127,3 +127,6 @@ TH_CPP_API c10::optional<std::vector<int64_t>> THTensor_compute_stride(
  
  #include <TH/generic/THTensor.hpp>
  #include <TH/THGenerateHalfType.h>
+
+#include <TH/generic/THTensor.hpp>
+#include <TH/THGenerateBoolType.h>
diff --git a/aten/src/TH/generic/THStorage.h b/aten/src/TH/generic/THStorage.h

index bb33bc8..2e432c1 100644 (file)
--- a/aten/src/TH/generic/THStorage.h
+++ b/aten/src/TH/generic/THStorage.h
@@ -33,6 +33,7 @@
  #define THShortStorage THStorage
  #define THIntStorage THStorage
  #define THLongStorage THStorage
+#define THBoolStorage THStorage
  
  TH_API scalar_t* THStorage_(data)(const THStorage*);
  TH_API ptrdiff_t THStorage_(size)(const THStorage*);
diff --git a/aten/src/TH/generic/THStorageCopy.cpp b/aten/src/TH/generic/THStorageCopy.cpp

index cdf8403..0ce5035 100644 (file)
--- a/aten/src/TH/generic/THStorageCopy.cpp
+++ b/aten/src/TH/generic/THStorageCopy.cpp
@@ -37,5 +37,6 @@ IMPLEMENT_THStorage_COPY(Long)
  IMPLEMENT_THStorage_COPY(Float)
  IMPLEMENT_THStorage_COPY(Double)
  IMPLEMENT_THStorage_COPY(Half)
+IMPLEMENT_THStorage_COPY(Bool)
  
  #endif
diff --git a/aten/src/TH/generic/THStorageCopy.h b/aten/src/TH/generic/THStorageCopy.h

index 8d86a23..0301fc6 100644 (file)
--- a/aten/src/TH/generic/THStorageCopy.h
+++ b/aten/src/TH/generic/THStorageCopy.h
@@ -14,5 +14,6 @@ TH_API void THStorage_(copyLong)(THStorage *storage, struct THLongStorage *src);
  TH_API void THStorage_(copyFloat)(THStorage *storage, struct THFloatStorage *src);
  TH_API void THStorage_(copyDouble)(THStorage *storage, struct THDoubleStorage *src);
  TH_API void THStorage_(copyHalf)(THStorage *storage, struct THHalfStorage *src);
+TH_API void THStorage_(copyBool)(THStorage *storage, struct THBoolStorage *src);
  
  #endif
diff --git a/aten/src/TH/generic/THTensor.h b/aten/src/TH/generic/THTensor.h

index 8d0c318..854757b 100644 (file)
--- a/aten/src/TH/generic/THTensor.h
+++ b/aten/src/TH/generic/THTensor.h
@@ -18,6 +18,7 @@
  #define THShortTensor THTensor
  #define THIntTensor THTensor
  #define THLongTensor THTensor
+#define THBoolTensor THTensor
  
  /**** access methods ****/
  TH_API THStorage* THTensor_(storage)(const THTensor *self);
diff --git a/aten/src/THC/CMakeLists.txt b/aten/src/THC/CMakeLists.txt

index fddfe7d..16fb799 100644 (file)
--- a/aten/src/THC/CMakeLists.txt
+++ b/aten/src/THC/CMakeLists.txt
@@ -78,6 +78,7 @@ INSTALL(FILES
            THCDeviceTensorUtils.cuh
            THCDeviceTensorUtils-inl.cuh
            THCGenerateAllTypes.h
+          THCGenerateBoolType.h
            THCGenerateByteType.h
            THCGenerateCharType.h
            THCGenerateShortType.h
diff --git a/aten/src/THC/THCGenerateBoolType.h b/aten/src/THC/THCGenerateBoolType.h

new file mode 100644 (file)

index 0000000..b010649
--- /dev/null
+++ b/aten/src/THC/THCGenerateBoolType.h
@@ -0,0 +1,21 @@
+#ifndef THC_GENERIC_FILE
+#error "You must define THC_GENERIC_FILE before including THCGenerateBoolType.h"
+#endif
+
+// TODO: define accreal type once the correct value is known.
+#define scalar_t bool
+#define ureal bool
+#define Real Bool
+#define CReal CudaBool
+#define THC_REAL_IS_BOOL
+#line 1 THC_GENERIC_FILE
+#include THC_GENERIC_FILE
+#undef scalar_t
+#undef ureal
+#undef Real
+#undef CReal
+#undef THC_REAL_IS_BOOL
+
+#ifndef THCGenerateBoolType
+#undef THC_GENERIC_FILE
+#endif
diff --git a/aten/src/THC/THCStorage.cpp b/aten/src/THC/THCStorage.cpp

index 6f93824..af71179 100644 (file)
--- a/aten/src/THC/THCStorage.cpp
+++ b/aten/src/THC/THCStorage.cpp
@@ -8,6 +8,9 @@
  #include <THC/generic/THCStorage.cpp>
  #include <THC/THCGenerateAllTypes.h>
  
+#include <THC/generic/THCStorage.cpp>
+#include <THC/THCGenerateBoolType.h>
+
  #include <c10/util/intrusive_ptr.h>
  
  void THCStorage_resize(THCState *state, THCStorage *self, ptrdiff_t size)
diff --git a/aten/src/THC/THCStorage.cu b/aten/src/THC/THCStorage.cu

index 7c0fca2..01d5462 100644 (file)
--- a/aten/src/THC/THCStorage.cu
+++ b/aten/src/THC/THCStorage.cu
@@ -11,3 +11,6 @@
  
  #include <THC/generic/THCStorage.cu>
  #include <THC/THCGenerateAllTypes.h>
+
+#include <THC/generic/THCStorage.cu>
+#include <THC/THCGenerateBoolType.h>
diff --git a/aten/src/THC/THCStorage.h b/aten/src/THC/THCStorage.h

index 0a1515e..19216ed 100644 (file)
--- a/aten/src/THC/THCStorage.h
+++ b/aten/src/THC/THCStorage.h
@@ -9,4 +9,7 @@
  #include <THC/generic/THCStorage.h>
  #include <THC/THCGenerateAllTypes.h>
  
+#include <THC/generic/THCStorage.h>
+#include <THC/THCGenerateBoolType.h>
+
  #endif
diff --git a/aten/src/THC/THCStorageCopy.cpp b/aten/src/THC/THCStorageCopy.cpp

index c25ea12..2c15088 100644 (file)
--- a/aten/src/THC/THCStorageCopy.cpp
+++ b/aten/src/THC/THCStorageCopy.cpp
@@ -5,3 +5,6 @@
  
  #include <THC/generic/THCStorageCopy.cpp>
  #include <THC/THCGenerateAllTypes.h>
+
+#include <THC/generic/THCStorageCopy.cpp>
+#include <THC/THCGenerateBoolType.h>
diff --git a/aten/src/THC/THCStorageCopy.cu b/aten/src/THC/THCStorageCopy.cu

index 2a695cf..9252e72 100644 (file)
--- a/aten/src/THC/THCStorageCopy.cu
+++ b/aten/src/THC/THCStorageCopy.cu
@@ -8,3 +8,6 @@
  
  #include <THC/generic/THCStorageCopy.cu>
  #include <THC/THCGenerateAllTypes.h>
+
+#include <THC/generic/THCStorageCopy.cu>
+#include <THC/THCGenerateBoolType.h>
diff --git a/aten/src/THC/THCStorageCopy.h b/aten/src/THC/THCStorageCopy.h

index b153a92..db97194 100644 (file)
--- a/aten/src/THC/THCStorageCopy.h
+++ b/aten/src/THC/THCStorageCopy.h
@@ -8,4 +8,7 @@
  #include <THC/generic/THCStorageCopy.h>
  #include <THC/THCGenerateAllTypes.h>
  
+#include <THC/generic/THCStorageCopy.h>
+#include <THC/THCGenerateBoolType.h>
+
  #endif
diff --git a/aten/src/THC/THCTensor.cpp b/aten/src/THC/THCTensor.cpp

index 47c30f2..8065d60 100644 (file)
--- a/aten/src/THC/THCTensor.cpp
+++ b/aten/src/THC/THCTensor.cpp
@@ -7,6 +7,9 @@
  #include <THC/generic/THCTensor.cpp>
  #include <THC/THCGenerateAllTypes.h>
  
+#include <THC/generic/THCTensor.cpp>
+#include <THC/THCGenerateBoolType.h>
+
  #include <THC/THCTensorInfo.cuh>
  
  #include <ATen/native/cuda/Resize.cuh>
@@ -61,6 +64,8 @@ THCTensor *THCTensor_new(THCState *state, caffe2::TypeMeta type_meta) {
        return THCudaTensor_new(state);
      case at::ScalarType::Double:
        return THCudaDoubleTensor_new(state);
+    case at::ScalarType::Bool:
+      return THCudaBoolTensor_new(state);
      default:
        AT_ERROR("unexpected ScalarType: ", toString(scalar_type));
    }
diff --git a/aten/src/THC/THCTensor.cu b/aten/src/THC/THCTensor.cu

index e8f253d..cc25d14 100644 (file)
--- a/aten/src/THC/THCTensor.cu
+++ b/aten/src/THC/THCTensor.cu
@@ -3,3 +3,6 @@
  
  #include <THC/generic/THCTensor.cu>
  #include <THC/THCGenerateAllTypes.h>
+
+#include <THC/generic/THCTensor.cu>
+#include <THC/THCGenerateBoolType.h>
diff --git a/aten/src/THC/THCTensor.h b/aten/src/THC/THCTensor.h

index c113c35..9670eb3 100644 (file)
--- a/aten/src/THC/THCTensor.h
+++ b/aten/src/THC/THCTensor.h
@@ -17,4 +17,6 @@ typedef struct THC_CLASS THCDescBuff
  #include <THC/generic/THCTensor.h>
  #include <THC/THCGenerateAllTypes.h>
  
+#include <THC/generic/THCTensor.h>
+#include <THC/THCGenerateBoolType.h>
  #endif
diff --git a/aten/src/THC/THCTensor.hpp b/aten/src/THC/THCTensor.hpp

index eaa3295..3162506 100644 (file)
--- a/aten/src/THC/THCTensor.hpp
+++ b/aten/src/THC/THCTensor.hpp
@@ -56,3 +56,6 @@ THC_API bool THCTensor_maybeOverlappingIndices(THCState* state, const THCTensor*
  
  #include <THC/generic/THCTensor.hpp>
  #include <THC/THCGenerateAllTypes.h>
+
+#include <THC/generic/THCTensor.hpp>
+#include <THC/THCGenerateBoolType.h>
diff --git a/aten/src/THC/THCTensorCopy.cu b/aten/src/THC/THCTensorCopy.cu

index 517d6fa..571d0e1 100644 (file)
--- a/aten/src/THC/THCTensorCopy.cu
+++ b/aten/src/THC/THCTensorCopy.cu
@@ -5,16 +5,26 @@
  #include <type_traits>
  
  // Copy operator for the pointwise apply kernel
-template <typename TypeDst, typename TypeSrc>
+template <typename T>
  struct CopyOp {
-  __device__ __forceinline__ void operator()(TypeDst* dst, TypeSrc* src) {
+  __device__ __forceinline__ void operator()(T* dst, T* src) {
  #if __CUDA_ARCH__ >= 350
-    *dst = ScalarConvert<TypeSrc, TypeDst>::to(__ldg(src));
+    *dst = ScalarConvert<T, T>::to(__ldg(src));
  #else
-    *dst = ScalarConvert<TypeSrc, TypeDst>::to(*src);
+    *dst = ScalarConvert<T, T>::to(*src);
  #endif
    }
  };
  
+template <>
+struct CopyOp <bool> {
+  __device__ __forceinline__ void operator()(bool* dst, bool* src) {
+      *dst = ScalarConvert<bool, bool>::to(*src);
+  }
+};
+
  #include <THC/generic/THCTensorCopy.cu>
  #include <THC/THCGenerateAllTypes.h>
+
+#include <THC/generic/THCTensorCopy.cu>
+#include <THC/THCGenerateBoolType.h>
diff --git a/aten/src/THC/THCTensorCopy.h b/aten/src/THC/THCTensorCopy.h

index 55b7c51..ec8ede7 100644 (file)
--- a/aten/src/THC/THCTensorCopy.h
+++ b/aten/src/THC/THCTensorCopy.h
@@ -9,4 +9,7 @@
  #include <THC/generic/THCTensorCopy.h>
  #include <THC/THCGenerateAllTypes.h>
  
+#include <THC/generic/THCTensorCopy.h>
+#include <THC/THCGenerateBoolType.h>
+
  #endif
diff --git a/aten/src/THC/generic/THCStorage.h b/aten/src/THC/generic/THCStorage.h

index 7efb5fe..5fdf41d 100644 (file)
--- a/aten/src/THC/generic/THCStorage.h
+++ b/aten/src/THC/generic/THCStorage.h
@@ -14,6 +14,7 @@
  #define THCudaShortStorage  THCStorage
  #define THCudaIntStorage    THCStorage
  #define THCudaLongStorage   THCStorage
+#define THCudaBoolStorage   THCStorage
  
  THC_API scalar_t* THCStorage_(data)(THCState *state, const THCStorage*);
  THC_API ptrdiff_t THCStorage_(size)(THCState *state, const THCStorage*);
diff --git a/aten/src/THC/generic/THCStorageCopy.cpp b/aten/src/THC/generic/THCStorageCopy.cpp

index cf68421..c132def 100644 (file)
--- a/aten/src/THC/generic/THCStorageCopy.cpp
+++ b/aten/src/THC/generic/THCStorageCopy.cpp
@@ -33,6 +33,7 @@ TH_CUDA_STORAGE_IMPLEMENT_COPY(Long)
  TH_CUDA_STORAGE_IMPLEMENT_COPY(Float)
  TH_CUDA_STORAGE_IMPLEMENT_COPY(Half)
  TH_CUDA_STORAGE_IMPLEMENT_COPY(Double)
+TH_CUDA_STORAGE_IMPLEMENT_COPY(Bool)
  
  void THStorage_(copyCuda)(THCState *state, THStorage *self, struct THCStorage *src)
  {
@@ -65,6 +66,7 @@ TH_CUDA_STORAGE_IMPLEMENT_COPYTO(Long)
  TH_CUDA_STORAGE_IMPLEMENT_COPYTO(Float)
  TH_CUDA_STORAGE_IMPLEMENT_COPYTO(Half)
  TH_CUDA_STORAGE_IMPLEMENT_COPYTO(Double)
+TH_CUDA_STORAGE_IMPLEMENT_COPYTO(Bool)
  
  #undef TH_CUDA_STORAGE_IMPLEMENT_COPY
  #undef TH_CUDA_STORAGE_IMPLEMENT_COPYTO
diff --git a/aten/src/THC/generic/THCStorageCopy.cu b/aten/src/THC/generic/THCStorageCopy.cu

index 01a1a6d..d372563 100644 (file)
--- a/aten/src/THC/generic/THCStorageCopy.cu
+++ b/aten/src/THC/generic/THCStorageCopy.cu
@@ -28,6 +28,7 @@ THC_CUDA_STORAGE_IMPLEMENT_COPY(Long,Long)
  THC_CUDA_STORAGE_IMPLEMENT_COPY(Float,)  // i.e. float
  THC_CUDA_STORAGE_IMPLEMENT_COPY(Double,Double)
  THC_CUDA_STORAGE_IMPLEMENT_COPY(Half,Half)
+THC_CUDA_STORAGE_IMPLEMENT_COPY(Bool,Bool)
  
  #undef THC_CUDA_STORAGE_IMPLEMENT_COPY
  
diff --git a/aten/src/THC/generic/THCStorageCopy.h b/aten/src/THC/generic/THCStorageCopy.h

index dc8f4c9..2375e18 100644 (file)
--- a/aten/src/THC/generic/THCStorageCopy.h
+++ b/aten/src/THC/generic/THCStorageCopy.h
@@ -14,6 +14,7 @@ THC_API void THCStorage_(copyLong)(THCState *state, THCStorage *storage, struct
  THC_API void THCStorage_(copyFloat)(THCState *state, THCStorage *storage, struct THFloatStorage *src);
  THC_API void THCStorage_(copyDouble)(THCState *state, THCStorage *storage, struct THDoubleStorage *src);
  THC_API void THCStorage_(copyHalf)(THCState *state, THCStorage *storage, struct THHalfStorage *src);
+THC_API void THCStorage_(copyBool)(THCState *state, THCStorage *storage, struct THBoolStorage *src);
  
  THC_API void THCStorage_(copyCudaByte)(THCState *state, THCStorage *storage, struct THCudaByteStorage *src);
  THC_API void THCStorage_(copyCudaChar)(THCState *state, THCStorage *storage, struct THCudaCharStorage *src);
@@ -23,6 +24,7 @@ THC_API void THCStorage_(copyCudaLong)(THCState *state, THCStorage *storage, str
  THC_API void THCStorage_(copyCudaFloat)(THCState *state, THCStorage *storage, struct THCudaStorage *src);
  THC_API void THCStorage_(copyCudaDouble)(THCState *state, THCStorage *storage, struct THCudaDoubleStorage *src);
  THC_API void THCStorage_(copyCudaHalf)(THCState *state, THCStorage *storage, struct THCudaHalfStorage *src);
+THC_API void THCStorage_(copyCudaBool)(THCState *state, THCStorage *storage, struct THCudaBoolStorage *src);
  
  THC_API void TH_CONCAT_2(THByteStorage_copyCuda  , Real)(THCState *state, THByteStorage *self, struct THCStorage *src);
  THC_API void TH_CONCAT_2(THCharStorage_copyCuda  , Real)(THCState *state, THCharStorage *self, struct THCStorage *src);
@@ -32,6 +34,7 @@ THC_API void TH_CONCAT_2(THLongStorage_copyCuda  , Real)(THCState *state, THLong
  THC_API void TH_CONCAT_2(THFloatStorage_copyCuda , Real)(THCState *state, THFloatStorage *self, struct THCStorage *src);
  THC_API void TH_CONCAT_2(THDoubleStorage_copyCuda, Real)(THCState *state, THDoubleStorage *self, struct THCStorage *src);
  THC_API void TH_CONCAT_2(THHalfStorage_copyCuda, Real)(THCState *state, THHalfStorage *self, struct THCStorage *src);
+THC_API void TH_CONCAT_2(THBoolStorage_copyCuda, Real)(THCState *state, THBoolStorage *self, struct THCStorage *src);
  
  THC_API void THStorage_(copyCuda)(THCState *state, THStorage *self, THCStorage *src);
  THC_API void THCStorage_(copyCuda)(THCState *state, THCStorage *self, THCStorage *src);
diff --git a/aten/src/THC/generic/THCTensor.h b/aten/src/THC/generic/THCTensor.h

index 646cffa..76d1dd9 100644 (file)
--- a/aten/src/THC/generic/THCTensor.h
+++ b/aten/src/THC/generic/THCTensor.h
@@ -14,6 +14,7 @@
  #define THCudaShortTensor THCTensor
  #define THCudaIntTensor THCTensor
  #define THCudaLongTensor THCTensor
+#define THCudaBoolTensor THCTensor
  
  /**** access methods ****/
  THC_API THCStorage* THCTensor_(storage)(THCState *state, const THCTensor *self);
diff --git a/aten/src/THC/generic/THCTensorCopy.cu b/aten/src/THC/generic/THCTensorCopy.cu

index c972b0d..3e837e4 100644 (file)
--- a/aten/src/THC/generic/THCTensorCopy.cu
+++ b/aten/src/THC/generic/THCTensorCopy.cu
@@ -52,7 +52,7 @@ void THCTensor_copyIgnoringOverlaps<scalar_t>(THCState* state, THCTensor* dst, T
    // FIXME: really, overlapping writes should be illegal/an error in Torch
    THC_pointwiseApply2<scalar_t, scalar_t>(
      state, dst, src,
-    CopyOp<scalar_t, scalar_t>(),
+    CopyOp<scalar_t>(),
      ReadOnly, /* ignore overwrites */
      ReadOnly);
  }
diff --git a/c10/core/ScalarType.h b/c10/core/ScalarType.h

index 2b6aba4..e959e2e 100644 (file)
--- a/c10/core/ScalarType.h
+++ b/c10/core/ScalarType.h
@@ -24,7 +24,8 @@ _(float,Float,d)   /* 6 */ \
  _(double,Double,d) /* 7 */ \
  _(at::ComplexHalf,ComplexHalf,z)        /* 8 */ \
  _(std::complex<float>,ComplexFloat,z)   /* 9 */ \
-_(std::complex<double>,ComplexDouble,z) /* 10 */
+_(std::complex<double>,ComplexDouble,z) /* 10 */ \
+_(bool,Bool,i) /* 11 */
  
  // If you want to support ComplexHalf for real, replace occurrences
  // of this macro with AT_FORALL_SCALAR_TYPES_WITH_COMPLEX.  But
@@ -185,6 +186,7 @@ static inline ScalarType promoteTypes(ScalarType a, ScalarType b) {
    constexpr auto f2 = ScalarType::Half;
    constexpr auto f4 = ScalarType::Float;
    constexpr auto f8 = ScalarType::Double;
+  constexpr auto b1 = ScalarType::Bool;
    constexpr auto ud = ScalarType::Undefined;
    if (a == ud || b == ud) {
      return ScalarType::Undefined;
@@ -195,15 +197,16 @@ static inline ScalarType promoteTypes(ScalarType a, ScalarType b) {
    static constexpr ScalarType _promoteTypesLookup
        [static_cast<int>(ScalarType::NumOptions)]
        [static_cast<int>(ScalarType::NumOptions)] = {
-            /* u1  i1  i2  i4  i8  f2  f4  f8 */
-    /* u1 */ { u1, i2, i2, i4, i8, f2, f4, f8 },
-    /* i1 */ { i2, i1, i2, i4, i8, f2, f4, f8 },
-    /* i2 */ { i2, i2, i2, i4, i8, f2, f4, f8 },
-    /* i4 */ { i4, i4, i4, i4, i8, f2, f4, f8 },
-    /* i8 */ { i8, i8, i8, i8, i8, f2, f4, f8 },
-    /* f2 */ { f2, f2, f2, f2, f2, f2, f4, f8 },
-    /* f4 */ { f4, f4, f4, f4, f4, f4, f4, f8 },
-    /* f8 */ { f8, f8, f8, f8, f8, f8, f8, f8 },
+            /* u1  i1  i2  i4  i8  f2  f4  f8  b1 */
+    /* u1 */ { u1, i2, i2, i4, i8, f2, f4, f8, u1 },
+    /* i1 */ { i2, i1, i2, i4, i8, f2, f4, f8, i1 },
+    /* i2 */ { i2, i2, i2, i4, i8, f2, f4, f8, i2 },
+    /* i4 */ { i4, i4, i4, i4, i8, f2, f4, f8, i4 },
+    /* i8 */ { i8, i8, i8, i8, i8, f2, f4, f8, i8 },
+    /* f2 */ { f2, f2, f2, f2, f2, f2, f4, f8, f2 },
+    /* f4 */ { f4, f4, f4, f4, f4, f4, f4, f8, f4 },
+    /* f8 */ { f8, f8, f8, f8, f8, f8, f8, f8, f8 },
+    /* b1 */ { u1, i1, i2, i4, i8, f2, f4, f8, b1 },
    };
    return _promoteTypesLookup[static_cast<int>(a)][static_cast<int>(b)];
  }
diff --git a/test/test_torch.py b/test/test_torch.py

index a5aadf8..28494ac 100644 (file)
--- a/test/test_torch.py
+++ b/test/test_torch.py
@@ -7800,6 +7800,7 @@ class _TestTorchMixin(object):
          long = torch.LongStorage().element_size()
          float = torch.FloatStorage().element_size()
          double = torch.DoubleStorage().element_size()
+        bool = torch.BoolStorage().element_size()
  
          self.assertEqual(byte, torch.ByteTensor().element_size())
          self.assertEqual(char, torch.CharTensor().element_size())
@@ -7816,10 +7817,12 @@ class _TestTorchMixin(object):
          self.assertGreater(long, 0)
          self.assertGreater(float, 0)
          self.assertGreater(double, 0)
+        self.assertGreater(bool, 0)
  
          # These tests are portable, not necessarily strict for your system.
          self.assertEqual(byte, 1)
          self.assertEqual(char, 1)
+        self.assertEqual(bool, 1)
          self.assertGreaterEqual(short, 2)
          self.assertGreaterEqual(int, 2)
          self.assertGreaterEqual(int, short)
@@ -8887,6 +8890,75 @@ class _TestTorchMixin(object):
          self.assertEqual(floats.size(), 1)
          self.assertEqual(floats[0], 2.25)
  
+        f = bytearray([0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x10, 0x40])
+        bools = torch.BoolStorage.from_buffer(f, 'big')
+        self.assertEqual(bools.size(), 8)
+        self.assertEqual(bools.tolist(), [False, True, True, True, True, True, True, True])
+        self.assertEqual(bools.type(), 'torch.BoolStorage')
+
+        f = bytearray(b'\x80\x02\x8a\nl\xfc\x9cF\xf9 j\xa8P\x19.\x80\x02M\xe9')
+        bools = torch.BoolStorage.from_buffer(f, 'big')
+        self.assertEqual(bools.size(), 19)
+
+        f = bytearray(b'\0x4A')
+        bools = torch.BoolStorage.from_buffer(f, 'big')
+        self.assertEqual(bools.size(), 4)
+        self.assertEqual(bools.tolist(), [False, True, True, True])
+
+    def test_storage_casts(self):
+        storage = torch.IntStorage([-1, 0, 1, 2, 3, 4])
+        self.assertEqual(storage.size(), 6)
+        self.assertEqual(storage.tolist(), [-1, 0, 1, 2, 3, 4])
+        self.assertEqual(storage.type(), 'torch.IntStorage')
+
+        floatStorage = storage.float()
+        self.assertEqual(floatStorage.size(), 6)
+        self.assertEqual(floatStorage.tolist(), [-1, 0, 1, 2, 3, 4])
+        self.assertEqual(floatStorage.type(), 'torch.FloatStorage')
+        self.assertEqual(floatStorage.int().tolist(), [-1, 0, 1, 2, 3, 4])
+
+        halfStorage = storage.half()
+        self.assertEqual(halfStorage.size(), 6)
+        self.assertEqual(halfStorage.tolist(), [-1, 0, 1, 2, 3, 4])
+        self.assertEqual(halfStorage.type(), 'torch.HalfStorage')
+        self.assertEqual(halfStorage.int().tolist(), [-1, 0, 1, 2, 3, 4])
+
+        longStorage = storage.long()
+        self.assertEqual(longStorage.size(), 6)
+        self.assertEqual(longStorage.tolist(), [-1, 0, 1, 2, 3, 4])
+        self.assertEqual(longStorage.type(), 'torch.LongStorage')
+        self.assertEqual(longStorage.int().tolist(), [-1, 0, 1, 2, 3, 4])
+
+        shortStorage = storage.short()
+        self.assertEqual(shortStorage.size(), 6)
+        self.assertEqual(shortStorage.tolist(), [-1, 0, 1, 2, 3, 4])
+        self.assertEqual(shortStorage.type(), 'torch.ShortStorage')
+        self.assertEqual(shortStorage.int().tolist(), [-1, 0, 1, 2, 3, 4])
+
+        doubleStorage = storage.double()
+        self.assertEqual(doubleStorage.size(), 6)
+        self.assertEqual(doubleStorage.tolist(), [-1.0, 0.0, 1.0, 2.0, 3.0, 4.0])
+        self.assertEqual(doubleStorage.type(), 'torch.DoubleStorage')
+        self.assertEqual(doubleStorage.int().tolist(), [-1, 0, 1, 2, 3, 4])
+
+        charStorage = storage.char()
+        self.assertEqual(charStorage.size(), 6)
+        self.assertEqual(charStorage.tolist(), [-1.0, 0.0, 1.0, 2.0, 3.0, 4.0])
+        self.assertEqual(charStorage.type(), 'torch.CharStorage')
+        self.assertEqual(charStorage.int().tolist(), [-1, 0, 1, 2, 3, 4])
+
+        byteStorage = storage.byte()
+        self.assertEqual(byteStorage.size(), 6)
+        self.assertEqual(byteStorage.tolist(), [255, 0, 1, 2, 3, 4])
+        self.assertEqual(byteStorage.type(), 'torch.ByteStorage')
+        self.assertEqual(byteStorage.int().tolist(), [255, 0, 1, 2, 3, 4])
+
+        boolStorage = storage.bool()
+        self.assertEqual(boolStorage.size(), 6)
+        self.assertEqual(boolStorage.tolist(), [True, False, True, True, True, True])
+        self.assertEqual(boolStorage.type(), 'torch.BoolStorage')
+        self.assertEqual(boolStorage.int().tolist(), [1, 0, 1, 1, 1, 1])
+
      @unittest.skipIf(IS_WINDOWS, "TODO: need to fix this test case for Windows")
      def test_from_file(self):
          size = 10000
@@ -8928,7 +9000,10 @@ class _TestTorchMixin(object):
          for t in torch._storage_classes:
              if t.is_cuda and not torch.cuda.is_available():
                  continue
-            obj = t(100).fill_(1)
+            if t == torch.BoolStorage or t == torch.cuda.BoolStorage:
+                obj = t(100).fill_(True)
+            else:
+                obj = t(100).fill_(1)
              obj.__repr__()
              str(obj)
  
diff --git a/torch/__init__.py b/torch/__init__.py

index 321670b..3c456dd 100644 (file)
--- a/torch/__init__.py
+++ b/torch/__init__.py
@@ -224,9 +224,12 @@ class ByteStorage(_C.ByteStorageBase, _StorageBase):
      pass
  
  
+class BoolStorage(_C.BoolStorageBase, _StorageBase):
+    pass
+
  _storage_classes = {
      DoubleStorage, FloatStorage, LongStorage, IntStorage, ShortStorage,
-    CharStorage, ByteStorage, HalfStorage
+    CharStorage, ByteStorage, HalfStorage, BoolStorage
  }
  
  # The _tensor_classes set is initialized by the call to _C._initialize_tensor_type_bindings()
@@ -275,6 +278,7 @@ del IntStorageBase
  del ShortStorageBase
  del CharStorageBase
  del ByteStorageBase
+del BoolStorageBase
  
  ################################################################################
  # Import most common subpackages
diff --git a/torch/_storage_docs.py b/torch/_storage_docs.py

index bd82962..fd54032 100644 (file)
--- a/torch/_storage_docs.py
+++ b/torch/_storage_docs.py
@@ -12,6 +12,7 @@ storage_classes = [
      'ShortStorageBase',
      'CharStorageBase',
      'ByteStorageBase',
+    'BoolStorageBase',
  ]
  
  
diff --git a/torch/csrc/DynamicTypes.cpp b/torch/csrc/DynamicTypes.cpp

index 087f84d..ba217c9 100644 (file)
--- a/torch/csrc/DynamicTypes.cpp
+++ b/torch/csrc/DynamicTypes.cpp
@@ -33,6 +33,7 @@ const std::unordered_map<std::string, at::ScalarType> attype_names = {
    {"Short", at::kShort},
    {"Int", at::kInt},
    {"Long", at::kLong},
+  {"Bool", at::kBool},
  };
  
  std::unordered_map<at::Type*, PyTypeObject*> attype_to_py_storage_type;
diff --git a/torch/csrc/Module.cpp b/torch/csrc/Module.cpp

index cf193bb..0ddf9ac 100644 (file)
--- a/torch/csrc/Module.cpp
+++ b/torch/csrc/Module.cpp
@@ -112,6 +112,7 @@ static PyObject * THPModule_initExtension(PyObject *_unused, PyObject *shm_manag
    THPShortStorage_postInit(module);
    THPCharStorage_postInit(module);
    THPByteStorage_postInit(module);
+  THPBoolStorage_postInit(module);
    THPAutograd_initFunctions();
    Py_RETURN_NONE;
    END_HANDLE_TH_ERRORS
@@ -460,6 +461,7 @@ bool THCPIntStorage_init(PyObject *module);
  bool THCPShortStorage_init(PyObject *module);
  bool THCPCharStorage_init(PyObject *module);
  bool THCPByteStorage_init(PyObject *module);
+bool THCPBoolStorage_init(PyObject *module);
  
  void THCPStream_init(PyObject *module);
  void THCPEvent_init(PyObject *module);
@@ -490,6 +492,7 @@ bool THDPIntStorage_init(PyObject *module);
  bool THDPShortStorage_init(PyObject *module);
  bool THDPCharStorage_init(PyObject *module);
  bool THDPByteStorage_init(PyObject *module);
+bool THDPBoolStorage_init(PyObject *module);
  
  static std::vector<PyMethodDef> methods;
  
@@ -593,6 +596,7 @@ PyObject* initModule() {
    ASSERT_TRUE(THPShortStorage_init(module));
    ASSERT_TRUE(THPCharStorage_init(module));
    ASSERT_TRUE(THPByteStorage_init(module));
+  ASSERT_TRUE(THPBoolStorage_init(module));
  
  #ifdef USE_CUDA
    // This will only initialise base classes and attach them to library namespace
@@ -607,6 +611,7 @@ PyObject* initModule() {
    ASSERT_TRUE(THCPShortStorage_init(module));
    ASSERT_TRUE(THCPCharStorage_init(module));
    ASSERT_TRUE(THCPByteStorage_init(module));
+  ASSERT_TRUE(THCPBoolStorage_init(module));
  
    THCPStream_init(module);
    THCPEvent_init(module);
diff --git a/torch/csrc/Storage.cpp b/torch/csrc/Storage.cpp

index 88afa0b..1d3d4c5 100644 (file)
--- a/torch/csrc/Storage.cpp
+++ b/torch/csrc/Storage.cpp
@@ -23,6 +23,9 @@
  #include <torch/csrc/generic/Storage.cpp>
  #include <TH/THGenerateHalfType.h>
  
+#include <torch/csrc/generic/Storage.cpp>
+#include <TH/THGenerateBoolType.h>
+
  template<>
  void THPPointer<THStorage>::free() {
    if (ptr) {
diff --git a/torch/csrc/Storage.h b/torch/csrc/Storage.h

index a8f7849..efd841f 100644 (file)
--- a/torch/csrc/Storage.h
+++ b/torch/csrc/Storage.h
@@ -21,6 +21,8 @@
      PyObject_IsInstance(obj, THPCharStorageClass)
  #define THPByteStorage_Check(obj) \
      PyObject_IsInstance(obj, THPByteStorageClass)
+#define THPBoolStorage_Check(obj) \
+    PyObject_IsInstance(obj, THPBoolStorageClass)
  
  #define THPDoubleStorage_CData(obj)  (obj)->cdata
  #define THPFloatStorage_CData(obj)   (obj)->cdata
@@ -30,6 +32,7 @@
  #define THPShortStorage_CData(obj)   (obj)->cdata
  #define THPCharStorage_CData(obj)    (obj)->cdata
  #define THPByteStorage_CData(obj)    (obj)->cdata
+#define THPBoolStorage_CData(obj)    (obj)->cdata
  
  #ifdef _THP_CORE
  #define THPStorageType TH_CONCAT_3(THP,Real,StorageType)
@@ -42,4 +45,7 @@
  #include <torch/csrc/generic/Storage.h>
  #include <TH/THGenerateHalfType.h>
  
+#include <torch/csrc/generic/Storage.h>
+#include <TH/THGenerateBoolType.h>
+
  #endif
diff --git a/torch/csrc/byte_order.cpp b/torch/csrc/byte_order.cpp

index 01f671f..0356791 100644 (file)
--- a/torch/csrc/byte_order.cpp
+++ b/torch/csrc/byte_order.cpp
@@ -57,7 +57,7 @@ static inline void swapBytes64(void *ptr)
    uint64_t Byte5 = output & 0x0000FF0000000000;
    uint64_t Byte6 = output & 0x00FF000000000000;
    uint64_t Byte7 = output & 0xFF00000000000000;
-  output = (Byte0 << (7*8)) | (Byte1 << (5*8)) | (Byte2 << (3*8)) | (Byte3 << (1*8)) | 
+  output = (Byte0 << (7*8)) | (Byte1 << (5*8)) | (Byte2 << (3*8)) | (Byte3 << (1*8)) |
             (Byte7 >> (7*8)) | (Byte6 >> (5*8)) | (Byte5 >> (3*8)) | (Byte4 >> (1*8));
  #endif
    memcpy(ptr, &output, sizeof(uint64_t));
@@ -140,6 +140,13 @@ void THP_decodeHalfBuffer(THHalf* dst, const uint8_t* src, THPByteOrder order, s
    }
  }
  
+void THP_decodeBoolBuffer(bool* dst, const uint8_t* src, THPByteOrder order, size_t len)
+{
+  for (size_t i = 0; i < len; i++) {
+    dst[i] = (int)src[i] != 0 ? true : false;
+  }
+}
+
  void THP_decodeFloatBuffer(float* dst, const uint8_t* src, THPByteOrder order, size_t len)
  {
    for (size_t i = 0; i < len; i++) {
diff --git a/torch/csrc/byte_order.h b/torch/csrc/byte_order.h

index 0d0b80b..c9bb5a4 100644 (file)
--- a/torch/csrc/byte_order.h
+++ b/torch/csrc/byte_order.h
@@ -18,6 +18,7 @@ void THP_decodeInt64Buffer(int64_t* dst, const uint8_t* src, THPByteOrder order,
  void THP_decodeHalfBuffer(THHalf* dst, const uint8_t* src, THPByteOrder order, size_t len);
  void THP_decodeFloatBuffer(float* dst, const uint8_t* src, THPByteOrder order, size_t len);
  void THP_decodeDoubleBuffer(double* dst, const uint8_t* src, THPByteOrder order, size_t len);
+void THP_decodeBoolBuffer(bool* dst, const uint8_t* src, THPByteOrder order, size_t len);
  
  void THP_encodeInt16Buffer(uint8_t* dst, const int16_t* src, THPByteOrder order, size_t len);
  void THP_encodeInt32Buffer(uint8_t* dst, const int32_t* src, THPByteOrder order, size_t len);
diff --git a/torch/csrc/cuda/Module.cpp b/torch/csrc/cuda/Module.cpp

index 8d1571a..7571f11 100644 (file)
--- a/torch/csrc/cuda/Module.cpp
+++ b/torch/csrc/cuda/Module.cpp
@@ -375,6 +375,7 @@ static PyObject * THCPModule_initExtension(PyObject *self)
    THCPShortStorage_postInit(m);
    THCPCharStorage_postInit(m);
    THCPByteStorage_postInit(m);
+  THCPBoolStorage_postInit(m);
  
    bool has_magma = at::hasMAGMA();
    if (has_magma) {
diff --git a/torch/csrc/cuda/Storage.cpp b/torch/csrc/cuda/Storage.cpp

index 9ac5435..6a103a7 100644 (file)
--- a/torch/csrc/cuda/Storage.cpp
+++ b/torch/csrc/cuda/Storage.cpp
@@ -15,3 +15,6 @@
  
  #define THC_GENERIC_FILE "torch/csrc/generic/Storage.cpp"
  #include <THC/THCGenerateAllTypes.h>
+
+#define THC_GENERIC_FILE "torch/csrc/generic/Storage.cpp"
+#include <THC/THCGenerateBoolType.h>
diff --git a/torch/csrc/cuda/Storage.h b/torch/csrc/cuda/Storage.h

index f3af761..19e62f1 100644 (file)
--- a/torch/csrc/cuda/Storage.h
+++ b/torch/csrc/cuda/Storage.h
@@ -21,6 +21,8 @@
      PyObject_IsInstance(obj, THCPCharStorageClass)
  #define THCPByteStorage_Check(obj) \
      PyObject_IsInstance(obj, THCPByteStorageClass)
+#define THCPBoolStorage_Check(obj) \
+    PyObject_IsInstance(obj, THCPBoolStorageClass)
  
  #define THCPDoubleStorage_CData(obj)  (obj)->cdata
  #define THCPFloatStorage_CData(obj)   (obj)->cdata
@@ -29,6 +31,7 @@
  #define THCPShortStorage_CData(obj)   (obj)->cdata
  #define THCPCharStorage_CData(obj)    (obj)->cdata
  #define THCPByteStorage_CData(obj)    (obj)->cdata
+#define THCPBoolStorage_CData(obj)    (obj)->cdata
  
  #ifdef _THP_CORE
  #define THCPStorageType TH_CONCAT_3(THCP,Real,StorageType)
@@ -40,4 +43,7 @@
  #define THC_GENERIC_FILE "torch/csrc/generic/Storage.h"
  #include <THC/THCGenerateAllTypes.h>
  
+#define THC_GENERIC_FILE "torch/csrc/generic/Storage.h"
+#include <THC/THCGenerateBoolType.h>
+
  #endif
diff --git a/torch/csrc/cuda/serialization.cpp b/torch/csrc/cuda/serialization.cpp

index 0d1f86e..e83ea6e 100644 (file)
--- a/torch/csrc/cuda/serialization.cpp
+++ b/torch/csrc/cuda/serialization.cpp
@@ -10,3 +10,5 @@
  #define THC_GENERIC_FILE "torch/csrc/generic/serialization.cpp"
  #include <THC/THCGenerateAllTypes.h>
  
+#define THC_GENERIC_FILE "torch/csrc/generic/serialization.cpp"
+#include <THC/THCGenerateBoolType.h>
diff --git a/torch/csrc/cuda/serialization.h b/torch/csrc/cuda/serialization.h

index 0779ac9..3e3eb2d 100644 (file)
--- a/torch/csrc/cuda/serialization.h
+++ b/torch/csrc/cuda/serialization.h
@@ -6,4 +6,7 @@
  #define THC_GENERIC_FILE "torch/csrc/generic/serialization.h"
  #include <THC/THCGenerateAllTypes.h>
  
+#define THC_GENERIC_FILE "torch/csrc/generic/serialization.h"
+#include <THC/THCGenerateBoolType.h>
+
  #endif
diff --git a/torch/csrc/cuda/utils.cpp b/torch/csrc/cuda/utils.cpp

index bf3ec82..8e29803 100644 (file)
--- a/torch/csrc/cuda/utils.cpp
+++ b/torch/csrc/cuda/utils.cpp
@@ -8,6 +8,9 @@
  #define THC_GENERIC_FILE "torch/csrc/generic/utils.cpp"
  #include <THC/THCGenerateAllTypes.h>
  
+#define THC_GENERIC_FILE "torch/csrc/generic/utils.cpp"
+#include <THC/THCGenerateBoolType.h>
+
  #ifdef USE_CUDA
  // NB: It's a list of *optional* CUDAStream; when nullopt, that means to use
  // whatever the current stream of the device the input is associated with was.
diff --git a/torch/csrc/cuda/utils.h b/torch/csrc/cuda/utils.h

index 6dd50ed..209b453 100644 (file)
--- a/torch/csrc/cuda/utils.h
+++ b/torch/csrc/cuda/utils.h
@@ -16,4 +16,6 @@
  #define THC_GENERIC_FILE "torch/csrc/generic/utils.h"
  #include <THC/THCGenerateAllTypes.h>
  
+#define THC_GENERIC_FILE "torch/csrc/generic/utils.h"
+#include <THC/THCGenerateBoolType.h>
  #endif
diff --git a/torch/csrc/generic/Storage.cpp b/torch/csrc/generic/Storage.cpp

index e8fd9bb..bdd872e 100644 (file)
--- a/torch/csrc/generic/Storage.cpp
+++ b/torch/csrc/generic/Storage.cpp
@@ -299,6 +299,7 @@ void THPStorage_(initCopyMethods)()
    THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THPHalfStorageType, h, &THWStorage_(copyHalf));
    THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THPFloatStorageType, h, &THWStorage_(copyFloat));
    THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THPDoubleStorageType, h, &THWStorage_(copyDouble));
+  THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THPBoolStorageType, h, &THWStorage_(copyBool));
  #ifdef THC_GENERIC_FILE
    // copy from GPU types
    THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THCPByteStorageType, h, &THWStorage_(copyCudaByte));
@@ -309,6 +310,7 @@ void THPStorage_(initCopyMethods)()
    THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THCPFloatStorageType, h, &THWStorage_(copyCudaFloat));
    THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THCPDoubleStorageType, h, &THWStorage_(copyCudaDouble));
    THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THCPHalfStorageType, h, &THWStorage_(copyCudaHalf));
+  THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THCPBoolStorageType, h, &THWStorage_(copyCudaBool));
    // add CPU <- GPU copies to base type
    /// #define THPCpuStorage TH_CONCAT_3(THP, Real, Storage)
    #define THCpuStorage_(name) TH_CONCAT_4(TH, Real, Storage_, name)
@@ -322,6 +324,7 @@ void THPStorage_(initCopyMethods)()
    THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THCPFloatStorageType, b, &THCpuStorage_(copyCudaFloat));
    THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THCPDoubleStorageType, b, &THCpuStorage_(copyCudaDouble));
    THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THCPHalfStorageType, b, &THCpuStorage_(copyCudaHalf));
+  THPInsertStorageCopyFunction<THPStorage, THPStorage>(&THCPBoolStorageType, b, &THCpuStorage_(copyCudaBool));
    #undef THCpuStorage
    #undef THCpuStorage_
  #endif
diff --git a/torch/csrc/generic/StorageMethods.cpp b/torch/csrc/generic/StorageMethods.cpp

index fb9247e..f20bbaa 100644 (file)
--- a/torch/csrc/generic/StorageMethods.cpp
+++ b/torch/csrc/generic/StorageMethods.cpp
@@ -96,7 +96,7 @@ static PyObject * THPStorage_(fromBuffer)(PyObject *_unused, PyObject *args, PyO
    PyObject *obj = nullptr;
    const char* byte_order_str = nullptr;
    Py_ssize_t count = -1, offset = 0;
-  Py_buffer buffer;
+  Py_buffer buffer = {};
    static char *kwlist[] = {"buffer", "byte_order", "count", "offset", nullptr};
    const char* argtypes;
  #if defined(TH_REAL_IS_BYTE) || defined(TH_REAL_IS_CHAR)
@@ -160,6 +160,11 @@ static PyObject * THPStorage_(fromBuffer)(PyObject *_unused, PyObject *args, PyO
  
  #if defined(TH_REAL_IS_BYTE) || defined(TH_REAL_IS_CHAR)
    memcpy(THWStorage_(data)(storage), src + offset, count);
+#elif defined(TH_REAL_IS_BOOL)
+  // Because of ASAN checks, that are failing in the THStorage.cpp whenever
+  // we are trying to get a value which is not 0 or 1, we have to manually
+  // convert original values to boolean ones.
+  THP_decodeBoolBuffer(THWStorage_(data)(storage), src + offset, byte_order, count);
  #elif defined(TH_REAL_IS_SHORT)
    THP_decodeInt16Buffer(THWStorage_(data)(storage), src + offset, byte_order, count);
  #elif defined(TH_REAL_IS_INT)
diff --git a/torch/csrc/serialization.cpp b/torch/csrc/serialization.cpp

index 1b045df..7308df3 100644 (file)
--- a/torch/csrc/serialization.cpp
+++ b/torch/csrc/serialization.cpp
@@ -182,3 +182,6 @@ void doWrite(io fildes, void* raw_buf, size_t nbytes) {
  
  #include <torch/csrc/generic/serialization.cpp>
  #include <TH/THGenerateHalfType.h>
+
+#include <torch/csrc/generic/serialization.cpp>
+#include <TH/THGenerateBoolType.h>
diff --git a/torch/csrc/serialization.h b/torch/csrc/serialization.h

index 4602eb6..d9f0a8c 100644 (file)
--- a/torch/csrc/serialization.h
+++ b/torch/csrc/serialization.h
@@ -7,6 +7,9 @@
  #include <torch/csrc/generic/serialization.h>
  #include <TH/THGenerateHalfType.h>
  
+#include <torch/csrc/generic/serialization.h>
+#include <TH/THGenerateBoolType.h>
+
  template <class io>
  void doRead(io fildes, void* buf, size_t nbytes);
  
diff --git a/torch/csrc/utils.cpp b/torch/csrc/utils.cpp

index 05a7de5..78cd96f 100644 (file)
--- a/torch/csrc/utils.cpp
+++ b/torch/csrc/utils.cpp
@@ -17,6 +17,9 @@
  #include <torch/csrc/generic/utils.cpp>
  #include <TH/THGenerateHalfType.h>
  
+#include <torch/csrc/generic/utils.cpp>
+#include <TH/THGenerateBoolType.h>
+
  int THPUtils_getCallable(PyObject *arg, PyObject **result) {
    if (!PyCallable_Check(arg))
      return 0;
diff --git a/torch/csrc/utils.h b/torch/csrc/utils.h

index 7088517..0297b7d 100644 (file)
--- a/torch/csrc/utils.h
+++ b/torch/csrc/utils.h
@@ -58,10 +58,19 @@
      (throw std::runtime_error("Could not parse real"), 0))
  #endif
  
+#define THPUtils_unpackReal_BOOL(object)                                       \
+    (PyBool_Check(object) ? object :                                           \
+    (throw std::runtime_error("Could not parse real"), Py_False))
+
+#define THPUtils_checkReal_BOOL(object)                                        \
+    PyBool_Check(object)
+
  #define THPUtils_newReal_FLOAT(value) PyFloat_FromDouble(value)
  // TODO: handle int overflows for py2
  #define THPUtils_newReal_INT(value) PyInt_FromLong(value)
  
+#define THPUtils_newReal_BOOL(value) PyBool_FromLong(value)
+
  #define THPDoubleUtils_checkReal(object)      THPUtils_checkReal_FLOAT(object)
  #define THPDoubleUtils_unpackReal(object)     (double)THPUtils_unpackReal_FLOAT(object)
  #define THPDoubleUtils_newReal(value)         THPUtils_newReal_FLOAT(value)
@@ -73,6 +82,12 @@
  #define THPHalfUtils_newReal(value)           PyFloat_FromDouble(value)
  #define THPHalfUtils_newAccreal(value)        THPUtils_newReal_FLOAT(value)
  
+#define THPBoolUtils_checkReal(object)        THPUtils_checkReal_BOOL(object)
+#define THPBoolUtils_unpackReal(object)       THPUtils_unpackReal_BOOL(object)
+#define THPBoolUtils_newReal(value)           THPUtils_newReal_BOOL(value)
+#define THPBoolUtils_checkAccreal(object)     THPUtils_checkReal_BOOL(object)
+#define THPBoolUtils_unpackAccreal(object)    (int64_t)THPUtils_unpackReal_BOOL(object)
+#define THPBoolUtils_newAccreal(value)        THPUtils_newReal_BOOL(value)
  #define THPLongUtils_checkReal(object)        THPUtils_checkReal_INT(object)
  #define THPLongUtils_unpackReal(object)       (int64_t)THPUtils_unpackReal_INT(object)
  #define THPLongUtils_newReal(value)           THPUtils_newReal_INT(value)
@@ -123,6 +138,9 @@ struct THPUtils_typeTraits {};
  #include <torch/csrc/generic/utils.h>
  #include <TH/THGenerateHalfType.h>
  
+#include <torch/csrc/generic/utils.h>
+#include <TH/THGenerateBoolType.h>
+
  THLongStoragePtr THPUtils_unpackSize(PyObject *arg);
  bool THPUtils_tryUnpackLongs(PyObject *arg, THLongStoragePtr& result);
  std::vector<int64_t> THPUtils_unpackLongs(PyObject *arg);
diff --git a/torch/csrc/utils/tensor_dtypes.cpp b/torch/csrc/utils/tensor_dtypes.cpp

index a59f691..de199d8 100644 (file)
--- a/torch/csrc/utils/tensor_dtypes.cpp
+++ b/torch/csrc/utils/tensor_dtypes.cpp
@@ -36,6 +36,8 @@ static std::pair<std::string, std::string> getDtypeNames(at::ScalarType scalarTy
        return std::make_pair("complex64", "");
      case at::ScalarType::ComplexDouble:
        return std::make_pair("complex128", "");
+    case at::ScalarType::Bool:
+      return std::make_pair("bool", "");
      default:
        throw std::runtime_error("Unimplemented scalar type");
    }
diff --git a/torch/cuda/__init__.py b/torch/cuda/__init__.py

index 13db6f2..63bc75e 100644 (file)
--- a/torch/cuda/__init__.py
+++ b/torch/cuda/__init__.py
@@ -551,7 +551,7 @@ def _dummy_type(name):
  
  if not hasattr(torch._C, 'CudaDoubleStorageBase'):
      # Define dummy base classes
-    for t in ['Double', 'Float', 'Long', 'Int', 'Short', 'Char', 'Byte', 'Half']:
+    for t in ['Double', 'Float', 'Long', 'Int', 'Short', 'Char', 'Byte', 'Half', 'Bool']:
          storage_name = 'Cuda{0}StorageBase'.format(t)
          tensor_name = 'Cuda{0}TensorBase'.format(t)
  
@@ -613,6 +613,9 @@ class HalfStorage(_CudaBase, torch._C.CudaHalfStorageBase, _StorageBase):
      pass
  
  
+class BoolStorage(_CudaBase, torch._C.CudaBoolStorageBase, _StorageBase):
+    pass
+
  torch._storage_classes.add(DoubleStorage)
  torch._storage_classes.add(FloatStorage)
  torch._storage_classes.add(LongStorage)
@@ -621,6 +624,7 @@ torch._storage_classes.add(ShortStorage)
  torch._storage_classes.add(CharStorage)
  torch._storage_classes.add(ByteStorage)
  torch._storage_classes.add(HalfStorage)
+torch._storage_classes.add(BoolStorage)
  
  from . import sparse
  from . import profiler
diff --git a/torch/storage.py b/torch/storage.py

index 22f64a8..68caff8 100644 (file)
--- a/torch/storage.py
+++ b/torch/storage.py
@@ -83,6 +83,10 @@ class _StorageBase(object):
          """Casts this storage to byte type"""
          return self.type(type(self).__module__ + '.ByteStorage')
  
+    def bool(self):
+        """Casts this storage to bool type"""
+        return self.type(type(self).__module__ + '.BoolStorage')
+
      def pin_memory(self):
          """Copies the storage to pinned memory, if it's not already pinned."""
          if self.is_cuda:
author	Iurii Zdebskyi <iuriiz@fb.com>
	Tue, 19 Feb 2019 16:17:49 +0000 (08:17 -0800)
committer	Facebook Github Bot <facebook-github-bot@users.noreply.github.com>
	Tue, 19 Feb 2019 16:22:13 +0000 (08:22 -0800)
aten/src/ATen/DLConvertor.cpp		patch \| blob \| history
aten/src/ATen/core/Type.h		patch \| blob \| history
aten/src/ATen/gen.py		patch \| blob \| history
aten/src/TH/CMakeLists.txt		patch \| blob \| history
aten/src/TH/THFile.h		patch \| blob \| history
aten/src/TH/THGenerateBoolType.h	[new file with mode: 0644]	patch \| blob
aten/src/TH/THStorageFunctions.cpp		patch \| blob \| history
aten/src/TH/THStorageFunctions.h		patch \| blob \| history
aten/src/TH/THTensor.cpp		patch \| blob \| history
aten/src/TH/THTensor.h		patch \| blob \| history
aten/src/TH/THTensor.hpp		patch \| blob \| history
aten/src/TH/generic/THStorage.h		patch \| blob \| history
aten/src/TH/generic/THStorageCopy.cpp		patch \| blob \| history
aten/src/TH/generic/THStorageCopy.h		patch \| blob \| history
aten/src/TH/generic/THTensor.h		patch \| blob \| history
aten/src/THC/CMakeLists.txt		patch \| blob \| history
aten/src/THC/THCGenerateBoolType.h	[new file with mode: 0644]	patch \| blob
aten/src/THC/THCStorage.cpp		patch \| blob \| history
aten/src/THC/THCStorage.cu		patch \| blob \| history
aten/src/THC/THCStorage.h		patch \| blob \| history
aten/src/THC/THCStorageCopy.cpp		patch \| blob \| history
aten/src/THC/THCStorageCopy.cu		patch \| blob \| history
aten/src/THC/THCStorageCopy.h		patch \| blob \| history
aten/src/THC/THCTensor.cpp		patch \| blob \| history
aten/src/THC/THCTensor.cu		patch \| blob \| history
aten/src/THC/THCTensor.h		patch \| blob \| history
aten/src/THC/THCTensor.hpp		patch \| blob \| history
aten/src/THC/THCTensorCopy.cu		patch \| blob \| history
aten/src/THC/THCTensorCopy.h		patch \| blob \| history
aten/src/THC/generic/THCStorage.h		patch \| blob \| history
aten/src/THC/generic/THCStorageCopy.cpp		patch \| blob \| history
aten/src/THC/generic/THCStorageCopy.cu		patch \| blob \| history
aten/src/THC/generic/THCStorageCopy.h		patch \| blob \| history
aten/src/THC/generic/THCTensor.h		patch \| blob \| history
aten/src/THC/generic/THCTensorCopy.cu		patch \| blob \| history
c10/core/ScalarType.h		patch \| blob \| history
test/test_torch.py		patch \| blob \| history
torch/__init__.py		patch \| blob \| history
torch/_storage_docs.py		patch \| blob \| history
torch/csrc/DynamicTypes.cpp		patch \| blob \| history
torch/csrc/Module.cpp		patch \| blob \| history
torch/csrc/Storage.cpp		patch \| blob \| history
torch/csrc/Storage.h		patch \| blob \| history
torch/csrc/byte_order.cpp		patch \| blob \| history
torch/csrc/byte_order.h		patch \| blob \| history
torch/csrc/cuda/Module.cpp		patch \| blob \| history
torch/csrc/cuda/Storage.cpp		patch \| blob \| history
torch/csrc/cuda/Storage.h		patch \| blob \| history
torch/csrc/cuda/serialization.cpp		patch \| blob \| history
torch/csrc/cuda/serialization.h		patch \| blob \| history
torch/csrc/cuda/utils.cpp		patch \| blob \| history
torch/csrc/cuda/utils.h		patch \| blob \| history
torch/csrc/generic/Storage.cpp		patch \| blob \| history
torch/csrc/generic/StorageMethods.cpp		patch \| blob \| history
torch/csrc/serialization.cpp		patch \| blob \| history
torch/csrc/serialization.h		patch \| blob \| history
torch/csrc/utils.cpp		patch \| blob \| history
torch/csrc/utils.h		patch \| blob \| history
torch/csrc/utils/tensor_dtypes.cpp		patch \| blob \| history
torch/cuda/__init__.py		patch \| blob \| history
torch/storage.py		patch \| blob \| history