[ trivial ] Add missing docs and error message

author skykongkong8 <ss.kong@samsung.com>

Wed, 7 Aug 2024 01:21:08 +0000 (10:21 +0900)

committer Jijoong Moon <jijoong.moon@samsung.com>

Fri, 9 Aug 2024 00:24:54 +0000 (09:24 +0900)
author skykongkong8 <ss.kong@samsung.com>
Wed, 7 Aug 2024 01:21:08 +0000 (10:21 +0900)
committer Jijoong Moon <jijoong.moon@samsung.com>
Fri, 9 Aug 2024 00:24:54 +0000 (09:24 +0900)
diff --git a/nntrainer/tensor/hgemm/hgemm.h b/nntrainer/tensor/hgemm/hgemm.h

index e67edec840c5186e16df2c28dd70b589e4bfa91d..2904302d2410b4888f60031da5d7a1e2135a288a 100644 (file)
--- a/nntrainer/tensor/hgemm/hgemm.h
+++ b/nntrainer/tensor/hgemm/hgemm.h
@@ -23,6 +23,8 @@
   * @param[in] K number of op(A)'s and columns and op(B)'s rows
   * @param[in] alpha float number
   * @param[in] beta float number
+ * @param[in] TransA bool transpose info of lhs matrix
+ * @param[in] TransB bool transpose info of rhs matrix
   */
  void hgemm(const __fp16 *A, const __fp16 *B, __fp16 *C, unsigned int M,
             unsigned int N, unsigned int K, float alpha, float beta, bool TransA,
@@ -39,6 +41,8 @@ void hgemm(const __fp16 *A, const __fp16 *B, __fp16 *C, unsigned int M,
   * @param[in] K number of op(A)'s and columns and op(B)'s rows
   * @param[in] alpha float number
   * @param[in] beta float number
+ * @param[in] TransA bool transpose info of lhs matrix
+ * @param[in] TransB bool transpose info of rhs matrix
   */
  void hgemm_small(const __fp16 *A, const __fp16 *B, __fp16 *C, unsigned int M,
                   unsigned int N, unsigned int K, float alpha, float beta,
@@ -55,6 +59,8 @@ void hgemm_small(const __fp16 *A, const __fp16 *B, __fp16 *C, unsigned int M,
   * @param[in] K number of op(A)'s and columns and op(B)'s rows
   * @param[in] alpha float number
   * @param[in] beta float number
+ * @param[in] TransA bool transpose info of lhs matrix
+ * @param[in] TransB bool transpose info of rhs matrix
   */
  void hgemm_ensure_divisibility(const __fp16 *A, const __fp16 *B, float *C32,
                                 unsigned int M, unsigned int N, unsigned int K,
@@ -72,6 +78,8 @@ void hgemm_ensure_divisibility(const __fp16 *A, const __fp16 *B, float *C32,
   * @param[in] K number of op(A)'s and columns and op(B)'s rows
   * @param[in] alpha float number
   * @param[in] beta float number
+ * @param[in] TransA bool transpose info of lhs matrix
+ * @param[in] TransB bool transpose info of rhs matrix
   */
  void hgemm_classify(const __fp16 *A, const __fp16 *B, float *C32,
                      unsigned int M, unsigned int N, unsigned int K,
@@ -88,6 +96,8 @@ void hgemm_classify(const __fp16 *A, const __fp16 *B, float *C32,
   * @param[in] K number of op(A)'s and columns and op(B)'s rows
   * @param[in] alpha float number
   * @param[in] beta float number
+ * @param[in] TransA bool transpose info of lhs matrix
+ * @param[in] TransB bool transpose info of rhs matrix
   */
  void hgemm_K1(const __fp16 *A, const __fp16 *B, __fp16 *C, unsigned int M,
                unsigned int N, unsigned int K, float alpha, float beta,
diff --git a/nntrainer/tensor/hgemm/hgemm_kernel/hgemm_kernel_8x16_experimental.cpp b/nntrainer/tensor/hgemm/hgemm_kernel/hgemm_kernel_8x16_experimental.cpp

index 81033e16177fc676bc19655180c745a1eb96c1c4..b1c5ffe06af245307147aa34beda7e14afbc9884 100644 (file)
--- a/nntrainer/tensor/hgemm/hgemm_kernel/hgemm_kernel_8x16_experimental.cpp
+++ b/nntrainer/tensor/hgemm/hgemm_kernel/hgemm_kernel_8x16_experimental.cpp
@@ -14,6 +14,7 @@
  #include <arm_neon.h>
  #include <assert.h>
  #include <hgemm_kernel.h>
+#include <stdexcept>
  #include <stdlib.h>
  
  #define INIT_KERNEL_8X16()       \
@@ -725,13 +726,14 @@
                          vcvt_f32_f16(vget_high_f16(v120_127))));               \
    } while (0)
  
-template<>
+template <>
  void hgemm_kernel_8x16(unsigned int M, unsigned int N, unsigned int K,
                         __fp16 *sa, __fp16 *sb, __fp16 *sc, unsigned int ldc) {
-//  std::invalid_argument("Error : should not reach experimental kernel + full fp16 usage in hgemm");
+  throw std::runtime_error(
+    "Error : should not reach for full-fp16 usage in experimental kernel");
  }
  
-template<>
+template <>
  void hgemm_kernel_8x16(unsigned int M, unsigned int N, unsigned int K,
                         __fp16 *sa, __fp16 *sb, float *sc, unsigned int ldc) {
    assert(M > 0 && N > 0 && K > 0);
@@ -803,4 +805,3 @@ void hgemm_kernel_8x16(unsigned int M, unsigned int N, unsigned int K,
      b = sb;
    }
  }
-
author	skykongkong8 <ss.kong@samsung.com>
	Wed, 7 Aug 2024 01:21:08 +0000 (10:21 +0900)
committer	Jijoong Moon <jijoong.moon@samsung.com>
	Fri, 9 Aug 2024 00:24:54 +0000 (09:24 +0900)
nntrainer/tensor/hgemm/hgemm.h		patch \| blob \| history
nntrainer/tensor/hgemm/hgemm_kernel/hgemm_kernel_8x16_experimental.cpp		patch \| blob \| history