<sys/platform/x86.h>: Add AMX-FP16 support
authorH.J. Lu <hjl.tools@gmail.com>
Wed, 5 Apr 2023 16:21:38 +0000 (09:21 -0700)
committerH.J. Lu <hjl.tools@gmail.com>
Wed, 5 Apr 2023 21:46:10 +0000 (14:46 -0700)
Add AMX-FP16 support to <sys/platform/x86.h>.
Reviewed-by: Noah Goldstein <goldstein.w.n@gmail.com>
manual/platform.texi
sysdeps/x86/bits/platform/x86.h
sysdeps/x86/cpu-features.c
sysdeps/x86/include/cpu-features.h
sysdeps/x86/tst-get-cpu-features.c

index af79f5e..7d4aa3d 100644 (file)
@@ -201,6 +201,9 @@ The supported processor features are:
 @code{AMX_INT8} -- Tile computational operations on 8-bit numbers.
 
 @item
+@code{AMX_FP16} -- Tile computational operations on FP16 numbers.
+
+@item
 @code{AMX_TILE} -- Tile architecture.
 
 @item
index 2a15ad9..2776c69 100644 (file)
@@ -298,6 +298,7 @@ enum
   x86_cpu_FSRS                 = x86_cpu_index_7_ecx_1_eax + 11,
   x86_cpu_FSRCS                        = x86_cpu_index_7_ecx_1_eax + 12,
   x86_cpu_WRMSRNS              = x86_cpu_index_7_ecx_1_eax + 19,
+  x86_cpu_AMX_FP16             = x86_cpu_index_7_ecx_1_eax + 21,
   x86_cpu_HRESET               = x86_cpu_index_7_ecx_1_eax + 22,
   x86_cpu_LAM                  = x86_cpu_index_7_ecx_1_eax + 26,
 
index da04ad0..6c1b5ef 100644 (file)
@@ -213,6 +213,8 @@ update_active (struct cpu_features *cpu_features)
          CPU_FEATURE_SET_ACTIVE (cpu_features, AMX_TILE);
          /* Determine if AMX_INT8 is usable.  */
          CPU_FEATURE_SET_ACTIVE (cpu_features, AMX_INT8);
+         /* Determine if AMX_FP16 is usable.  */
+         CPU_FEATURE_SET_ACTIVE (cpu_features, AMX_FP16);
        }
 
       /* These features are usable only when OSXSAVE is enabled.  */
index 4e40fe0..07c841c 100644 (file)
@@ -309,6 +309,7 @@ enum
 #define bit_cpu_FZLRM          (1u << 10)
 #define bit_cpu_FSRS           (1u << 11)
 #define bit_cpu_FSRCS          (1u << 12)
+#define bit_cpu_AMX_FP16       (1u << 21)
 #define bit_cpu_HRESET         (1u << 22)
 #define bit_cpu_LAM            (1u << 26)
 
@@ -546,6 +547,7 @@ enum
 #define index_cpu_FZLRM                CPUID_INDEX_7_ECX_1
 #define index_cpu_FSRS         CPUID_INDEX_7_ECX_1
 #define index_cpu_FSRCS                CPUID_INDEX_7_ECX_1
+#define index_cpu_AMX_FP16     CPUID_INDEX_7_ECX_1
 #define index_cpu_HRESET       CPUID_INDEX_7_ECX_1
 #define index_cpu_LAM          CPUID_INDEX_7_ECX_1
 
@@ -783,6 +785,7 @@ enum
 #define reg_FZLRM              eax
 #define reg_FSRS               eax
 #define reg_FSRCS              eax
+#define reg_AMX_FP16           eax
 #define reg_HRESET             eax
 #define reg_LAM                        eax
 
index 9c436ea..c0f222c 100644 (file)
@@ -210,6 +210,7 @@ do_test (void)
   CHECK_CPU_FEATURE_PRESENT (FSRS);
   CHECK_CPU_FEATURE_PRESENT (FSRCS);
   CHECK_CPU_FEATURE_PRESENT (WRMSRNS);
+  CHECK_CPU_FEATURE_PRESENT (AMX_FP16);
   CHECK_CPU_FEATURE_PRESENT (HRESET);
   CHECK_CPU_FEATURE_PRESENT (LAM);
   CHECK_CPU_FEATURE_PRESENT (AESKLE);
@@ -377,6 +378,7 @@ do_test (void)
   CHECK_CPU_FEATURE_ACTIVE (FZLRM);
   CHECK_CPU_FEATURE_ACTIVE (FSRS);
   CHECK_CPU_FEATURE_ACTIVE (FSRCS);
+  CHECK_CPU_FEATURE_ACTIVE (AMX_FP16);
   CHECK_CPU_FEATURE_ACTIVE (AESKLE);
   CHECK_CPU_FEATURE_ACTIVE (WIDE_KL);
   CHECK_CPU_FEATURE_ACTIVE (PTWRITE);