aarch64: Update regmove costs for neoverse-v1 and neoverse-512tvb tunings
authorAndre Vieira <andre.simoesdiasvieira@arm.com>
Tue, 22 Mar 2022 10:51:12 +0000 (10:51 +0000)
committerAndre Vieira <andre.simoesdiasvieira@arm.com>
Tue, 22 Mar 2022 12:01:59 +0000 (12:01 +0000)
This patch updates the register move tunings for
-mcpu/-mtune={neoverse-v1,neoverse-512tvb}.

gcc/ChangeLog:
2022-03-22  Tamar Christina  <tamar.christina@arm.com>
    Andre Vieira  <andre.simoesdiasvieira@arm.com>

* config/aarch64/aarch64.cc (neoversev1_regmove_cost): New tuning
struct.
(neoversev1_tunings): Use neoversev1_regmove_cost and update store_int
cost.
(neoverse512tvb_tunings): Likewise.

gcc/config/aarch64/aarch64.cc

index 9fbc4f3..903c842 100644 (file)
@@ -670,6 +670,16 @@ static const struct cpu_regmove_cost neoversen2_regmove_cost =
   2 /* FP2FP  */
 };
 
+static const struct cpu_regmove_cost neoversev1_regmove_cost =
+{
+  1, /* GP2GP  */
+  /* Spilling to int<->fp instead of memory is recommended so set
+     realistic costs compared to memmov_cost.  */
+  3, /* GP2FP  */
+  2, /* FP2GP  */
+  2 /* FP2FP  */
+};
+
 static const struct cpu_regmove_cost demeter_regmove_cost =
 {
   1, /* GP2GP  */
@@ -2063,13 +2073,13 @@ static const struct tune_params neoversev1_tunings =
 {
   &cortexa76_extra_costs,
   &neoversev1_addrcost_table,
-  &generic_regmove_cost,
+  &neoversev1_regmove_cost,
   &neoversev1_vector_cost,
   &generic_branch_cost,
   &generic_approx_modes,
   SVE_256, /* sve_width  */
   { 4, /* load_int.  */
-    1, /* store_int.  */
+    2, /* store_int.  */
     6, /* load_fp.  */
     2, /* store_fp.  */
     6, /* load_pred.  */
@@ -2200,13 +2210,13 @@ static const struct tune_params neoverse512tvb_tunings =
 {
   &cortexa76_extra_costs,
   &neoversev1_addrcost_table,
-  &generic_regmove_cost,
+  &neoversev1_regmove_cost,
   &neoverse512tvb_vector_cost,
   &generic_branch_cost,
   &generic_approx_modes,
   SVE_128 | SVE_256, /* sve_width  */
   { 4, /* load_int.  */
-    1, /* store_int.  */
+    2, /* store_int.  */
     6, /* load_fp.  */
     2, /* store_fp.  */
     6, /* load_pred.  */