radv,nir: add intrinsics for streamout and GS copy shaders

author Rhys Perry <pendingchaos02@gmail.com>

Wed, 28 Sep 2022 18:32:26 +0000 (19:32 +0100)

committer Marge Bot <emma+marge@anholt.net>

Tue, 25 Oct 2022 17:35:08 +0000 (17:35 +0000)
author Rhys Perry <pendingchaos02@gmail.com>
Wed, 28 Sep 2022 18:32:26 +0000 (19:32 +0100)
committer Marge Bot <emma+marge@anholt.net>
Tue, 25 Oct 2022 17:35:08 +0000 (17:35 +0000)
diff --git a/src/amd/llvm/ac_nir_to_llvm.c b/src/amd/llvm/ac_nir_to_llvm.c

index 6decbcc..ef753a0 100644 (file)
--- a/src/amd/llvm/ac_nir_to_llvm.c
+++ b/src/amd/llvm/ac_nir_to_llvm.c
@@ -3619,6 +3619,7 @@ static bool visit_intrinsic(struct ac_nir_context *ctx, nir_intrinsic_instr *ins
     case nir_intrinsic_load_ring_esgs_amd:
     case nir_intrinsic_load_ring_es2gs_offset_amd:
     case nir_intrinsic_load_ring_attr_amd:
+   case nir_intrinsic_load_ring_gsvs_amd:
     case nir_intrinsic_load_lshs_vertex_stride_amd:
     case nir_intrinsic_load_tcs_num_patches_amd:
     case nir_intrinsic_load_hs_out_patch_data_offset_amd:
diff --git a/src/amd/vulkan/radv_nir_lower_abi.c b/src/amd/vulkan/radv_nir_lower_abi.c

index 4212fc3..4680bd7 100644 (file)
--- a/src/amd/vulkan/radv_nir_lower_abi.c
+++ b/src/amd/vulkan/radv_nir_lower_abi.c
@@ -35,6 +35,7 @@ typedef struct {
     const struct radv_shader_info *info;
     const struct radv_pipeline_key *pl_key;
     bool use_llvm;
+   uint32_t address32_hi;
  } lower_abi_state;
  
  static nir_ssa_def *
@@ -123,6 +124,12 @@ lower_abi_instr(nir_builder *b, nir_instr *instr, void *state)
  
        replacement = load_ring(b, stage == MESA_SHADER_GEOMETRY ? RING_ESGS_GS : RING_ESGS_VS, s);
        break;
+   case nir_intrinsic_load_ring_gsvs_amd:
+      if (s->use_llvm)
+         break;
+
+      replacement = load_ring(b, RING_GSVS_VS, s);
+      break;
     case nir_intrinsic_load_ring_es2gs_offset_amd:
        replacement = ac_nir_load_arg(b, &s->args->ac, s->args->ac.es2gs_offset);
        break;
@@ -346,6 +353,23 @@ lower_abi_instr(nir_builder *b, nir_instr *instr, void *state)
        /* No-op for RADV. */
        break;
  
+   case nir_intrinsic_load_streamout_config_amd:
+      replacement = ac_nir_load_arg(b, &s->args->ac, s->args->ac.streamout_config);
+      break;
+   case nir_intrinsic_load_streamout_write_index_amd:
+      replacement = ac_nir_load_arg(b, &s->args->ac, s->args->ac.streamout_write_index);
+      break;
+   case nir_intrinsic_load_streamout_buffer_amd: {
+      nir_ssa_def *ptr =
+         nir_pack_64_2x32_split(b, ac_nir_load_arg(b, &s->args->ac, s->args->streamout_buffers),
+                                nir_imm_int(b, s->address32_hi));
+      replacement = nir_load_smem_amd(b, 4, ptr, nir_imm_int(b, nir_intrinsic_base(intrin) * 16));
+      break;
+   }
+   case nir_intrinsic_load_streamout_offset_amd:
+      replacement =
+         ac_nir_load_arg(b, &s->args->ac, s->args->ac.streamout_offset[nir_intrinsic_base(intrin)]);
+      break;
     default:
        progress = false;
        break;
@@ -366,7 +390,7 @@ lower_abi_instr(nir_builder *b, nir_instr *instr, void *state)
  void
  radv_nir_lower_abi(nir_shader *shader, enum amd_gfx_level gfx_level,
                     const struct radv_shader_info *info, const struct radv_shader_args *args,
-                   const struct radv_pipeline_key *pl_key, bool use_llvm)
+                   const struct radv_pipeline_key *pl_key, bool use_llvm, uint32_t address32_hi)
  {
     lower_abi_state state = {
        .gfx_level = gfx_level,
@@ -374,6 +398,7 @@ radv_nir_lower_abi(nir_shader *shader, enum amd_gfx_level gfx_level,
        .args = args,
        .pl_key = pl_key,
        .use_llvm = use_llvm,
+      .address32_hi = address32_hi,
     };
  
     nir_shader_instructions_pass(shader, lower_abi_instr,
diff --git a/src/amd/vulkan/radv_nir_to_llvm.c b/src/amd/vulkan/radv_nir_to_llvm.c

index 33ab613..f597cfe 100644 (file)
--- a/src/amd/vulkan/radv_nir_to_llvm.c
+++ b/src/amd/vulkan/radv_nir_to_llvm.c
@@ -1335,6 +1335,8 @@ static LLVMValueRef radv_intrinsic_load(struct ac_shader_abi *abi, nir_intrinsic
        return ctx->esgs_ring;
     case nir_intrinsic_load_ring_attr_amd:
        return ctx->attr_ring;
+   case nir_intrinsic_load_ring_gsvs_amd:
+      return ctx->gsvs_ring[0];
     default:
        return NULL;
     }
diff --git a/src/amd/vulkan/radv_pipeline.c b/src/amd/vulkan/radv_pipeline.c

index 6cac58b..598b1de 100644 (file)
--- a/src/amd/vulkan/radv_pipeline.c
+++ b/src/amd/vulkan/radv_pipeline.c
@@ -3895,7 +3895,8 @@ radv_postprocess_nir(struct radv_pipeline *pipeline,
  
     NIR_PASS(_, stage->nir, ac_nir_lower_global_access);
     NIR_PASS_V(stage->nir, radv_nir_lower_abi, gfx_level, &stage->info, &stage->args, pipeline_key,
-              radv_use_llvm_for_stage(device, stage->stage));
+              radv_use_llvm_for_stage(device, stage->stage),
+              device->physical_device->rad_info.address32_hi);
     radv_optimize_nir_algebraic(
        stage->nir, io_to_mem || lowered_ngg || stage->stage == MESA_SHADER_COMPUTE ||
        stage->stage == MESA_SHADER_TASK);
diff --git a/src/amd/vulkan/radv_shader.h b/src/amd/vulkan/radv_shader.h

index 8862d71..25156ea 100644 (file)
--- a/src/amd/vulkan/radv_shader.h
+++ b/src/amd/vulkan/radv_shader.h
@@ -547,7 +547,8 @@ nir_shader *radv_shader_spirv_to_nir(struct radv_device *device,
  
  void radv_nir_lower_abi(nir_shader *shader, enum amd_gfx_level gfx_level,
                          const struct radv_shader_info *info, const struct radv_shader_args *args,
-                        const struct radv_pipeline_key *pl_key, bool use_llvm);
+                        const struct radv_pipeline_key *pl_key, bool use_llvm,
+                        uint32_t address32_hi);
  
  void radv_init_shader_arenas(struct radv_device *device);
  void radv_destroy_shader_arenas(struct radv_device *device);
diff --git a/src/compiler/nir/nir_divergence_analysis.c b/src/compiler/nir/nir_divergence_analysis.c

index e8df2ea..4b8f950 100644 (file)
--- a/src/compiler/nir/nir_divergence_analysis.c
+++ b/src/compiler/nir/nir_divergence_analysis.c
@@ -156,6 +156,10 @@ visit_intrinsic(nir_shader *shader, nir_intrinsic_instr *instr)
     case nir_intrinsic_load_ring_task_payload_amd:
     case nir_intrinsic_load_sample_positions_amd:
     case nir_intrinsic_load_rasterization_samples_amd:
+   case nir_intrinsic_load_ring_gsvs_amd:
+   case nir_intrinsic_load_streamout_config_amd:
+   case nir_intrinsic_load_streamout_write_index_amd:
+   case nir_intrinsic_load_streamout_offset_amd:
     case nir_intrinsic_load_task_ring_entry_amd:
     case nir_intrinsic_load_task_ib_addr:
     case nir_intrinsic_load_task_ib_stride:
diff --git a/src/compiler/nir/nir_intrinsics.py b/src/compiler/nir/nir_intrinsics.py

index 08246d2..c406cf8 100644 (file)
--- a/src/compiler/nir/nir_intrinsics.py
+++ b/src/compiler/nir/nir_intrinsics.py
@@ -1342,6 +1342,16 @@ system_value("gs_vertex_offset_amd", 1, [BASE])
  # Number of rasterization samples
  system_value("rasterization_samples_amd", 1)
  
+# Descriptor where GS outputs are stored for GS copy shader to read on GFX6-9
+system_value("ring_gsvs_amd", 4)
+
+# Streamout configuration
+system_value("streamout_config_amd", 1)
+# Position to write within the streamout buffers
+system_value("streamout_write_index_amd", 1)
+# Offset to write within a streamout buffer
+system_value("streamout_offset_amd", 1, indices=[BASE])
+
  # AMD merged shader intrinsics
  
  # Whether the current invocation has an input vertex / primitive to process (also known as "ES thread" or "GS thread").
author	Rhys Perry <pendingchaos02@gmail.com>
	Wed, 28 Sep 2022 18:32:26 +0000 (19:32 +0100)
committer	Marge Bot <emma+marge@anholt.net>
	Tue, 25 Oct 2022 17:35:08 +0000 (17:35 +0000)
src/amd/llvm/ac_nir_to_llvm.c		patch \| blob \| history
src/amd/vulkan/radv_nir_lower_abi.c		patch \| blob \| history
src/amd/vulkan/radv_nir_to_llvm.c		patch \| blob \| history
src/amd/vulkan/radv_pipeline.c		patch \| blob \| history
src/amd/vulkan/radv_shader.h		patch \| blob \| history
src/compiler/nir/nir_divergence_analysis.c		patch \| blob \| history
src/compiler/nir/nir_intrinsics.py		patch \| blob \| history