aco: always use rtne for fquantize2f16

author Georg Lehmann <dadschoorse@gmail.com>

Thu, 10 Aug 2023 18:55:04 +0000 (20:55 +0200)

committer Marge Bot <emma+marge@anholt.net>

Fri, 11 Aug 2023 12:37:23 +0000 (12:37 +0000)
author Georg Lehmann <dadschoorse@gmail.com>
Thu, 10 Aug 2023 18:55:04 +0000 (20:55 +0200)
committer Marge Bot <emma+marge@anholt.net>
Fri, 11 Aug 2023 12:37:23 +0000 (12:37 +0000)
diff --git a/src/amd/compiler/aco_instruction_selection.cpp b/src/amd/compiler/aco_instruction_selection.cpp

index 12c9588..f4bcadd 100644 (file)
--- a/src/amd/compiler/aco_instruction_selection.cpp
+++ b/src/amd/compiler/aco_instruction_selection.cpp
@@ -3375,7 +3375,11 @@ visit_alu_instr(isel_context* ctx, nir_alu_instr* instr)
     }
     case nir_op_fquantize2f16: {
        Temp src = get_alu_src(ctx, instr->src[0]);
-      Temp f16 = bld.vop1(aco_opcode::v_cvt_f16_f32, bld.def(v2b), src);
+      Temp f16;
+      if (ctx->block->fp_mode.round16_64 != fp_round_ne)
+         f16 = bld.vop1(aco_opcode::p_cvt_f16_f32_rtne, bld.def(v2b), src);
+      else
+         f16 = bld.vop1(aco_opcode::v_cvt_f16_f32, bld.def(v2b), src);
        Temp f32, cmp_res;
  
        if (ctx->program->gfx_level >= GFX8) {
author	Georg Lehmann <dadschoorse@gmail.com>
	Thu, 10 Aug 2023 18:55:04 +0000 (20:55 +0200)
committer	Marge Bot <emma+marge@anholt.net>
	Fri, 11 Aug 2023 12:37:23 +0000 (12:37 +0000)