drm/i915/gt: Clear SET_PREDICATE_RESULT prior to executing the ring

author Chris Wilson <chris.p.wilson@intel.com>

Mon, 25 Apr 2022 15:23:17 +0000 (20:53 +0530)

committer Ramalingam C <ramalingam.c@intel.com>

Mon, 2 May 2022 09:48:09 +0000 (15:18 +0530)
author Chris Wilson <chris.p.wilson@intel.com>
Mon, 25 Apr 2022 15:23:17 +0000 (20:53 +0530)
committer Ramalingam C <ramalingam.c@intel.com>
Mon, 2 May 2022 09:48:09 +0000 (15:18 +0530)
diff --git a/drivers/gpu/drm/i915/gt/gen8_engine_cs.c b/drivers/gpu/drm/i915/gt/gen8_engine_cs.c

index 9529c54..3e13960 100644 (file)
--- a/drivers/gpu/drm/i915/gt/gen8_engine_cs.c
+++ b/drivers/gpu/drm/i915/gt/gen8_engine_cs.c
@@ -5,6 +5,7 @@
  
  #include "gen8_engine_cs.h"
  #include "i915_drv.h"
+#include "intel_engine_regs.h"
  #include "intel_gpu_commands.h"
  #include "intel_lrc.h"
  #include "intel_ring.h"
@@ -385,6 +386,59 @@ int gen8_emit_init_breadcrumb(struct i915_request *rq)
         return 0;
  }
  
+static int __gen125_emit_bb_start(struct i915_request *rq,
+                                 u64 offset, u32 len,
+                                 const unsigned int flags,
+                                 u32 arb)
+{
+       struct intel_context *ce = rq->context;
+       u32 wa_offset = lrc_indirect_bb(ce);
+       u32 *cs;
+
+       cs = intel_ring_begin(rq, 12);
+       if (IS_ERR(cs))
+               return PTR_ERR(cs);
+
+       *cs++ = MI_ARB_ON_OFF | arb;
+
+       *cs++ = MI_LOAD_REGISTER_MEM_GEN8 |
+               MI_SRM_LRM_GLOBAL_GTT |
+               MI_LRI_LRM_CS_MMIO;
+       *cs++ = i915_mmio_reg_offset(RING_PREDICATE_RESULT(0));
+       *cs++ = wa_offset + DG2_PREDICATE_RESULT_WA;
+       *cs++ = 0;
+
+       *cs++ = MI_BATCH_BUFFER_START_GEN8 |
+               (flags & I915_DISPATCH_SECURE ? 0 : BIT(8));
+       *cs++ = lower_32_bits(offset);
+       *cs++ = upper_32_bits(offset);
+
+       /* Fixup stray MI_SET_PREDICATE as it prevents us executing the ring */
+       *cs++ = MI_BATCH_BUFFER_START_GEN8;
+       *cs++ = wa_offset + DG2_PREDICATE_RESULT_BB;
+       *cs++ = 0;
+
+       *cs++ = MI_ARB_ON_OFF | MI_ARB_DISABLE;
+
+       intel_ring_advance(rq, cs);
+
+       return 0;
+}
+
+int gen125_emit_bb_start_noarb(struct i915_request *rq,
+                              u64 offset, u32 len,
+                              const unsigned int flags)
+{
+       return __gen125_emit_bb_start(rq, offset, len, flags, MI_ARB_DISABLE);
+}
+
+int gen125_emit_bb_start(struct i915_request *rq,
+                        u64 offset, u32 len,
+                        const unsigned int flags)
+{
+       return __gen125_emit_bb_start(rq, offset, len, flags, MI_ARB_ENABLE);
+}
+
  int gen8_emit_bb_start_noarb(struct i915_request *rq,
                              u64 offset, u32 len,
                              const unsigned int flags)
diff --git a/drivers/gpu/drm/i915/gt/gen8_engine_cs.h b/drivers/gpu/drm/i915/gt/gen8_engine_cs.h

index 107ab42..32e3d2b 100644 (file)
--- a/drivers/gpu/drm/i915/gt/gen8_engine_cs.h
+++ b/drivers/gpu/drm/i915/gt/gen8_engine_cs.h
@@ -31,6 +31,13 @@ int gen8_emit_bb_start(struct i915_request *rq,
                        u64 offset, u32 len,
                        const unsigned int flags);
  
+int gen125_emit_bb_start_noarb(struct i915_request *rq,
+                              u64 offset, u32 len,
+                              const unsigned int flags);
+int gen125_emit_bb_start(struct i915_request *rq,
+                        u64 offset, u32 len,
+                        const unsigned int flags);
+
  u32 *gen8_emit_fini_breadcrumb_xcs(struct i915_request *rq, u32 *cs);
  u32 *gen12_emit_fini_breadcrumb_xcs(struct i915_request *rq, u32 *cs);
  
diff --git a/drivers/gpu/drm/i915/gt/intel_engine_regs.h b/drivers/gpu/drm/i915/gt/intel_engine_regs.h

index 1dab554..75a0c55 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_engine_regs.h
+++ b/drivers/gpu/drm/i915/gt/intel_engine_regs.h
@@ -148,6 +148,7 @@
                 (REG_FIELD_PREP(CMD_CCTL_WRITE_OVERRIDE_MASK, (write) << 1) | \
                  REG_FIELD_PREP(CMD_CCTL_READ_OVERRIDE_MASK, (read) << 1))
  
+#define RING_PREDICATE_RESULT(base)            _MMIO((base) + 0x3b8) /* gen12+ */
  #define MI_PREDICATE_RESULT_2(base)            _MMIO((base) + 0x3bc)
  #define   LOWER_SLICE_ENABLED                  (1 << 0)
  #define   LOWER_SLICE_DISABLED                 (0 << 0)
diff --git a/drivers/gpu/drm/i915/gt/intel_execlists_submission.c b/drivers/gpu/drm/i915/gt/intel_execlists_submission.c

index f8749c4..86f7a9a 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_execlists_submission.c
+++ b/drivers/gpu/drm/i915/gt/intel_execlists_submission.c
@@ -3433,10 +3433,17 @@ logical_ring_default_vfuncs(struct intel_engine_cs *engine)
                 }
         }
  
-       if (intel_engine_has_preemption(engine))
-               engine->emit_bb_start = gen8_emit_bb_start;
-       else
-               engine->emit_bb_start = gen8_emit_bb_start_noarb;
+       if (GRAPHICS_VER_FULL(engine->i915) >= IP_VER(12, 50)) {
+               if (intel_engine_has_preemption(engine))
+                       engine->emit_bb_start = gen125_emit_bb_start;
+               else
+                       engine->emit_bb_start = gen125_emit_bb_start_noarb;
+       } else {
+               if (intel_engine_has_preemption(engine))
+                       engine->emit_bb_start = gen8_emit_bb_start;
+               else
+                       engine->emit_bb_start = gen8_emit_bb_start_noarb;
+       }
  
         engine->busyness = execlists_engine_busyness;
  }
diff --git a/drivers/gpu/drm/i915/gt/intel_gpu_commands.h b/drivers/gpu/drm/i915/gt/intel_gpu_commands.h

index e52718a..556bca3 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_gpu_commands.h
+++ b/drivers/gpu/drm/i915/gt/intel_gpu_commands.h
@@ -39,6 +39,8 @@
  #define  MI_GLOBAL_GTT    (1<<22)
  
  #define MI_NOOP                        MI_INSTR(0, 0)
+#define MI_SET_PREDICATE       MI_INSTR(0x01, 0)
+#define   MI_SET_PREDICATE_DISABLE     (0 << 0)
  #define MI_USER_INTERRUPT      MI_INSTR(0x02, 0)
  #define MI_WAIT_FOR_EVENT       MI_INSTR(0x03, 0)
  #define   MI_WAIT_FOR_OVERLAY_FLIP     (1<<16)
diff --git a/drivers/gpu/drm/i915/gt/intel_lrc.c b/drivers/gpu/drm/i915/gt/intel_lrc.c

index 3f83a90..eec73c6 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_lrc.c
+++ b/drivers/gpu/drm/i915/gt/intel_lrc.c
@@ -904,6 +904,24 @@ check_redzone(const void *vaddr, const struct intel_engine_cs *engine)
                              engine->name);
  }
  
+static u32 context_wa_bb_offset(const struct intel_context *ce)
+{
+       return PAGE_SIZE * ce->wa_bb_page;
+}
+
+static u32 *context_indirect_bb(const struct intel_context *ce)
+{
+       void *ptr;
+
+       GEM_BUG_ON(!ce->wa_bb_page);
+
+       ptr = ce->lrc_reg_state;
+       ptr -= LRC_STATE_OFFSET; /* back to start of context image */
+       ptr += context_wa_bb_offset(ce);
+
+       return ptr;
+}
+
  void lrc_init_state(struct intel_context *ce,
                     struct intel_engine_cs *engine,
                     void *state)
@@ -922,6 +940,10 @@ void lrc_init_state(struct intel_context *ce,
         /* Clear the ppHWSP (inc. per-context counters) */
         memset(state, 0, PAGE_SIZE);
  
+       /* Clear the indirect wa and storage */
+       if (ce->wa_bb_page)
+               memset(state + context_wa_bb_offset(ce), 0, PAGE_SIZE);
+
         /*
          * The second page of the context object contains some registers which
          * must be set up prior to the first execution.
@@ -929,6 +951,35 @@ void lrc_init_state(struct intel_context *ce,
         __lrc_init_regs(state + LRC_STATE_OFFSET, ce, engine, inhibit);
  }
  
+u32 lrc_indirect_bb(const struct intel_context *ce)
+{
+       return i915_ggtt_offset(ce->state) + context_wa_bb_offset(ce);
+}
+
+static u32 *setup_predicate_disable_wa(const struct intel_context *ce, u32 *cs)
+{
+       /* If predication is active, this will be noop'ed */
+       *cs++ = MI_STORE_DWORD_IMM_GEN4 | MI_USE_GGTT | (4 - 2);
+       *cs++ = lrc_indirect_bb(ce) + DG2_PREDICATE_RESULT_WA;
+       *cs++ = 0;
+       *cs++ = 0; /* No predication */
+
+       /* predicated end, only terminates if SET_PREDICATE_RESULT:0 is clear */
+       *cs++ = MI_BATCH_BUFFER_END | BIT(15);
+       *cs++ = MI_SET_PREDICATE | MI_SET_PREDICATE_DISABLE;
+
+       /* Instructions are no longer predicated (disabled), we can proceed */
+       *cs++ = MI_STORE_DWORD_IMM_GEN4 | MI_USE_GGTT | (4 - 2);
+       *cs++ = lrc_indirect_bb(ce) + DG2_PREDICATE_RESULT_WA;
+       *cs++ = 0;
+       *cs++ = 1; /* enable predication before the next BB */
+
+       *cs++ = MI_BATCH_BUFFER_END;
+       GEM_BUG_ON(offset_in_page(cs) > DG2_PREDICATE_RESULT_WA);
+
+       return cs;
+}
+
  static struct i915_vma *
  __lrc_alloc_state(struct intel_context *ce, struct intel_engine_cs *engine)
  {
@@ -1240,24 +1291,6 @@ gen12_emit_indirect_ctx_xcs(const struct intel_context *ce, u32 *cs)
         return cs;
  }
  
-static u32 context_wa_bb_offset(const struct intel_context *ce)
-{
-       return PAGE_SIZE * ce->wa_bb_page;
-}
-
-static u32 *context_indirect_bb(const struct intel_context *ce)
-{
-       void *ptr;
-
-       GEM_BUG_ON(!ce->wa_bb_page);
-
-       ptr = ce->lrc_reg_state;
-       ptr -= LRC_STATE_OFFSET; /* back to start of context image */
-       ptr += context_wa_bb_offset(ce);
-
-       return ptr;
-}
-
  static void
  setup_indirect_ctx_bb(const struct intel_context *ce,
                       const struct intel_engine_cs *engine,
@@ -1271,9 +1304,11 @@ setup_indirect_ctx_bb(const struct intel_context *ce,
         while ((unsigned long)cs % CACHELINE_BYTES)
                 *cs++ = MI_NOOP;
  
+       GEM_BUG_ON(cs - start > DG2_PREDICATE_RESULT_BB / sizeof(*start));
+       setup_predicate_disable_wa(ce, start + DG2_PREDICATE_RESULT_BB / sizeof(*start));
+
         lrc_setup_indirect_ctx(ce->lrc_reg_state, engine,
-                              i915_ggtt_offset(ce->state) +
-                              context_wa_bb_offset(ce),
+                              lrc_indirect_bb(ce),
                                (cs - start) * sizeof(*cs));
  }
  
diff --git a/drivers/gpu/drm/i915/gt/intel_lrc.h b/drivers/gpu/drm/i915/gt/intel_lrc.h

index 7371bb5..31be734 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_lrc.h
+++ b/drivers/gpu/drm/i915/gt/intel_lrc.h
@@ -145,4 +145,9 @@ static inline void lrc_runtime_stop(struct intel_context *ce)
         WRITE_ONCE(stats->active, 0);
  }
  
+#define DG2_PREDICATE_RESULT_WA (PAGE_SIZE - sizeof(u64))
+#define DG2_PREDICATE_RESULT_BB (2048)
+
+u32 lrc_indirect_bb(const struct intel_context *ce);
+
  #endif /* __INTEL_LRC_H__ */
diff --git a/drivers/gpu/drm/i915/gt/uc/intel_guc_submission.c b/drivers/gpu/drm/i915/gt/uc/intel_guc_submission.c

index 33e695a..75291e9 100644 (file)
--- a/drivers/gpu/drm/i915/gt/uc/intel_guc_submission.c
+++ b/drivers/gpu/drm/i915/gt/uc/intel_guc_submission.c
@@ -3897,6 +3897,8 @@ static void guc_default_vfuncs(struct intel_engine_cs *engine)
          */
  
         engine->emit_bb_start = gen8_emit_bb_start;
+       if (GRAPHICS_VER_FULL(engine->i915) >= IP_VER(12, 50))
+               engine->emit_bb_start = gen125_emit_bb_start;
  }
  
  static void rcs_submission_override(struct intel_engine_cs *engine)
author	Chris Wilson <chris.p.wilson@intel.com>
	Mon, 25 Apr 2022 15:23:17 +0000 (20:53 +0530)
committer	Ramalingam C <ramalingam.c@intel.com>
	Mon, 2 May 2022 09:48:09 +0000 (15:18 +0530)
drivers/gpu/drm/i915/gt/gen8_engine_cs.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/gen8_engine_cs.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_engine_regs.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_execlists_submission.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_gpu_commands.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_lrc.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_lrc.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/uc/intel_guc_submission.c		patch \| blob \| history