Redefine the VPP vfe_state on Gen6+

author Zhao Yakui <yakui.zhao@intel.com>

Thu, 11 Apr 2013 05:09:21 +0000 (13:09 +0800)

committer Xiang, Haihao <haihao.xiang@intel.com>

Thu, 27 Feb 2014 02:05:15 +0000 (10:05 +0800)
author Zhao Yakui <yakui.zhao@intel.com>
Thu, 11 Apr 2013 05:09:21 +0000 (13:09 +0800)
committer Xiang, Haihao <haihao.xiang@intel.com>
Thu, 27 Feb 2014 02:05:15 +0000 (10:05 +0800)
diff --git a/src/i965_post_processing.c b/src/i965_post_processing.c

index 51bacc2..a95d4a4 100755 (executable)
--- a/src/i965_post_processing.c
+++ b/src/i965_post_processing.c
@@ -5270,12 +5270,14 @@ gen6_pp_vfe_state(VADriverContextP ctx,
      OUT_BATCH(batch, CMD_MEDIA_VFE_STATE | (8 - 2));
      OUT_BATCH(batch, 0);
      OUT_BATCH(batch,
-              (pp_context->urb.num_vfe_entries - 1) << 16 |
-              pp_context->urb.num_vfe_entries << 8);
+              (pp_context->vfe_gpu_state.max_num_threads - 1) << 16 |
+              pp_context->vfe_gpu_state.num_urb_entries << 8);
      OUT_BATCH(batch, 0);
      OUT_BATCH(batch,
-              (pp_context->urb.size_vfe_entry * 2) << 16 |  /* URB Entry Allocation Size, in 256 bits unit */
-              (pp_context->urb.size_cs_entry * pp_context->urb.num_cs_entries * 2)); /* CURBE Allocation Size, in 256 bits unit */
+              (pp_context->vfe_gpu_state.urb_entry_size) << 16 |  
+               /* URB Entry Allocation Size, in 256 bits unit */
+              (pp_context->vfe_gpu_state.curbe_allocation_size));
+               /* CURBE Allocation Size, in 256 bits unit */
      OUT_BATCH(batch, 0);
      OUT_BATCH(batch, 0);
      OUT_BATCH(batch, 0);
@@ -5293,12 +5295,14 @@ gen8_pp_vfe_state(VADriverContextP ctx,
      OUT_BATCH(batch, 0);
      OUT_BATCH(batch, 0);
      OUT_BATCH(batch,
-              (pp_context->urb.num_vfe_entries - 1) << 16 |
-              pp_context->urb.num_vfe_entries << 8);
+              (pp_context->vfe_gpu_state.max_num_threads - 1) << 16 |
+              pp_context->vfe_gpu_state.num_urb_entries << 8);
      OUT_BATCH(batch, 0);
      OUT_BATCH(batch,
-              (pp_context->urb.size_vfe_entry * 2) << 16 |  /* URB Entry Allocation Size, in 256 bits unit */
-              (pp_context->urb.size_cs_entry * pp_context->urb.num_cs_entries * 2)); /* CURBE Allocation Size, in 256 bits unit */
+              (pp_context->vfe_gpu_state.urb_entry_size) << 16 |  
+               /* URB Entry Allocation Size, in 256 bits unit */
+              (pp_context->vfe_gpu_state.curbe_allocation_size));
+               /* CURBE Allocation Size, in 256 bits unit */
      OUT_BATCH(batch, 0);
      OUT_BATCH(batch, 0);
      OUT_BATCH(batch, 0);
@@ -6281,6 +6285,8 @@ i965_post_processing_terminate(VADriverContextP ctx)
      i965->pp_context = NULL;
  }
  
+#define VPP_CURBE_ALLOCATION_SIZE      32
+
  static void
  i965_post_processing_context_init(VADriverContextP ctx,
                                    struct i965_post_processing_context *pp_context,
@@ -6289,21 +6295,25 @@ i965_post_processing_context_init(VADriverContextP ctx,
      struct i965_driver_data *i965 = i965_driver_data(ctx);
      int i;
  
-    pp_context->urb.size = URB_SIZE((&i965->intel));
-    pp_context->urb.num_vfe_entries = 32;
-    pp_context->urb.size_vfe_entry = 1;     /* in 512 bits unit */
-    pp_context->urb.num_cs_entries = 1;
-    
-    if (IS_GEN7(i965->intel.device_id))
-        pp_context->urb.size_cs_entry = 4;      /* in 512 bits unit */
-    else
+    if (IS_IRONLAKE(i965->intel.device_id)) {
+       pp_context->urb.size = URB_SIZE((&i965->intel));
+       pp_context->urb.num_vfe_entries = 32;
+       pp_context->urb.size_vfe_entry = 1;     /* in 512 bits unit */
+       pp_context->urb.num_cs_entries = 1;
          pp_context->urb.size_cs_entry = 2;
-
-    pp_context->urb.vfe_start = 0;
-    pp_context->urb.cs_start = pp_context->urb.vfe_start + 
-        pp_context->urb.num_vfe_entries * pp_context->urb.size_vfe_entry;
-    assert(pp_context->urb.cs_start + 
-           pp_context->urb.num_cs_entries * pp_context->urb.size_cs_entry <= URB_SIZE((&i965->intel)));
+       pp_context->urb.vfe_start = 0;
+       pp_context->urb.cs_start = pp_context->urb.vfe_start + 
+            pp_context->urb.num_vfe_entries * pp_context->urb.size_vfe_entry;
+       assert(pp_context->urb.cs_start +
+           pp_context->urb.num_cs_entries * pp_context->urb.size_cs_entry <= URB_SIZE((&i965->intel)));
+    } else {
+       pp_context->vfe_gpu_state.max_num_threads = 60;
+       pp_context->vfe_gpu_state.num_urb_entries = 59;
+       pp_context->vfe_gpu_state.gpgpu_mode = 0;
+       pp_context->vfe_gpu_state.urb_entry_size = 16 - 1;
+       pp_context->vfe_gpu_state.curbe_allocation_size = VPP_CURBE_ALLOCATION_SIZE;
+    }
+    
  
      assert(NUM_PP_MODULES == ARRAY_ELEMS(pp_modules_gen5));
      assert(NUM_PP_MODULES == ARRAY_ELEMS(pp_modules_gen6));
diff --git a/src/i965_post_processing.h b/src/i965_post_processing.h

index 9b2d7c6..f399cbb 100755 (executable)
--- a/src/i965_post_processing.h
+++ b/src/i965_post_processing.h
@@ -477,6 +477,15 @@ struct i965_post_processing_context
          unsigned int size_cs_entry;
      } urb;
  
+    struct {
+        unsigned int gpgpu_mode : 1;
+        unsigned int pad0 : 7;
+        unsigned int max_num_threads : 16;
+        unsigned int num_urb_entries : 8;
+        unsigned int urb_entry_size : 16;
+        unsigned int curbe_allocation_size : 16;
+    } vfe_gpu_state;
+
      struct pp_load_save_context pp_load_save_context;
      struct pp_scaling_context pp_scaling_context;
      struct pp_avs_context pp_avs_context;
author	Zhao Yakui <yakui.zhao@intel.com>
	Thu, 11 Apr 2013 05:09:21 +0000 (13:09 +0800)
committer	Xiang, Haihao <haihao.xiang@intel.com>
	Thu, 27 Feb 2014 02:05:15 +0000 (10:05 +0800)
src/i965_post_processing.c		patch \| blob \| history
src/i965_post_processing.h		patch \| blob \| history