i965: Split shader_time entries into separate cachelines.
authorEric Anholt <eric@anholt.net>
Mon, 11 Mar 2013 19:59:06 +0000 (12:59 -0700)
committerEric Anholt <eric@anholt.net>
Thu, 14 Mar 2013 19:30:39 +0000 (12:30 -0700)
commitdb3a0f13ef13b6d392dfc3b7346351533600d343
tree125d3429874389addc521226419a20f3b539a3d0
parenta35a19a6ea7248d98282f87244138299fa130c85
i965: Split shader_time entries into separate cachelines.

This avoids some snooping overhead between EUs processing separate shaders
(so VS versus FS).

Improves performance of a minecraft trace with shader_time by 28.9% +/-
18.3% (n=7), and performance of my old GLSL demo by 93.7% +/- 0.8% (n=4).

v2: Add a define for the stride with a comment explaining its units and
    why.

Reviewed-by: Kenneth Graunke <kenneth@whitecape.org>
src/mesa/drivers/dri/i965/brw_context.h
src/mesa/drivers/dri/i965/brw_fs.cpp
src/mesa/drivers/dri/i965/brw_program.c
src/mesa/drivers/dri/i965/brw_vec4.cpp