Inline xform_quant() in encode_block_intra().
authorRonald S. Bultje <rbultje@google.com>
Thu, 11 Jul 2013 18:35:13 +0000 (11:35 -0700)
committerRonald S. Bultje <rbultje@google.com>
Mon, 15 Jul 2013 23:00:42 +0000 (16:00 -0700)
commit6fb418741faa990a61dbcae8d35a0959727ade57
treee05b4e9578d825c447ea087acf16751a90f40554
parent2c317298395d359308aaa2d87d99c650cdff6b31
Inline xform_quant() in encode_block_intra().

Also inline some of the block calculations to assist the compiler to
not do silly things like calculating the same offset (or converting
between raster/transform block offset or block, mi and pixel unit)
many, many, many times.

Cycle times:
4x4:     584 ->   505 cycles (16% faster)
8x8:    1651 ->  1560 cycles (6% faster)
16x16:  7897 ->  7704 cycles (2.5% faster)
32x32: 16096 -> 15852 cycles (1.5% faster)

Overall, this saves about 0.5 seconds (1min49.8 -> 1min49.3) on the
first 50 frames of bus (speed 0) @ 1500kbps, i.e. 0.5% overall.

Change-Id: If3dd62453f8e2ab9d4ee616bc4ea956fb8874b80
vp9/encoder/vp9_encodemb.c