Some minor optimizations for cost_coeffs().
authorRonald S. Bultje <rbultje@google.com>
Fri, 28 Jun 2013 03:57:37 +0000 (20:57 -0700)
committerRonald S. Bultje <rbultje@google.com>
Fri, 28 Jun 2013 17:29:02 +0000 (10:29 -0700)
commit91d223bd5c3ece5edc28d048a866d1c0fb39bdc7
treea6eb292d764dc1edbc2e9f8ece0f4a52d9e30968
parentaf660715c01fc5403700c49686885b2f0ee6133b
Some minor optimizations for cost_coeffs().

Cycle timings for first 3 frames of bus (speed 0) at 1500kbps:
4x4: 298 -> 234 cycles
8x8: 1227 -> 878 cycles
16x16: 23426 -> 18134 cycles
32x32: 4906 -> 3664 cycles

Total encode time of first 50 frames of bus @ 1500kbps (speed 0) goes
from 3min0.7 to 2min51.6 seconds, i.e. 5.3% faster.

Change-Id: I68a0e1b530b0563b84a67342cca4b45146077e95
vp9/encoder/vp9_block.h
vp9/encoder/vp9_encodemb.c
vp9/encoder/vp9_rdopt.c