ARM: use common macro template for bilinear scaled 'src_8888_8888'
authorSiarhei Siamashka <siarhei.siamashka@nokia.com>
Wed, 9 Mar 2011 09:46:48 +0000 (11:46 +0200)
committerSiarhei Siamashka <siarhei.siamashka@nokia.com>
Sat, 12 Mar 2011 19:30:05 +0000 (21:30 +0200)
commit11a0c5badbc59ce967707ef836313cc98f8aec4e
tree56ca2e675a4e1b9d7d7fdc2d3fb4f4f49925569b
parent34098dba6763afd3636a14f9c2a079ab08f23b2d
ARM: use common macro template for bilinear scaled 'src_8888_8888'

This is a cleanup for old and now duplicated code. The performance improvement
is mostly coming from the enabled use of software prefetch, but instructions
scheduling is also slightly better.

Benchmark on ARM Cortex-A8 r2p2 @1GHz, 32-bit LPDDR @200MHz:
 Microbenchmark (scaling 2000x2000 image with scale factor close to 1x):
  before: op=1, src=20028888, dst=20028888, speed=53.24 MPix/s
  after:  op=1, src=20028888, dst=20028888, speed=74.36 MPix/s
pixman/pixman-arm-neon-asm.S