neon variance: process 16 values at a time
authorJohann <johannkoenig@google.com>
Mon, 1 May 2017 21:10:54 +0000 (14:10 -0700)
committerJohann Koenig <johannkoenig@google.com>
Mon, 8 May 2017 18:48:55 +0000 (18:48 +0000)
commitf7d1486f4890431a49802817818a5ae0a4c3c8dc
tree319a7f0bf2485077f406e969d931ddb9943cfdcb
parent1814463864a338b87305099f13d4938a8b3db822
neon variance: process 16 values at a time

Read in a Q register. Works on blocks of 16 and larger.

Improvement of about 20% for 64x64. The smaller blocks are faster, but
don't have quite the same level of improvement. 16x32 is only about 5%

BUG=webm:1422

Change-Id: Ie11a877c7b839e66690a48117a46657b2ac82d4b
vpx_dsp/arm/variance_neon.c