Davinci: SPI performance enhancements
authorNick Thompson <nick.thompson@ge.com>
Tue, 22 Jun 2010 15:06:01 +0000 (11:06 -0400)
committerSandeep Paulraj <s-paulraj@ti.com>
Tue, 22 Jun 2010 15:06:01 +0000 (11:06 -0400)
commit77436d6696127dcaa9049db47b000da7f2b8e85e
tree8c28644c9af6e06cda097acb0d0964c2bad70215
parente6441c4f4070aac6825f5b195f38dfe1da53675c
Davinci: SPI performance enhancements

The following restructuring and optimisations increase the SPI
read performance from 1.3MiB/s (on da850) to 2.87MiB/s (on da830):

Remove continual revaluation of driver state from the core of the
copy loop. State can not change during the copy loop, so it is
possible to move these evaluations to before the copy loop.

Cost is more code space as loop variants are required for each set
of possible configurations. The loops are simpler however, so the
extra is only 128bytes on da830 with CONFIG_SPI_HALF_DUPLEX
defined.

Unrolling the first copy loop iteration allows the TX buffer to be
pre-loaded reducing SPI clock starvation.

Unrolling the last copy loop iteration removes testing for the
final loop iteration every time round the loop.

Using the RX buffer empty flag as a transfer throttle allows the
assumption that it is always safe to write to the TX buffer, so
polling of TX buffer full flag can be removed.

Signed-off-by: Nick Thompson <nick.thompson@ge.com>
Signed-off-by: Sandeep Paulraj <s-paulraj@ti.com>
drivers/spi/davinci_spi.c