gallivm: Increase lp_build_rsqrt() precision.
authorJosé Fonseca <jfonseca@vmware.com>
Wed, 20 Jul 2011 21:41:17 +0000 (14:41 -0700)
committerJosé Fonseca <jfonseca@vmware.com>
Sat, 23 Jul 2011 01:52:09 +0000 (18:52 -0700)
Add an iteration step, which makes rqsqrt precision go from 12bits to
24, and fixes RSQ/NRM test case of PSPrecision/VSPrevision DCTs.

There are no uses of this function outside shader translation.

src/gallium/auxiliary/gallivm/lp_bld_arit.c

index 06e5deb..fce4685 100644 (file)
@@ -1645,7 +1645,7 @@ lp_build_rsqrt(struct lp_build_context *bld,
    assert(type.floating);
 
    if (util_cpu_caps.has_sse && type.width == 32 && type.length == 4) {
-      const unsigned num_iterations = 0;
+      const unsigned num_iterations = 1;
       LLVMValueRef res;
       unsigned i;