src/cairo-wideint.c

   1 /* cairo - a vector graphics library with display and print output
   2  *
   3  * Copyright © 2004 Keith Packard
   4  *
   5  * This library is free software; you can redistribute it and/or
   6  * modify it either under the terms of the GNU Lesser General Public
   7  * License version 2.1 as published by the Free Software Foundation
   8  * (the "LGPL") or, at your option, under the terms of the Mozilla
   9  * Public License Version 1.1 (the "MPL"). If you do not alter this
  10  * notice, a recipient may use your version of this file under either
  11  * the MPL or the LGPL.
  12  *
  13  * You should have received a copy of the LGPL along with this library
  14  * in the file COPYING-LGPL-2.1; if not, write to the Free Software
  15  * Foundation, Inc., 51 Franklin Street, Suite 500, Boston, MA 02110-1335, USA
  16  * You should have received a copy of the MPL along with this library
  17  * in the file COPYING-MPL-1.1
  18  *
  19  * The contents of this file are subject to the Mozilla Public License
  20  * Version 1.1 (the "License"); you may not use this file except in
  21  * compliance with the License. You may obtain a copy of the License at
  22  * http://www.mozilla.org/MPL/
  23  *
  24  * This software is distributed on an "AS IS" basis, WITHOUT WARRANTY
  25  * OF ANY KIND, either express or implied. See the LGPL or the MPL for
  26  * the specific language governing rights and limitations.
  27  *
  28  * The Original Code is the cairo graphics library.
  29  *
  30  * The Initial Developer of the Original Code is Keith Packard
  31  *
  32  * Contributor(s):
  33  *      Keith R. Packard <keithp@keithp.com>
  34  */
  35
  36 #include "cairoint.h"
  37
  38 #if HAVE_UINT64_T
  39
  40 #define uint64_lo32(i)  ((i) & 0xffffffff)
  41 #define uint64_hi32(i)  ((i) >> 32)
  42 #define uint64_lo(i)    ((i) & 0xffffffff)
  43 #define uint64_hi(i)    ((i) >> 32)
  44 #define uint64_shift32(i)   ((i) << 32)
  45 #define uint64_carry32  (((uint64_t) 1) << 32)
  46
  47 #define _cairo_uint32s_to_uint64(h,l) ((uint64_t) (h) << 32 | (l))
  48
  49 #else
  50
  51 #define uint64_lo32(i)  ((i).lo)
  52 #define uint64_hi32(i)  ((i).hi)
  53
  54 static cairo_uint64_t
  55 uint64_lo (cairo_uint64_t i)
  56 {
  57     cairo_uint64_t  s;
  58
  59     s.lo = i.lo;
  60     s.hi = 0;
  61     return s;
  62 }
  63
  64 static cairo_uint64_t
  65 uint64_hi (cairo_uint64_t i)
  66 {
  67     cairo_uint64_t  s;
  68
  69     s.lo = i.hi;
  70     s.hi = 0;
  71     return s;
  72 }
  73
  74 static cairo_uint64_t
  75 uint64_shift32 (cairo_uint64_t i)
  76 {
  77     cairo_uint64_t  s;
  78
  79     s.lo = 0;
  80     s.hi = i.lo;
  81     return s;
  82 }
  83
  84 static const cairo_uint64_t uint64_carry32 = { 0, 1 };
  85
  86 cairo_uint64_t
  87 _cairo_double_to_uint64 (double i)
  88 {
  89     cairo_uint64_t      q;
  90
  91     q.hi = i * (1. / 4294967296.);
  92     q.lo = i - q.hi * 4294967296.;
  93     return q;
  94 }
  95
  96 double
  97 _cairo_uint64_to_double (cairo_uint64_t i)
  98 {
  99     return i.hi * 4294967296. + i.lo;
 100 }
 101
 102 cairo_int64_t
 103 _cairo_double_to_int64 (double i)
 104 {
 105     cairo_uint64_t      q;
 106
 107     q.hi = i * (1. / INT32_MAX);
 108     q.lo = i - q.hi * (double)INT32_MAX;
 109     return q;
 110 }
 111
 112 double
 113 _cairo_int64_to_double (cairo_int64_t i)
 114 {
 115     return i.hi * INT32_MAX + i.lo;
 116 }
 117
 118 cairo_uint64_t
 119 _cairo_uint32_to_uint64 (uint32_t i)
 120 {
 121     cairo_uint64_t      q;
 122
 123     q.lo = i;
 124     q.hi = 0;
 125     return q;
 126 }
 127
 128 cairo_int64_t
 129 _cairo_int32_to_int64 (int32_t i)
 130 {
 131     cairo_uint64_t      q;
 132
 133     q.lo = i;
 134     q.hi = i < 0 ? -1 : 0;
 135     return q;
 136 }
 137
 138 static cairo_uint64_t
 139 _cairo_uint32s_to_uint64 (uint32_t h, uint32_t l)
 140 {
 141     cairo_uint64_t      q;
 142
 143     q.lo = l;
 144     q.hi = h;
 145     return q;
 146 }
 147
 148 cairo_uint64_t
 149 _cairo_uint64_add (cairo_uint64_t a, cairo_uint64_t b)
 150 {
 151     cairo_uint64_t      s;
 152
 153     s.hi = a.hi + b.hi;
 154     s.lo = a.lo + b.lo;
 155     if (s.lo < a.lo)
 156         s.hi++;
 157     return s;
 158 }
 159
 160 cairo_uint64_t
 161 _cairo_uint64_sub (cairo_uint64_t a, cairo_uint64_t b)
 162 {
 163     cairo_uint64_t      s;
 164
 165     s.hi = a.hi - b.hi;
 166     s.lo = a.lo - b.lo;
 167     if (s.lo > a.lo)
 168         s.hi--;
 169     return s;
 170 }
 171
 172 #define uint32_lo(i)    ((i) & 0xffff)
 173 #define uint32_hi(i)    ((i) >> 16)
 174 #define uint32_carry16  ((1) << 16)
 175
 176 cairo_uint64_t
 177 _cairo_uint32x32_64_mul (uint32_t a, uint32_t b)
 178 {
 179     cairo_uint64_t  s;
 180
 181     uint16_t    ah, al, bh, bl;
 182     uint32_t    r0, r1, r2, r3;
 183
 184     al = uint32_lo (a);
 185     ah = uint32_hi (a);
 186     bl = uint32_lo (b);
 187     bh = uint32_hi (b);
 188
 189     r0 = (uint32_t) al * bl;
 190     r1 = (uint32_t) al * bh;
 191     r2 = (uint32_t) ah * bl;
 192     r3 = (uint32_t) ah * bh;
 193
 194     r1 += uint32_hi(r0);    /* no carry possible */
 195     r1 += r2;               /* but this can carry */
 196     if (r1 < r2)            /* check */
 197         r3 += uint32_carry16;
 198
 199     s.hi = r3 + uint32_hi(r1);
 200     s.lo = (uint32_lo (r1) << 16) + uint32_lo (r0);
 201     return s;
 202 }
 203
 204 cairo_int64_t
 205 _cairo_int32x32_64_mul (int32_t a, int32_t b)
 206 {
 207     cairo_int64_t s;
 208     s = _cairo_uint32x32_64_mul ((uint32_t) a, (uint32_t) b);
 209     if (a < 0)
 210         s.hi -= b;
 211     if (b < 0)
 212         s.hi -= a;
 213     return s;
 214 }
 215
 216 cairo_uint64_t
 217 _cairo_uint64_mul (cairo_uint64_t a, cairo_uint64_t b)
 218 {
 219     cairo_uint64_t      s;
 220
 221     s = _cairo_uint32x32_64_mul (a.lo, b.lo);
 222     s.hi += a.lo * b.hi + a.hi * b.lo;
 223     return s;
 224 }
 225
 226 cairo_uint64_t
 227 _cairo_uint64_lsl (cairo_uint64_t a, int shift)
 228 {
 229     if (shift >= 32)
 230     {
 231         a.hi = a.lo;
 232         a.lo = 0;
 233         shift -= 32;
 234     }
 235     if (shift)
 236     {
 237         a.hi = a.hi << shift | a.lo >> (32 - shift);
 238         a.lo = a.lo << shift;
 239     }
 240     return a;
 241 }
 242
 243 cairo_uint64_t
 244 _cairo_uint64_rsl (cairo_uint64_t a, int shift)
 245 {
 246     if (shift >= 32)
 247     {
 248         a.lo = a.hi;
 249         a.hi = 0;
 250         shift -= 32;
 251     }
 252     if (shift)
 253     {
 254         a.lo = a.lo >> shift | a.hi << (32 - shift);
 255         a.hi = a.hi >> shift;
 256     }
 257     return a;
 258 }
 259
 260 #define _cairo_uint32_rsa(a,n)  ((uint32_t) (((int32_t) (a)) >> (n)))
 261
 262 cairo_int64_t
 263 _cairo_uint64_rsa (cairo_int64_t a, int shift)
 264 {
 265     if (shift >= 32)
 266     {
 267         a.lo = a.hi;
 268         a.hi = _cairo_uint32_rsa (a.hi, 31);
 269         shift -= 32;
 270     }
 271     if (shift)
 272     {
 273         a.lo = a.lo >> shift | a.hi << (32 - shift);
 274         a.hi = _cairo_uint32_rsa (a.hi, shift);
 275     }
 276     return a;
 277 }
 278
 279 int
 280 _cairo_uint64_lt (cairo_uint64_t a, cairo_uint64_t b)
 281 {
 282     return (a.hi < b.hi ||
 283             (a.hi == b.hi && a.lo < b.lo));
 284 }
 285
 286 int
 287 _cairo_uint64_eq (cairo_uint64_t a, cairo_uint64_t b)
 288 {
 289     return a.hi == b.hi && a.lo == b.lo;
 290 }
 291
 292 int
 293 _cairo_int64_lt (cairo_int64_t a, cairo_int64_t b)
 294 {
 295     if (_cairo_int64_negative (a) && !_cairo_int64_negative (b))
 296         return 1;
 297     if (!_cairo_int64_negative (a) && _cairo_int64_negative (b))
 298         return 0;
 299     return _cairo_uint64_lt (a, b);
 300 }
 301
 302 int
 303 _cairo_uint64_cmp (cairo_uint64_t a, cairo_uint64_t b)
 304 {
 305     if (a.hi < b.hi)
 306         return -1;
 307     else if (a.hi > b.hi)
 308         return 1;
 309     else if (a.lo < b.lo)
 310         return -1;
 311     else if (a.lo > b.lo)
 312         return 1;
 313     else
 314         return 0;
 315 }
 316
 317 int
 318 _cairo_int64_cmp (cairo_int64_t a, cairo_int64_t b)
 319 {
 320     if (_cairo_int64_negative (a) && !_cairo_int64_negative (b))
 321         return -1;
 322     if (!_cairo_int64_negative (a) && _cairo_int64_negative (b))
 323         return 1;
 324
 325     return _cairo_uint64_cmp (a, b);
 326 }
 327
 328 cairo_uint64_t
 329 _cairo_uint64_not (cairo_uint64_t a)
 330 {
 331     a.lo = ~a.lo;
 332     a.hi = ~a.hi;
 333     return a;
 334 }
 335
 336 cairo_uint64_t
 337 _cairo_uint64_negate (cairo_uint64_t a)
 338 {
 339     a.lo = ~a.lo;
 340     a.hi = ~a.hi;
 341     if (++a.lo == 0)
 342         ++a.hi;
 343     return a;
 344 }
 345
 346 /*
 347  * Simple bit-at-a-time divide.
 348  */
 349 cairo_uquorem64_t
 350 _cairo_uint64_divrem (cairo_uint64_t num, cairo_uint64_t den)
 351 {
 352     cairo_uquorem64_t   qr;
 353     cairo_uint64_t      bit;
 354     cairo_uint64_t      quo;
 355
 356     bit = _cairo_uint32_to_uint64 (1);
 357
 358     /* normalize to make den >= num, but not overflow */
 359     while (_cairo_uint64_lt (den, num) && (den.hi & 0x80000000) == 0)
 360     {
 361         bit = _cairo_uint64_lsl (bit, 1);
 362         den = _cairo_uint64_lsl (den, 1);
 363     }
 364     quo = _cairo_uint32_to_uint64 (0);
 365
 366     /* generate quotient, one bit at a time */
 367     while (bit.hi | bit.lo)
 368     {
 369         if (_cairo_uint64_le (den, num))
 370         {
 371             num = _cairo_uint64_sub (num, den);
 372             quo = _cairo_uint64_add (quo, bit);
 373         }
 374         bit = _cairo_uint64_rsl (bit, 1);
 375         den = _cairo_uint64_rsl (den, 1);
 376     }
 377     qr.quo = quo;
 378     qr.rem = num;
 379     return qr;
 380 }
 381
 382 #endif /* !HAVE_UINT64_T */
 383
 384 #if HAVE_UINT128_T
 385 cairo_uquorem128_t
 386 _cairo_uint128_divrem (cairo_uint128_t num, cairo_uint128_t den)
 387 {
 388     cairo_uquorem128_t  qr;
 389
 390     qr.quo = num / den;
 391     qr.rem = num % den;
 392     return qr;
 393 }
 394
 395 #else
 396
 397 cairo_uint128_t
 398 _cairo_uint32_to_uint128 (uint32_t i)
 399 {
 400     cairo_uint128_t     q;
 401
 402     q.lo = _cairo_uint32_to_uint64 (i);
 403     q.hi = _cairo_uint32_to_uint64 (0);
 404     return q;
 405 }
 406
 407 cairo_int128_t
 408 _cairo_int32_to_int128 (int32_t i)
 409 {
 410     cairo_int128_t      q;
 411
 412     q.lo = _cairo_int32_to_int64 (i);
 413     q.hi = _cairo_int32_to_int64 (i < 0 ? -1 : 0);
 414     return q;
 415 }
 416
 417 cairo_uint128_t
 418 _cairo_uint64_to_uint128 (cairo_uint64_t i)
 419 {
 420     cairo_uint128_t     q;
 421
 422     q.lo = i;
 423     q.hi = _cairo_uint32_to_uint64 (0);
 424     return q;
 425 }
 426
 427 cairo_int128_t
 428 _cairo_int64_to_int128 (cairo_int64_t i)
 429 {
 430     cairo_int128_t      q;
 431
 432     q.lo = i;
 433     q.hi = _cairo_int32_to_int64 (_cairo_int64_negative(i) ? -1 : 0);
 434     return q;
 435 }
 436
 437 cairo_uint128_t
 438 _cairo_uint128_add (cairo_uint128_t a, cairo_uint128_t b)
 439 {
 440     cairo_uint128_t     s;
 441
 442     s.hi = _cairo_uint64_add (a.hi, b.hi);
 443     s.lo = _cairo_uint64_add (a.lo, b.lo);
 444     if (_cairo_uint64_lt (s.lo, a.lo))
 445         s.hi = _cairo_uint64_add (s.hi, _cairo_uint32_to_uint64 (1));
 446     return s;
 447 }
 448
 449 cairo_uint128_t
 450 _cairo_uint128_sub (cairo_uint128_t a, cairo_uint128_t b)
 451 {
 452     cairo_uint128_t     s;
 453
 454     s.hi = _cairo_uint64_sub (a.hi, b.hi);
 455     s.lo = _cairo_uint64_sub (a.lo, b.lo);
 456     if (_cairo_uint64_gt (s.lo, a.lo))
 457         s.hi = _cairo_uint64_sub (s.hi, _cairo_uint32_to_uint64(1));
 458     return s;
 459 }
 460
 461 cairo_uint128_t
 462 _cairo_uint64x64_128_mul (cairo_uint64_t a, cairo_uint64_t b)
 463 {
 464     cairo_uint128_t     s;
 465     uint32_t            ah, al, bh, bl;
 466     cairo_uint64_t      r0, r1, r2, r3;
 467
 468     al = uint64_lo32 (a);
 469     ah = uint64_hi32 (a);
 470     bl = uint64_lo32 (b);
 471     bh = uint64_hi32 (b);
 472
 473     r0 = _cairo_uint32x32_64_mul (al, bl);
 474     r1 = _cairo_uint32x32_64_mul (al, bh);
 475     r2 = _cairo_uint32x32_64_mul (ah, bl);
 476     r3 = _cairo_uint32x32_64_mul (ah, bh);
 477
 478     r1 = _cairo_uint64_add (r1, uint64_hi (r0));    /* no carry possible */
 479     r1 = _cairo_uint64_add (r1, r2);                /* but this can carry */
 480     if (_cairo_uint64_lt (r1, r2))                  /* check */
 481         r3 = _cairo_uint64_add (r3, uint64_carry32);
 482
 483     s.hi = _cairo_uint64_add (r3, uint64_hi(r1));
 484     s.lo = _cairo_uint64_add (uint64_shift32 (r1),
 485                                 uint64_lo (r0));
 486     return s;
 487 }
 488
 489 cairo_int128_t
 490 _cairo_int64x64_128_mul (cairo_int64_t a, cairo_int64_t b)
 491 {
 492     cairo_int128_t  s;
 493     s = _cairo_uint64x64_128_mul (_cairo_int64_to_uint64(a),
 494                                   _cairo_int64_to_uint64(b));
 495     if (_cairo_int64_negative (a))
 496         s.hi = _cairo_uint64_sub (s.hi,
 497                                   _cairo_int64_to_uint64 (b));
 498     if (_cairo_int64_negative (b))
 499         s.hi = _cairo_uint64_sub (s.hi,
 500                                   _cairo_int64_to_uint64 (a));
 501     return s;
 502 }
 503
 504 cairo_uint128_t
 505 _cairo_uint128_mul (cairo_uint128_t a, cairo_uint128_t b)
 506 {
 507     cairo_uint128_t     s;
 508
 509     s = _cairo_uint64x64_128_mul (a.lo, b.lo);
 510     s.hi = _cairo_uint64_add (s.hi,
 511                                 _cairo_uint64_mul (a.lo, b.hi));
 512     s.hi = _cairo_uint64_add (s.hi,
 513                                 _cairo_uint64_mul (a.hi, b.lo));
 514     return s;
 515 }
 516
 517 cairo_uint128_t
 518 _cairo_uint128_lsl (cairo_uint128_t a, int shift)
 519 {
 520     if (shift >= 64)
 521     {
 522         a.hi = a.lo;
 523         a.lo = _cairo_uint32_to_uint64 (0);
 524         shift -= 64;
 525     }
 526     if (shift)
 527     {
 528         a.hi = _cairo_uint64_add (_cairo_uint64_lsl (a.hi, shift),
 529                                     _cairo_uint64_rsl (a.lo, (64 - shift)));
 530         a.lo = _cairo_uint64_lsl (a.lo, shift);
 531     }
 532     return a;
 533 }
 534
 535 cairo_uint128_t
 536 _cairo_uint128_rsl (cairo_uint128_t a, int shift)
 537 {
 538     if (shift >= 64)
 539     {
 540         a.lo = a.hi;
 541         a.hi = _cairo_uint32_to_uint64 (0);
 542         shift -= 64;
 543     }
 544     if (shift)
 545     {
 546         a.lo = _cairo_uint64_add (_cairo_uint64_rsl (a.lo, shift),
 547                                     _cairo_uint64_lsl (a.hi, (64 - shift)));
 548         a.hi = _cairo_uint64_rsl (a.hi, shift);
 549     }
 550     return a;
 551 }
 552
 553 cairo_uint128_t
 554 _cairo_uint128_rsa (cairo_int128_t a, int shift)
 555 {
 556     if (shift >= 64)
 557     {
 558         a.lo = a.hi;
 559         a.hi = _cairo_uint64_rsa (a.hi, 64-1);
 560         shift -= 64;
 561     }
 562     if (shift)
 563     {
 564         a.lo = _cairo_uint64_add (_cairo_uint64_rsl (a.lo, shift),
 565                                     _cairo_uint64_lsl (a.hi, (64 - shift)));
 566         a.hi = _cairo_uint64_rsa (a.hi, shift);
 567     }
 568     return a;
 569 }
 570
 571 int
 572 _cairo_uint128_lt (cairo_uint128_t a, cairo_uint128_t b)
 573 {
 574     return (_cairo_uint64_lt (a.hi, b.hi) ||
 575             (_cairo_uint64_eq (a.hi, b.hi) &&
 576              _cairo_uint64_lt (a.lo, b.lo)));
 577 }
 578
 579 int
 580 _cairo_int128_lt (cairo_int128_t a, cairo_int128_t b)
 581 {
 582     if (_cairo_int128_negative (a) && !_cairo_int128_negative (b))
 583         return 1;
 584     if (!_cairo_int128_negative (a) && _cairo_int128_negative (b))
 585         return 0;
 586     return _cairo_uint128_lt (a, b);
 587 }
 588
 589 int
 590 _cairo_uint128_cmp (cairo_uint128_t a, cairo_uint128_t b)
 591 {
 592     int cmp;
 593
 594     cmp = _cairo_uint64_cmp (a.hi, b.hi);
 595     if (cmp)
 596         return cmp;
 597     return _cairo_uint64_cmp (a.lo, b.lo);
 598 }
 599
 600 int
 601 _cairo_int128_cmp (cairo_int128_t a, cairo_int128_t b)
 602 {
 603     if (_cairo_int128_negative (a) && !_cairo_int128_negative (b))
 604         return -1;
 605     if (!_cairo_int128_negative (a) && _cairo_int128_negative (b))
 606         return 1;
 607
 608     return _cairo_uint128_cmp (a, b);
 609 }
 610
 611 int
 612 _cairo_uint128_eq (cairo_uint128_t a, cairo_uint128_t b)
 613 {
 614     return (_cairo_uint64_eq (a.hi, b.hi) &&
 615             _cairo_uint64_eq (a.lo, b.lo));
 616 }
 617
 618 #if HAVE_UINT64_T
 619 #define _cairo_msbset64(q)  (q & ((uint64_t) 1 << 63))
 620 #else
 621 #define _cairo_msbset64(q)  (q.hi & ((uint32_t) 1 << 31))
 622 #endif
 623
 624 cairo_uquorem128_t
 625 _cairo_uint128_divrem (cairo_uint128_t num, cairo_uint128_t den)
 626 {
 627     cairo_uquorem128_t  qr;
 628     cairo_uint128_t     bit;
 629     cairo_uint128_t     quo;
 630
 631     bit = _cairo_uint32_to_uint128 (1);
 632
 633     /* normalize to make den >= num, but not overflow */
 634     while (_cairo_uint128_lt (den, num) && !_cairo_msbset64(den.hi))
 635     {
 636         bit = _cairo_uint128_lsl (bit, 1);
 637         den = _cairo_uint128_lsl (den, 1);
 638     }
 639     quo = _cairo_uint32_to_uint128 (0);
 640
 641     /* generate quotient, one bit at a time */
 642     while (_cairo_uint128_ne (bit, _cairo_uint32_to_uint128(0)))
 643     {
 644         if (_cairo_uint128_le (den, num))
 645         {
 646             num = _cairo_uint128_sub (num, den);
 647             quo = _cairo_uint128_add (quo, bit);
 648         }
 649         bit = _cairo_uint128_rsl (bit, 1);
 650         den = _cairo_uint128_rsl (den, 1);
 651     }
 652     qr.quo = quo;
 653     qr.rem = num;
 654     return qr;
 655 }
 656
 657 cairo_uint128_t
 658 _cairo_uint128_negate (cairo_uint128_t a)
 659 {
 660     a.lo = _cairo_uint64_not (a.lo);
 661     a.hi = _cairo_uint64_not (a.hi);
 662     return _cairo_uint128_add (a, _cairo_uint32_to_uint128 (1));
 663 }
 664
 665 cairo_uint128_t
 666 _cairo_uint128_not (cairo_uint128_t a)
 667 {
 668     a.lo = _cairo_uint64_not (a.lo);
 669     a.hi = _cairo_uint64_not (a.hi);
 670     return a;
 671 }
 672
 673 #endif /* !HAVE_UINT128_T */
 674
 675 cairo_quorem128_t
 676 _cairo_int128_divrem (cairo_int128_t num, cairo_int128_t den)
 677 {
 678     int                 num_neg = _cairo_int128_negative (num);
 679     int                 den_neg = _cairo_int128_negative (den);
 680     cairo_uquorem128_t  uqr;
 681     cairo_quorem128_t   qr;
 682
 683     if (num_neg)
 684         num = _cairo_int128_negate (num);
 685     if (den_neg)
 686         den = _cairo_int128_negate (den);
 687     uqr = _cairo_uint128_divrem (num, den);
 688     if (num_neg)
 689         qr.rem = _cairo_int128_negate (uqr.rem);
 690     else
 691         qr.rem = uqr.rem;
 692     if (num_neg != den_neg)
 693         qr.quo = _cairo_int128_negate (uqr.quo);
 694     else
 695         qr.quo = uqr.quo;
 696     return qr;
 697 }
 698
 699 /**
 700  * _cairo_uint_96by64_32x64_divrem:
 701  *
 702  * Compute a 32 bit quotient and 64 bit remainder of a 96 bit unsigned
 703  * dividend and 64 bit divisor.  If the quotient doesn't fit into 32
 704  * bits then the returned remainder is equal to the divisor, and the
 705  * quotient is the largest representable 64 bit integer.  It is an
 706  * error to call this function with the high 32 bits of @num being
 707  * non-zero.
 708  **/
 709 cairo_uquorem64_t
 710 _cairo_uint_96by64_32x64_divrem (cairo_uint128_t num,
 711                                  cairo_uint64_t den)
 712 {
 713     cairo_uquorem64_t result;
 714     cairo_uint64_t B = _cairo_uint32s_to_uint64 (1, 0);
 715
 716     /* These are the high 64 bits of the *96* bit numerator.  We're
 717      * going to represent the numerator as xB + y, where x is a 64,
 718      * and y is a 32 bit number. */
 719     cairo_uint64_t x = _cairo_uint128_to_uint64 (_cairo_uint128_rsl(num, 32));
 720
 721     /* Initialise the result to indicate overflow. */
 722     result.quo = _cairo_uint32s_to_uint64 (-1U, -1U);
 723     result.rem = den;
 724
 725     /* Don't bother if the quotient is going to overflow. */
 726     if (_cairo_uint64_ge (x, den)) {
 727         return /* overflow */ result;
 728     }
 729
 730     if (_cairo_uint64_lt (x, B)) {
 731         /* When the final quotient is known to fit in 32 bits, then
 732          * num < 2^64 if and only if den < 2^32. */
 733         return _cairo_uint64_divrem (_cairo_uint128_to_uint64 (num), den);
 734     }
 735     else {
 736         /* Denominator is >= 2^32. the numerator is >= 2^64, and the
 737          * division won't overflow: need two divrems.  Write the
 738          * numerator and denominator as
 739          *
 740          *      num = xB + y            x : 64 bits, y : 32 bits
 741          *      den = uB + v            u, v : 32 bits
 742          */
 743         uint32_t y = _cairo_uint128_to_uint32 (num);
 744         uint32_t u = uint64_hi32 (den);
 745         uint32_t v = _cairo_uint64_to_uint32 (den);
 746
 747         /* Compute a lower bound approximate quotient of num/den
 748          * from x/(u+1).  Then we have
 749          *
 750          * x    = q(u+1) + r    ; q : 32 bits, r <= u : 32 bits.
 751          *
 752          * xB + y       = q(u+1)B       + (rB+y)
 753          *              = q(uB + B + v - v) + (rB+y)
 754          *              = q(uB + v)     + qB - qv + (rB+y)
 755          *              = q(uB + v)     + q(B-v) + (rB+y)
 756          *
 757          * The true quotient of num/den then is q plus the
 758          * contribution of q(B-v) + (rB+y).  The main contribution
 759          * comes from the term q(B-v), with the term (rB+y) only
 760          * contributing at most one part.
 761          *
 762          * The term q(B-v) must fit into 64 bits, since q fits into 32
 763          * bits on account of being a lower bound to the true
 764          * quotient, and as B-v <= 2^32, we may safely use a single
 765          * 64/64 bit division to find its contribution. */
 766
 767         cairo_uquorem64_t quorem;
 768         cairo_uint64_t remainder; /* will contain final remainder */
 769         uint32_t quotient;      /* will contain final quotient. */
 770         uint32_t q;
 771         uint32_t r;
 772
 773         /* Approximate quotient by dividing the high 64 bits of num by
 774          * u+1. Watch out for overflow of u+1. */
 775         if (u+1) {
 776             quorem = _cairo_uint64_divrem (x, _cairo_uint32_to_uint64 (u+1));
 777             q = _cairo_uint64_to_uint32 (quorem.quo);
 778             r = _cairo_uint64_to_uint32 (quorem.rem);
 779         }
 780         else {
 781             q = uint64_hi32 (x);
 782             r = _cairo_uint64_to_uint32 (x);
 783         }
 784         quotient = q;
 785
 786         /* Add the main term's contribution to quotient.  Note B-v =
 787          * -v as an uint32 (unless v = 0) */
 788         if (v)
 789             quorem = _cairo_uint64_divrem (_cairo_uint32x32_64_mul (q, -v), den);
 790         else
 791             quorem = _cairo_uint64_divrem (_cairo_uint32s_to_uint64 (q, 0), den);
 792         quotient += _cairo_uint64_to_uint32 (quorem.quo);
 793
 794         /* Add the contribution of the subterm and start computing the
 795          * true remainder. */
 796         remainder = _cairo_uint32s_to_uint64 (r, y);
 797         if (_cairo_uint64_ge (remainder, den)) {
 798             remainder = _cairo_uint64_sub (remainder, den);
 799             quotient++;
 800         }
 801
 802         /* Add the contribution of the main term's remainder. The
 803          * funky test here checks that remainder + main_rem >= den,
 804          * taking into account overflow of the addition. */
 805         remainder = _cairo_uint64_add (remainder, quorem.rem);
 806         if (_cairo_uint64_ge (remainder, den) ||
 807             _cairo_uint64_lt (remainder, quorem.rem))
 808         {
 809             remainder = _cairo_uint64_sub (remainder, den);
 810             quotient++;
 811         }
 812
 813         result.quo = _cairo_uint32_to_uint64 (quotient);
 814         result.rem = remainder;
 815     }
 816     return result;
 817 }
 818
 819 cairo_quorem64_t
 820 _cairo_int_96by64_32x64_divrem (cairo_int128_t num, cairo_int64_t den)
 821 {
 822     int                 num_neg = _cairo_int128_negative (num);
 823     int                 den_neg = _cairo_int64_negative (den);
 824     cairo_uint64_t      nonneg_den;
 825     cairo_uquorem64_t   uqr;
 826     cairo_quorem64_t    qr;
 827
 828     if (num_neg)
 829         num = _cairo_int128_negate (num);
 830     if (den_neg)
 831         nonneg_den = _cairo_int64_negate (den);
 832     else
 833         nonneg_den = den;
 834
 835     uqr = _cairo_uint_96by64_32x64_divrem (num, nonneg_den);
 836     if (_cairo_uint64_eq (uqr.rem, nonneg_den)) {
 837         /* bail on overflow. */
 838         qr.quo = _cairo_uint32s_to_uint64 (0x7FFFFFFF, -1U);
 839         qr.rem = den;
 840         return qr;
 841     }
 842
 843     if (num_neg)
 844         qr.rem = _cairo_int64_negate (uqr.rem);
 845     else
 846         qr.rem = uqr.rem;
 847     if (num_neg != den_neg)
 848         qr.quo = _cairo_int64_negate (uqr.quo);
 849     else
 850         qr.quo = uqr.quo;
 851     return qr;
 852 }