add_rpmdb: copy solvables a bit faster
[platform/upstream/libsolv.git] / ext / repo_rpmdb.c
1 /*
2  * Copyright (c) 2007-2012, Novell Inc.
3  *
4  * This program is licensed under the BSD license, read LICENSE.BSD
5  * for further information
6  */
7
8 /*
9  * repo_rpmdb
10  *
11  * convert rpm db to repo
12  *
13  */
14
15 #include <sys/types.h>
16 #include <sys/stat.h>
17 #include <limits.h>
18 #include <fcntl.h>
19 #include <stdio.h>
20 #include <stdlib.h>
21 #include <string.h>
22 #include <unistd.h>
23 #include <assert.h>
24 #include <stdint.h>
25 #include <errno.h>
26
27 #include <rpm/rpmio.h>
28 #include <rpm/rpmpgp.h>
29 #ifndef RPM5
30 #include <rpm/header.h>
31 #endif
32 #include <rpm/rpmdb.h>
33
34 #ifndef DB_CREATE
35 # if defined(SUSE) || defined(HAVE_RPM_DB_H)
36 #  include <rpm/db.h>
37 # else
38 #  include <db.h>
39 # endif
40 #endif
41
42 #include "pool.h"
43 #include "repo.h"
44 #include "hash.h"
45 #include "util.h"
46 #include "queue.h"
47 #include "chksum.h"
48 #include "repo_rpmdb.h"
49 #include "repo_solv.h"
50
51 /* 3: added triggers */
52 /* 4: fixed triggers */
53 #define RPMDB_COOKIE_VERSION 4
54
55 #define TAG_NAME                1000
56 #define TAG_VERSION             1001
57 #define TAG_RELEASE             1002
58 #define TAG_EPOCH               1003
59 #define TAG_SUMMARY             1004
60 #define TAG_DESCRIPTION         1005
61 #define TAG_BUILDTIME           1006
62 #define TAG_BUILDHOST           1007
63 #define TAG_INSTALLTIME         1008
64 #define TAG_SIZE                1009
65 #define TAG_DISTRIBUTION        1010
66 #define TAG_VENDOR              1011
67 #define TAG_LICENSE             1014
68 #define TAG_PACKAGER            1015
69 #define TAG_GROUP               1016
70 #define TAG_URL                 1020
71 #define TAG_ARCH                1022
72 #define TAG_FILESIZES           1028
73 #define TAG_FILEMODES           1030
74 #define TAG_FILEMD5S            1035
75 #define TAG_FILELINKTOS         1036
76 #define TAG_FILEFLAGS           1037
77 #define TAG_SOURCERPM           1044
78 #define TAG_PROVIDENAME         1047
79 #define TAG_REQUIREFLAGS        1048
80 #define TAG_REQUIRENAME         1049
81 #define TAG_REQUIREVERSION      1050
82 #define TAG_NOSOURCE            1051
83 #define TAG_NOPATCH             1052
84 #define TAG_CONFLICTFLAGS       1053
85 #define TAG_CONFLICTNAME        1054
86 #define TAG_CONFLICTVERSION     1055
87 #define TAG_TRIGGERNAME         1066
88 #define TAG_TRIGGERVERSION      1067
89 #define TAG_TRIGGERFLAGS        1068
90 #define TAG_CHANGELOGTIME       1080
91 #define TAG_CHANGELOGNAME       1081
92 #define TAG_CHANGELOGTEXT       1082
93 #define TAG_OBSOLETENAME        1090
94 #define TAG_FILEDEVICES         1095
95 #define TAG_FILEINODES          1096
96 #define TAG_SOURCEPACKAGE       1106
97 #define TAG_PROVIDEFLAGS        1112
98 #define TAG_PROVIDEVERSION      1113
99 #define TAG_OBSOLETEFLAGS       1114
100 #define TAG_OBSOLETEVERSION     1115
101 #define TAG_DIRINDEXES          1116
102 #define TAG_BASENAMES           1117
103 #define TAG_DIRNAMES            1118
104 #define TAG_PAYLOADFORMAT       1124
105 #define TAG_PATCHESNAME         1133
106 #define TAG_FILECOLORS          1140
107 #define TAG_SUGGESTSNAME        1156
108 #define TAG_SUGGESTSVERSION     1157
109 #define TAG_SUGGESTSFLAGS       1158
110 #define TAG_ENHANCESNAME        1159
111 #define TAG_ENHANCESVERSION     1160
112 #define TAG_ENHANCESFLAGS       1161
113
114 /* rpm5 tags */
115 #define TAG_DISTEPOCH           1218
116
117 /* rpm4 tags */
118 #define TAG_LONGFILESIZES       5008
119 #define TAG_LONGSIZE            5009
120
121 /* signature tags */
122 #define TAG_SIGBASE             256
123 #define TAG_SIGMD5              (TAG_SIGBASE + 5)
124 #define TAG_SHA1HEADER          (TAG_SIGBASE + 13)
125
126 #define SIGTAG_SIZE             1000
127 #define SIGTAG_PGP              1002    /* RSA signature */
128 #define SIGTAG_MD5              1004    /* header+payload md5 checksum */
129 #define SIGTAG_GPG              1005    /* DSA signature */
130
131 #define DEP_LESS                (1 << 1)
132 #define DEP_GREATER             (1 << 2)
133 #define DEP_EQUAL               (1 << 3)
134 #define DEP_STRONG              (1 << 27)
135 #define DEP_PRE                 ((1 << 6) | (1 << 9) | (1 << 10) | (1 << 11) | (1 << 12))
136
137 #define FILEFLAG_GHOST          (1 <<  6)
138
139
140 #ifdef RPM5
141 # define RPM_INDEX_SIZE 4
142 #else
143 # define RPM_INDEX_SIZE 8
144 #endif
145
146
147 typedef struct rpmhead {
148   int cnt;
149   int dcnt;
150   unsigned char *dp;
151   int forcebinary;              /* sigh */
152   unsigned char data[1];
153 } RpmHead;
154
155
156 static inline unsigned char *
157 headfindtag(RpmHead *h, int tag)
158 {
159   unsigned int i;
160   unsigned char *d, taga[4];
161   d = h->dp - 16;
162   taga[0] = tag >> 24;
163   taga[1] = tag >> 16;
164   taga[2] = tag >> 8;
165   taga[3] = tag;
166   for (i = 0; i < h->cnt; i++, d -= 16)
167     if (d[3] == taga[3] && d[2] == taga[2] && d[1] == taga[1] && d[0] == taga[0])
168       return d;
169   return 0;
170 }
171
172 static int
173 headexists(RpmHead *h, int tag)
174 {
175   return headfindtag(h, tag) ? 1 : 0;
176 }
177
178 static unsigned int *
179 headint32array(RpmHead *h, int tag, int *cnt)
180 {
181   unsigned int i, o, *r;
182   unsigned char *d = headfindtag(h, tag);
183
184   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 4)
185     return 0;
186   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
187   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
188   if (o + 4 * i > h->dcnt)
189     return 0;
190   d = h->dp + o;
191   r = solv_calloc(i ? i : 1, sizeof(unsigned int));
192   if (cnt)
193     *cnt = i;
194   for (o = 0; o < i; o++, d += 4)
195     r[o] = d[0] << 24 | d[1] << 16 | d[2] << 8 | d[3];
196   return r;
197 }
198
199 /* returns the first entry of an integer array */
200 static unsigned int
201 headint32(RpmHead *h, int tag)
202 {
203   unsigned int i, o;
204   unsigned char *d = headfindtag(h, tag);
205
206   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 4)
207     return 0;
208   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
209   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
210   if (i == 0 || o + 4 * i > h->dcnt)
211     return 0;
212   d = h->dp + o;
213   return d[0] << 24 | d[1] << 16 | d[2] << 8 | d[3];
214 }
215
216 /* returns the first entry of an 64bit integer array */
217 static unsigned long long
218 headint64(RpmHead *h, int tag)
219 {
220   unsigned int i, o;
221   unsigned char *d = headfindtag(h, tag);
222   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 5)
223     return 0;
224   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
225   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
226   if (i == 0 || o + 8 * i > h->dcnt)
227     return 0;
228   d = h->dp + o;
229   i = d[0] << 24 | d[1] << 16 | d[2] << 8 | d[3];
230   return (unsigned long long)i << 32 | (d[4] << 24 | d[5] << 16 | d[6] << 8 | d[7]);
231 }
232
233 static unsigned int *
234 headint16array(RpmHead *h, int tag, int *cnt)
235 {
236   unsigned int i, o, *r;
237   unsigned char *d = headfindtag(h, tag);
238
239   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 3)
240     return 0;
241   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
242   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
243   if (o + 4 * i > h->dcnt)
244     return 0;
245   d = h->dp + o;
246   r = solv_calloc(i ? i : 1, sizeof(unsigned int));
247   if (cnt)
248     *cnt = i;
249   for (o = 0; o < i; o++, d += 2)
250     r[o] = d[0] << 8 | d[1];
251   return r;
252 }
253
254 static char *
255 headstring(RpmHead *h, int tag)
256 {
257   unsigned int o;
258   unsigned char *d = headfindtag(h, tag);
259   /* 6: STRING, 9: I18NSTRING */
260   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || (d[7] != 6 && d[7] != 9))
261     return 0;
262   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
263   if (o >= h->dcnt)
264     return 0;
265   return (char *)h->dp + o;
266 }
267
268 static char **
269 headstringarray(RpmHead *h, int tag, int *cnt)
270 {
271   unsigned int i, o;
272   unsigned char *d = headfindtag(h, tag);
273   char **r;
274
275   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 8)
276     return 0;
277   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
278   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
279   r = solv_calloc(i ? i : 1, sizeof(char *));
280   if (cnt)
281     *cnt = i;
282   d = h->dp + o;
283   for (o = 0; o < i; o++)
284     {
285       r[o] = (char *)d;
286       if (o + 1 < i)
287         d += strlen((char *)d) + 1;
288       if (d >= h->dp + h->dcnt)
289         {
290           solv_free(r);
291           return 0;
292         }
293     }
294   return r;
295 }
296
297 static unsigned char *
298 headbinary(RpmHead *h, int tag, unsigned int *sizep)
299 {
300   unsigned int i, o;
301   unsigned char *d = headfindtag(h, tag);
302   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 7)
303     return 0;
304   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
305   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
306   if (o > h->dcnt || o + i < o || o + i > h->dcnt)
307     return 0;
308   if (sizep)
309     *sizep = i;
310   return h->dp + o;
311 }
312
313 static char *headtoevr(RpmHead *h)
314 {
315   unsigned int epoch;
316   char *version, *v;
317   char *release;
318   char *evr;
319   char *distepoch;
320
321   version  = headstring(h, TAG_VERSION);
322   release  = headstring(h, TAG_RELEASE);
323   epoch = headint32(h, TAG_EPOCH);
324   if (!version || !release)
325     {
326       fprintf(stderr, "headtoevr: bad rpm header\n");
327       return 0;
328     }
329   for (v = version; *v >= '0' && *v <= '9'; v++)
330     ;
331   if (epoch || (v != version && *v == ':'))
332     {
333       char epochbuf[11];        /* 32bit decimal will fit in */
334       sprintf(epochbuf, "%u", epoch);
335       evr = solv_malloc(strlen(epochbuf) + 1 + strlen(version) + 1 + strlen(release) + 1);
336       sprintf(evr, "%s:%s-%s", epochbuf, version, release);
337     }
338   else
339     {
340       evr = solv_malloc(strlen(version) + 1 + strlen(release) + 1);
341       sprintf(evr, "%s-%s", version, release);
342     }
343   distepoch = headstring(h, TAG_DISTEPOCH);
344   if (distepoch && *distepoch)
345     {
346       int l = strlen(evr);
347       evr = solv_realloc(evr, l + strlen(distepoch) + 2);
348       evr[l++] = ':';
349       strcpy(evr + l, distepoch);
350     }
351   return evr;
352 }
353
354
355 static void
356 setutf8string(Repodata *repodata, Id handle, Id tag, const char *str)
357 {
358   const unsigned char *cp;
359   int state = 0;
360   int c;
361   unsigned char *buf = 0, *bp;
362
363   /* check if it's already utf8, code taken from screen ;-) */
364   cp = (const unsigned char *)str;
365   while ((c = *cp++) != 0)
366     {
367       if (state)
368         {
369           if ((c & 0xc0) != 0x80)
370             break; /* encoding error */
371           c = (c & 0x3f) | (state << 6);
372           if (!(state & 0x40000000))
373             {
374               /* check for overlong sequences */
375               if ((c & 0x820823e0) == 0x80000000)
376                 break;
377               else if ((c & 0x020821f0) == 0x02000000)
378                 break;
379               else if ((c & 0x000820f8) == 0x00080000)
380                 break;
381               else if ((c & 0x0000207c) == 0x00002000)
382                 break;
383             }
384         }
385       else
386         {
387           /* new sequence */
388           if (c >= 0xfe)
389             break;
390           else if (c >= 0xfc)
391             c = (c & 0x01) | 0xbffffffc;    /* 5 bytes to follow */
392           else if (c >= 0xf8)
393             c = (c & 0x03) | 0xbfffff00;    /* 4 */
394           else if (c >= 0xf0)
395             c = (c & 0x07) | 0xbfffc000;    /* 3 */
396           else if (c >= 0xe0)
397             c = (c & 0x0f) | 0xbff00000;    /* 2 */
398           else if (c >= 0xc2)
399             c = (c & 0x1f) | 0xfc000000;    /* 1 */
400           else if (c >= 0x80)
401             break;
402         }
403       state = (c & 0x80000000) ? c : 0;
404     }
405   if (c)
406     {
407       /* not utf8, assume latin1 */
408       buf = solv_malloc(2 * strlen(str) + 1);
409       cp = (const unsigned char *)str;
410       str = (char *)buf;
411       bp = buf;
412       while ((c = *cp++) != 0)
413         {
414           if (c >= 0xc0)
415             {
416               *bp++ = 0xc3;
417               c ^= 0x80;
418             }
419           else if (c >= 0x80)
420             *bp++ = 0xc2;
421           *bp++ = c;
422         }
423       *bp++ = 0;
424     }
425   repodata_set_str(repodata, handle, tag, str);
426   if (buf)
427     solv_free(buf);
428 }
429
430
431 #define MAKEDEPS_FILTER_WEAK    (1 << 0)
432 #define MAKEDEPS_FILTER_STRONG  (1 << 1)
433 #define MAKEDEPS_NO_RPMLIB      (1 << 2)
434
435 /*
436  * strong: 0: ignore strongness
437  *         1: filter to strong
438  *         2: filter to weak
439  */
440 static unsigned int
441 makedeps(Pool *pool, Repo *repo, RpmHead *rpmhead, int tagn, int tagv, int tagf, int flags)
442 {
443   char **n, **v;
444   unsigned int *f;
445   int i, cc, nc, vc, fc;
446   int haspre;
447   unsigned int olddeps;
448   Id *ida;
449   int strong;
450
451   strong = flags & (MAKEDEPS_FILTER_STRONG|MAKEDEPS_FILTER_WEAK);
452   n = headstringarray(rpmhead, tagn, &nc);
453   if (!n || !nc)
454     return 0;
455   vc = fc = 0;
456   v = headstringarray(rpmhead, tagv, &vc);
457   f = headint32array(rpmhead, tagf, &fc);
458   if (!v || !f || nc != vc || nc != fc)
459     {
460       char *pkgname = rpm_query(rpmhead, 0);
461       pool_error(pool, 0, "bad dependency entries for %s: %d %d %d", pkgname ? pkgname : "<NULL>", nc, vc, fc);
462       solv_free(pkgname);
463       solv_free(n);
464       solv_free(v);
465       solv_free(f);
466       return 0;
467     }
468
469   cc = nc;
470   haspre = 0;   /* add no prereq marker */
471   if (flags)
472     {
473       /* we do filtering */
474       cc = 0;
475       for (i = 0; i < nc; i++)
476         {
477           if (strong && (f[i] & DEP_STRONG) != (strong == MAKEDEPS_FILTER_WEAK ? 0 : DEP_STRONG))
478             continue;
479           if ((flags & MAKEDEPS_NO_RPMLIB) != 0)
480             if (!strncmp(n[i], "rpmlib(", 7))
481               continue;
482           if ((f[i] & DEP_PRE) != 0)
483             haspre = 1;
484           cc++;
485         }
486     }
487   else if (tagn == TAG_REQUIRENAME)
488     {
489       /* no filtering, just look for the first prereq */
490       for (i = 0; i < nc; i++)
491         if ((f[i] & DEP_PRE) != 0)
492           {
493             haspre = 1;
494             break;
495           }
496     }
497   if (cc == 0)
498     {
499       solv_free(n);
500       solv_free(v);
501       solv_free(f);
502       return 0;
503     }
504   cc += haspre;
505   olddeps = repo_reserve_ids(repo, 0, cc);
506   ida = repo->idarraydata + olddeps;
507   for (i = 0; ; i++)
508     {
509       if (i == nc)
510         {
511           if (haspre != 1)
512             break;
513           haspre = 2;   /* pass two: prereqs */
514           i = 0;
515           *ida++ = SOLVABLE_PREREQMARKER;
516         }
517       if (strong && (f[i] & DEP_STRONG) != (strong == MAKEDEPS_FILTER_WEAK ? 0 : DEP_STRONG))
518         continue;
519       if (haspre == 1 && (f[i] & DEP_PRE) != 0)
520         continue;
521       if (haspre == 2 && (f[i] & DEP_PRE) == 0)
522         continue;
523       if ((flags & MAKEDEPS_NO_RPMLIB) != 0)
524         if (!strncmp(n[i], "rpmlib(", 7))
525           continue;
526       if (f[i] & (DEP_LESS|DEP_GREATER|DEP_EQUAL))
527         {
528           Id name, evr;
529           int flags = 0;
530           if ((f[i] & DEP_LESS) != 0)
531             flags |= 4;
532           if ((f[i] & DEP_EQUAL) != 0)
533             flags |= 2;
534           if ((f[i] & DEP_GREATER) != 0)
535             flags |= 1;
536           name = pool_str2id(pool, n[i], 1);
537           if (v[i][0] == '0' && v[i][1] == ':' && v[i][2])
538             evr = pool_str2id(pool, v[i] + 2, 1);
539           else
540             evr = pool_str2id(pool, v[i], 1);
541           *ida++ = pool_rel2id(pool, name, evr, flags, 1);
542         }
543       else
544         *ida++ = pool_str2id(pool, n[i], 1);
545     }
546   *ida++ = 0;
547   repo->idarraysize += cc + 1;
548   solv_free(n);
549   solv_free(v);
550   solv_free(f);
551   return olddeps;
552 }
553
554
555 static void
556 adddudata(Repodata *data, Id handle, RpmHead *rpmhead, char **dn, unsigned int *di, int fc, int dc)
557 {
558   Id did;
559   int i, fszc;
560   unsigned int *fkb, *fn, *fsz, *fm, *fino;
561   unsigned int inotest[256], inotestok;
562
563   if (!fc)
564     return;
565   /* XXX: use TAG_LONGFILESIZES if available */
566   fsz = headint32array(rpmhead, TAG_FILESIZES, &fszc);
567   if (!fsz || fc != fszc)
568     {
569       solv_free(fsz);
570       return;
571     }
572   /* stupid rpm records sizes of directories, so we have to check the mode */
573   fm = headint16array(rpmhead, TAG_FILEMODES, &fszc);
574   if (!fm || fc != fszc)
575     {
576       solv_free(fsz);
577       solv_free(fm);
578       return;
579     }
580   fino = headint32array(rpmhead, TAG_FILEINODES, &fszc);
581   if (!fino || fc != fszc)
582     {
583       solv_free(fsz);
584       solv_free(fm);
585       solv_free(fino);
586       return;
587     }
588   inotestok = 0;
589   if (fc < sizeof(inotest))
590     {
591       memset(inotest, 0, sizeof(inotest));
592       for (i = 0; i < fc; i++)
593         {
594           int off, bit;
595           if (fsz[i] == 0 || !S_ISREG(fm[i]))
596             continue;
597           off = (fino[i] >> 5) & (sizeof(inotest)/sizeof(*inotest) - 1);
598           bit = 1 << (fino[i] & 31);
599           if ((inotest[off] & bit) != 0)
600             break;
601           inotest[off] |= bit;
602         }
603       if (i == fc)
604         inotestok = 1;
605     }
606   if (!inotestok)
607     {
608       unsigned int *fdev = headint32array(rpmhead, TAG_FILEDEVICES, &fszc);
609       unsigned int *fx, j;
610       unsigned int mask, hash, hh;
611       if (!fdev || fc != fszc)
612         {
613           solv_free(fsz);
614           solv_free(fm);
615           solv_free(fdev);
616           solv_free(fino);
617           return;
618         }
619       mask = fc;
620       while ((mask & (mask - 1)) != 0)
621         mask = mask & (mask - 1);
622       mask <<= 2;
623       if (mask > sizeof(inotest)/sizeof(*inotest))
624         fx = solv_calloc(mask, sizeof(unsigned int));
625       else
626         {
627           fx = inotest;
628           memset(fx, 0, mask * sizeof(unsigned int));
629         }
630       mask--;
631       for (i = 0; i < fc; i++)
632         {
633           if (fsz[i] == 0 || !S_ISREG(fm[i]))
634             continue;
635           hash = (fino[i] + fdev[i] * 31) & mask;
636           hh = 7;
637           while ((j = fx[hash]) != 0)
638             {
639               if (fino[j - 1] == fino[i] && fdev[j - 1] == fdev[i])
640                 {
641                   fsz[i] = 0;   /* kill entry */
642                   break;
643                 }
644               hash = (hash + hh++) & mask;
645             }
646           if (!j)
647             fx[hash] = i + 1;
648         }
649       if (fx != inotest)
650         solv_free(fx);
651       solv_free(fdev);
652     }
653   solv_free(fino);
654   fn = solv_calloc(dc, sizeof(unsigned int));
655   fkb = solv_calloc(dc, sizeof(unsigned int));
656   for (i = 0; i < fc; i++)
657     {
658       if (di[i] >= dc)
659         continue;
660       fn[di[i]]++;
661       if (fsz[i] == 0 || !S_ISREG(fm[i]))
662         continue;
663       fkb[di[i]] += fsz[i] / 1024 + 1;
664     }
665   solv_free(fsz);
666   solv_free(fm);
667   /* commit */
668   for (i = 0; i < dc; i++)
669     {
670       if (!fn[i])
671         continue;
672       if (!*dn[i])
673         {
674           Solvable *s = data->repo->pool->solvables + handle;
675           if (s->arch == ARCH_SRC || s->arch == ARCH_NOSRC)
676             did = repodata_str2dir(data, "/usr/src", 1);
677           else
678             continue;   /* work around rpm bug */
679         }
680       else
681         did = repodata_str2dir(data, dn[i], 1);
682       repodata_add_dirnumnum(data, handle, SOLVABLE_DISKUSAGE, did, fkb[i], fn[i]);
683     }
684   solv_free(fn);
685   solv_free(fkb);
686 }
687
688 static void
689 addfilelist(Repodata *data, Id handle, RpmHead *rpmhead)
690 {
691   char **bn;
692   char **dn;
693   unsigned int *di;
694   int bnc, dnc, dic;
695   int i;
696   Id lastdid = 0;
697   int lastdii = -1;
698
699   if (!data)
700     return;
701   bn = headstringarray(rpmhead, TAG_BASENAMES, &bnc);
702   if (!bn)
703     return;
704   dn = headstringarray(rpmhead, TAG_DIRNAMES, &dnc);
705   if (!dn)
706     {
707       solv_free(bn);
708       return;
709     }
710   di = headint32array(rpmhead, TAG_DIRINDEXES, &dic);
711   if (!di)
712     {
713       solv_free(bn);
714       solv_free(dn);
715       return;
716     }
717   if (bnc != dic)
718     {
719       pool_error(data->repo->pool, 0, "bad filelist");
720       return;
721     }
722
723   adddudata(data, handle, rpmhead, dn, di, bnc, dnc);
724
725   for (i = 0; i < bnc; i++)
726     {
727       Id did;
728       char *b = bn[i];
729
730       if (di[i] == lastdii)
731         did = lastdid;
732       else
733         {
734           did = repodata_str2dir(data, dn[di[i]], 1);
735           if (!did)
736             did = repodata_str2dir(data, "/", 1);
737           lastdid = did;
738           lastdii = di[i];
739         }
740       if (b && *b == '/')       /* work around rpm bug */
741         b++;
742       repodata_add_dirstr(data, handle, SOLVABLE_FILELIST, did, b);
743     }
744   solv_free(bn);
745   solv_free(dn);
746   solv_free(di);
747 }
748
749 static void
750 addchangelog(Repodata *data, Id handle, RpmHead *rpmhead)
751 {
752   char **cn;
753   char **cx;
754   unsigned int *ct;
755   int i, cnc, cxc, ctc;
756   Queue hq;
757
758   ct = headint32array(rpmhead, TAG_CHANGELOGTIME, &ctc);
759   cx = headstringarray(rpmhead, TAG_CHANGELOGTEXT, &cxc);
760   cn = headstringarray(rpmhead, TAG_CHANGELOGNAME, &cnc);
761   if (!ct || !cx || !cn || !ctc || ctc != cxc || ctc != cnc)
762     {
763       solv_free(ct);
764       solv_free(cx);
765       solv_free(cn);
766       return;
767     }
768   queue_init(&hq);
769   for (i = 0; i < ctc; i++)
770     {
771       Id h = repodata_new_handle(data);
772       if (ct[i])
773         repodata_set_num(data, h, SOLVABLE_CHANGELOG_TIME, ct[i]);
774       if (cn[i])
775         repodata_set_str(data, h, SOLVABLE_CHANGELOG_AUTHOR, cn[i]);
776       if (cx[i])
777         repodata_set_str(data, h, SOLVABLE_CHANGELOG_TEXT, cx[i]);
778       queue_push(&hq, h);
779     }
780   for (i = 0; i < hq.count; i++)
781     repodata_add_flexarray(data, handle, SOLVABLE_CHANGELOG, hq.elements[i]);
782   queue_free(&hq);
783   solv_free(ct);
784   solv_free(cx);
785   solv_free(cn);
786 }
787
788
789 static int
790 rpm2solv(Pool *pool, Repo *repo, Repodata *data, Solvable *s, RpmHead *rpmhead, int flags)
791 {
792   char *name;
793   char *evr;
794   char *sourcerpm;
795
796   name = headstring(rpmhead, TAG_NAME);
797   if (!name)
798     {
799       pool_error(pool, 0, "package has no name");
800       return 0;
801     }
802   if (!strcmp(name, "gpg-pubkey"))
803     return 0;
804   s->name = pool_str2id(pool, name, 1);
805   sourcerpm = headstring(rpmhead, TAG_SOURCERPM);
806   if (sourcerpm || (rpmhead->forcebinary && !headexists(rpmhead, TAG_SOURCEPACKAGE)))
807     s->arch = pool_str2id(pool, headstring(rpmhead, TAG_ARCH), 1);
808   else
809     {
810       if (headexists(rpmhead, TAG_NOSOURCE) || headexists(rpmhead, TAG_NOPATCH))
811         s->arch = ARCH_NOSRC;
812       else
813         s->arch = ARCH_SRC;
814     }
815   if (!s->arch)
816     s->arch = ARCH_NOARCH;
817   evr = headtoevr(rpmhead);
818   s->evr = pool_str2id(pool, evr, 1);
819   s->vendor = pool_str2id(pool, headstring(rpmhead, TAG_VENDOR), 1);
820
821   s->provides = makedeps(pool, repo, rpmhead, TAG_PROVIDENAME, TAG_PROVIDEVERSION, TAG_PROVIDEFLAGS, 0);
822   if (s->arch != ARCH_SRC && s->arch != ARCH_NOSRC)
823     s->provides = repo_addid_dep(repo, s->provides, pool_rel2id(pool, s->name, s->evr, REL_EQ, 1), 0);
824   s->requires = makedeps(pool, repo, rpmhead, TAG_REQUIRENAME, TAG_REQUIREVERSION, TAG_REQUIREFLAGS, (flags & RPM_ADD_NO_RPMLIBREQS) ? MAKEDEPS_NO_RPMLIB : 0);
825   s->conflicts = makedeps(pool, repo, rpmhead, TAG_CONFLICTNAME, TAG_CONFLICTVERSION, TAG_CONFLICTFLAGS, 0);
826   s->obsoletes = makedeps(pool, repo, rpmhead, TAG_OBSOLETENAME, TAG_OBSOLETEVERSION, TAG_OBSOLETEFLAGS, 0);
827
828   s->recommends = makedeps(pool, repo, rpmhead, TAG_SUGGESTSNAME, TAG_SUGGESTSVERSION, TAG_SUGGESTSFLAGS, MAKEDEPS_FILTER_STRONG);
829   s->suggests = makedeps(pool, repo, rpmhead, TAG_SUGGESTSNAME, TAG_SUGGESTSVERSION, TAG_SUGGESTSFLAGS, MAKEDEPS_FILTER_WEAK);
830   s->supplements = makedeps(pool, repo, rpmhead, TAG_ENHANCESNAME, TAG_ENHANCESVERSION, TAG_ENHANCESFLAGS, MAKEDEPS_FILTER_STRONG);
831   s->enhances  = makedeps(pool, repo, rpmhead, TAG_ENHANCESNAME, TAG_ENHANCESVERSION, TAG_ENHANCESFLAGS, MAKEDEPS_FILTER_WEAK);
832   s->supplements = repo_fix_supplements(repo, s->provides, s->supplements, 0);
833   s->conflicts = repo_fix_conflicts(repo, s->conflicts);
834
835   if (data)
836     {
837       Id handle;
838       char *str;
839       unsigned int u32;
840       unsigned long long u64;
841
842       handle = s - pool->solvables;
843       str = headstring(rpmhead, TAG_SUMMARY);
844       if (str)
845         setutf8string(data, handle, SOLVABLE_SUMMARY, str);
846       str = headstring(rpmhead, TAG_DESCRIPTION);
847       if (str)
848         {
849           char *aut, *p;
850           for (aut = str; (aut = strchr(aut, '\n')) != 0; aut++)
851             if (!strncmp(aut, "\nAuthors:\n--------\n", 19))
852               break;
853           if (aut)
854             {
855               /* oh my, found SUSE special author section */
856               int l = aut - str;
857               str = solv_strdup(str);
858               aut = str + l;
859               str[l] = 0;
860               while (l > 0 && str[l - 1] == '\n')
861                 str[--l] = 0;
862               if (l)
863                 setutf8string(data, handle, SOLVABLE_DESCRIPTION, str);
864               p = aut + 19;
865               aut = str;        /* copy over */
866               while (*p == ' ' || *p == '\n')
867                 p++;
868               while (*p)
869                 {
870                   if (*p == '\n')
871                     {
872                       *aut++ = *p++;
873                       while (*p == ' ')
874                         p++;
875                       continue;
876                     }
877                   *aut++ = *p++;
878                 }
879               while (aut != str && aut[-1] == '\n')
880                 aut--;
881               *aut = 0;
882               if (*str)
883                 setutf8string(data, handle, SOLVABLE_AUTHORS, str);
884               free(str);
885             }
886           else if (*str)
887             setutf8string(data, handle, SOLVABLE_DESCRIPTION, str);
888         }
889       str = headstring(rpmhead, TAG_GROUP);
890       if (str)
891         repodata_set_poolstr(data, handle, SOLVABLE_GROUP, str);
892       str = headstring(rpmhead, TAG_LICENSE);
893       if (str)
894         repodata_set_poolstr(data, handle, SOLVABLE_LICENSE, str);
895       str = headstring(rpmhead, TAG_URL);
896       if (str)
897         repodata_set_str(data, handle, SOLVABLE_URL, str);
898       str = headstring(rpmhead, TAG_DISTRIBUTION);
899       if (str)
900         repodata_set_poolstr(data, handle, SOLVABLE_DISTRIBUTION, str);
901       str = headstring(rpmhead, TAG_PACKAGER);
902       if (str)
903         repodata_set_poolstr(data, handle, SOLVABLE_PACKAGER, str);
904       if ((flags & RPM_ADD_WITH_PKGID) != 0)
905         {
906           unsigned char *chksum;
907           unsigned int chksumsize;
908           chksum = headbinary(rpmhead, TAG_SIGMD5, &chksumsize);
909           if (chksum && chksumsize == 16)
910             repodata_set_bin_checksum(data, handle, SOLVABLE_PKGID, REPOKEY_TYPE_MD5, chksum);
911         }
912       if ((flags & RPM_ADD_WITH_HDRID) != 0)
913         {
914           str = headstring(rpmhead, TAG_SHA1HEADER);
915           if (str && strlen(str) == 40)
916             repodata_set_checksum(data, handle, SOLVABLE_HDRID, REPOKEY_TYPE_SHA1, str);
917           else if (str && strlen(str) == 64)
918             repodata_set_checksum(data, handle, SOLVABLE_HDRID, REPOKEY_TYPE_SHA256, str);
919         }
920       u32 = headint32(rpmhead, TAG_BUILDTIME);
921       if (u32)
922         repodata_set_num(data, handle, SOLVABLE_BUILDTIME, u32);
923       u32 = headint32(rpmhead, TAG_INSTALLTIME);
924       if (u32)
925         repodata_set_num(data, handle, SOLVABLE_INSTALLTIME, u32);
926       u64 = headint64(rpmhead, TAG_LONGSIZE);
927       if (u64)
928         repodata_set_num(data, handle, SOLVABLE_INSTALLSIZE, u64);
929       else
930         {
931           u32 = headint32(rpmhead, TAG_SIZE);
932           if (u32)
933             repodata_set_num(data, handle, SOLVABLE_INSTALLSIZE, u32);
934         }
935       if (sourcerpm)
936         repodata_set_sourcepkg(data, handle, sourcerpm);
937       if ((flags & RPM_ADD_TRIGGERS) != 0)
938         {
939           Id id, lastid;
940           unsigned int ida = makedeps(pool, repo, rpmhead, TAG_TRIGGERNAME, TAG_TRIGGERVERSION, TAG_TRIGGERFLAGS, 0);
941
942           lastid = 0;
943           for (; (id = repo->idarraydata[ida]) != 0; ida++)
944             {
945               /* we currently do not support rel ids in incore data, so
946                * strip off versioning information */
947               while (ISRELDEP(id))
948                 {
949                   Reldep *rd = GETRELDEP(pool, id);
950                   id = rd->name;
951                 }
952               if (id == lastid)
953                 continue;
954               repodata_add_idarray(data, handle, SOLVABLE_TRIGGERS, id);
955               lastid = id;
956             }
957         }
958       if ((flags & RPM_ADD_NO_FILELIST) == 0)
959         addfilelist(data, handle, rpmhead);
960       if ((flags & RPM_ADD_WITH_CHANGELOG) != 0)
961         addchangelog(data, handle, rpmhead);
962     }
963   solv_free(evr);
964   return 1;
965 }
966
967
968 /******************************************************************/
969 /*  Rpm Database stuff
970  */
971
972 struct rpmdbstate {
973   Pool *pool; 
974   char *rootdir;
975
976   RpmHead *rpmhead;     /* header storage space */
977   int rpmheadsize;
978
979   int dbopened;
980   DB_ENV *dbenv;        /* database environment */
981   DB *db;               /* packages database */
982   int byteswapped;      /* endianess of packages database */
983 };
984
985 struct rpmdbentry {
986   Id rpmdbid;
987   Id nameoff;
988 };
989
990 #define ENTRIES_BLOCK 255
991 #define NAMEDATA_BLOCK 1023
992
993
994 static inline Id db2rpmdbid(unsigned char *db, int byteswapped)
995 {
996 #ifdef RPM5
997   return db[0] << 24 | db[1] << 16 | db[2] << 8 | db[3];
998 #else
999 # if defined(WORDS_BIGENDIAN)
1000   if (!byteswapped)
1001 # else
1002   if (byteswapped)
1003 # endif
1004     return db[0] << 24 | db[1] << 16 | db[2] << 8 | db[3];
1005   else
1006     return db[3] << 24 | db[2] << 16 | db[1] << 8 | db[0];
1007 #endif
1008 }
1009
1010 static inline void rpmdbid2db(unsigned char *db, Id id, int byteswapped)
1011 {
1012 #ifdef RPM5
1013   db[0] = id >> 24, db[1] = id >> 16, db[2] = id >> 8, db[3] = id;
1014 #else
1015 # if defined(WORDS_BIGENDIAN)
1016   if (!byteswapped)
1017 # else
1018   if (byteswapped)
1019 # endif
1020     db[0] = id >> 24, db[1] = id >> 16, db[2] = id >> 8, db[3] = id;
1021   else
1022     db[3] = id >> 24, db[2] = id >> 16, db[1] = id >> 8, db[0] = id;
1023 #endif
1024 }
1025
1026 /* should look in /usr/lib/rpm/macros instead, but we want speed... */
1027 static int
1028 opendbenv(struct rpmdbstate *state, const char *rootdir)
1029 {
1030   char dbpath[PATH_MAX];
1031   DB_ENV *dbenv = 0;
1032   int r;
1033
1034   if (db_env_create(&dbenv, 0))
1035     return pool_error(state->pool, 0, "db_env_create: %s", strerror(errno));
1036 #if defined(FEDORA) && (DB_VERSION_MAJOR >= 5 || (DB_VERSION_MAJOR == 4 && DB_VERSION_MINOR >= 5))
1037   dbenv->set_thread_count(dbenv, 8);
1038 #endif
1039   snprintf(dbpath, PATH_MAX, "%s/var/lib/rpm", rootdir ? rootdir : "");
1040   if (access(dbpath, W_OK) == -1)
1041     {
1042       r = dbenv->open(dbenv, dbpath, DB_CREATE|DB_PRIVATE|DB_INIT_MPOOL, 0);
1043     }
1044   else
1045     {
1046 #ifdef FEDORA
1047       r = dbenv->open(dbenv, dbpath, DB_CREATE|DB_INIT_CDB|DB_INIT_MPOOL, 0644);
1048 #else
1049       r = dbenv->open(dbenv, dbpath, DB_CREATE|DB_PRIVATE|DB_INIT_MPOOL, 0);
1050 #endif
1051     }
1052   if (r)
1053     {
1054       pool_error(state->pool, 0, "dbenv->open: %s", strerror(errno));
1055       dbenv->close(dbenv, 0);
1056       return 0;
1057     }
1058   state->dbenv = dbenv;
1059   return 1;
1060 }
1061
1062 static int
1063 openpkgdb(struct rpmdbstate *state)
1064 {
1065   if (state->dbopened)
1066     return state->dbopened > 0 ? 1 : 0;
1067   state->dbopened = -1;
1068   if (!state->dbenv && !opendbenv(state, state->rootdir))
1069     return 0;
1070   if (db_create(&state->db, state->dbenv, 0))
1071     {
1072       pool_error(state->pool, 0, "db_create: %s", strerror(errno));
1073       state->db = 0;
1074       state->dbenv->close(state->dbenv, 0);
1075       state->dbenv = 0;
1076       return 0;
1077     }
1078   if (state->db->open(state->db, 0, "Packages", 0, DB_UNKNOWN, DB_RDONLY, 0664))
1079     {
1080       pool_error(state->pool, 0, "db->open Packages: %s", strerror(errno));
1081       state->db->close(state->db, 0);
1082       state->db = 0;
1083       state->dbenv->close(state->dbenv, 0);
1084       state->dbenv = 0;
1085       return 0;
1086     }
1087   if (state->db->get_byteswapped(state->db, &state->byteswapped))
1088     {
1089       pool_error(state->pool, 0, "db->get_byteswapped: %s", strerror(errno));
1090       state->db->close(state->db, 0);
1091       state->db = 0;
1092       state->dbenv->close(state->dbenv, 0);
1093       state->dbenv = 0;
1094       return 0;
1095     }
1096   state->dbopened = 1;
1097   return 1;
1098 }
1099
1100 /* get the rpmdbids of all installed packages from the Name index database.
1101  * This is much faster then querying the big Packages database */
1102 static struct rpmdbentry *
1103 getinstalledrpmdbids(struct rpmdbstate *state, const char *index, const char *match, int *nentriesp, char **namedatap)
1104 {
1105   DB_ENV *dbenv = 0;
1106   DB *db = 0;
1107   DBC *dbc = 0;
1108   int byteswapped;
1109   DBT dbkey;
1110   DBT dbdata;
1111   unsigned char *dp;
1112   int dl;
1113   Id nameoff;
1114
1115   char *namedata = 0;
1116   int namedatal = 0;
1117   struct rpmdbentry *entries = 0;
1118   int nentries = 0;
1119
1120   *nentriesp = 0;
1121   if (namedatap)
1122     *namedatap = 0;
1123
1124   if (!state->dbenv && !opendbenv(state, state->rootdir))
1125     return 0;
1126   dbenv = state->dbenv;
1127   if (db_create(&db, dbenv, 0))
1128     {
1129       pool_error(state->pool, 0, "db_create: %s", strerror(errno));
1130       return 0;
1131     }
1132   if (db->open(db, 0, index, 0, DB_UNKNOWN, DB_RDONLY, 0664))
1133     {
1134       pool_error(state->pool, 0, "db->open %s: %s", index, strerror(errno));
1135       db->close(db, 0);
1136       return 0;
1137     }
1138   if (db->get_byteswapped(db, &byteswapped))
1139     {
1140       pool_error(state->pool, 0, "db->get_byteswapped: %s", strerror(errno));
1141       db->close(db, 0);
1142       return 0;
1143     }
1144   if (db->cursor(db, NULL, &dbc, 0))
1145     {
1146       pool_error(state->pool, 0, "db->cursor: %s", strerror(errno));
1147       db->close(db, 0);
1148       return 0;
1149     }
1150   memset(&dbkey, 0, sizeof(dbkey));
1151   memset(&dbdata, 0, sizeof(dbdata));
1152   if (match)
1153     {
1154       dbkey.data = (void *)match;
1155       dbkey.size = strlen(match);
1156     }
1157   while (dbc->c_get(dbc, &dbkey, &dbdata, match ? DB_SET : DB_NEXT) == 0)
1158     {
1159       if (!match && dbkey.size == 10 && !memcmp(dbkey.data, "gpg-pubkey", 10))
1160         continue;
1161       dl = dbdata.size;
1162       dp = dbdata.data;
1163       nameoff = namedatal;
1164       if (namedatap)
1165         {
1166           namedata = solv_extend(namedata, namedatal, dbkey.size + 1, 1, NAMEDATA_BLOCK);
1167           memcpy(namedata + namedatal, dbkey.data, dbkey.size);
1168           namedata[namedatal + dbkey.size] = 0;
1169           namedatal += dbkey.size + 1;
1170         }
1171       while(dl >= RPM_INDEX_SIZE)
1172         {
1173           entries = solv_extend(entries, nentries, 1, sizeof(*entries), ENTRIES_BLOCK);
1174           entries[nentries].rpmdbid = db2rpmdbid(dp, byteswapped);
1175           entries[nentries].nameoff = nameoff;
1176           nentries++;
1177           dp += RPM_INDEX_SIZE;
1178           dl -= RPM_INDEX_SIZE;
1179         }
1180       if (match)
1181         break;
1182     }
1183   dbc->c_close(dbc);
1184   db->close(db, 0);
1185   /* make sure that enteries is != 0 if there was no error */
1186   if (!entries)
1187     entries = solv_extend(entries, 1, 1, sizeof(*entries), ENTRIES_BLOCK);
1188   *nentriesp = nentries;
1189   if (namedatap)
1190     *namedatap = namedata;
1191   return entries;
1192 }
1193
1194 /* retrive header by rpmdbid */
1195 static int
1196 getrpmdbid(struct rpmdbstate *state, Id rpmdbid)
1197 {
1198   unsigned char buf[16];
1199   DBT dbkey;
1200   DBT dbdata;
1201   RpmHead *rpmhead;
1202
1203   if (!rpmdbid)
1204     {
1205       pool_error(state->pool, 0, "illegal rpmdbid");
1206       return -1;
1207     }
1208   if (state->dbopened != 1 && !openpkgdb(state))
1209     return -1;
1210   rpmdbid2db(buf, rpmdbid, state->byteswapped);
1211   memset(&dbkey, 0, sizeof(dbkey));
1212   memset(&dbdata, 0, sizeof(dbdata));
1213   dbkey.data = buf;
1214   dbkey.size = 4;
1215   dbdata.data = 0;
1216   dbdata.size = 0;
1217   if (state->db->get(state->db, NULL, &dbkey, &dbdata, 0))
1218     return 0;
1219   if (dbdata.size < 8)
1220     {
1221       pool_error(state->pool, 0, "corrupt rpm database (size)");
1222       return -1;
1223     }
1224   if (dbdata.size > state->rpmheadsize)
1225     {
1226       state->rpmheadsize = dbdata.size + 128;
1227       state->rpmhead = solv_realloc(state->rpmhead, sizeof(*rpmhead) + state->rpmheadsize);
1228     }
1229   rpmhead = state->rpmhead;
1230   memcpy(buf, dbdata.data, 8);
1231   rpmhead->forcebinary = 1;
1232   rpmhead->cnt = buf[0] << 24  | buf[1] << 16  | buf[2] << 8 | buf[3];
1233   rpmhead->dcnt = buf[4] << 24  | buf[5] << 16  | buf[6] << 8 | buf[7];
1234   if (8 + rpmhead->cnt * 16 + rpmhead->dcnt > dbdata.size)
1235     {
1236       pool_error(state->pool, 0, "corrupt rpm database (data size)");
1237       return -1;
1238     }
1239   memcpy(rpmhead->data, (unsigned char *)dbdata.data + 8, rpmhead->cnt * 16 + rpmhead->dcnt);
1240   rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
1241   return 1;
1242 }
1243
1244 /* retrive header by berkeleydb cursor */
1245 static Id
1246 getrpmcursor(struct rpmdbstate *state, DBC *dbc)
1247 {
1248   unsigned char buf[16];
1249   DBT dbkey;
1250   DBT dbdata;
1251   RpmHead *rpmhead;
1252   Id dbid;
1253
1254   memset(&dbkey, 0, sizeof(dbkey));
1255   memset(&dbdata, 0, sizeof(dbdata));
1256   while (dbc->c_get(dbc, &dbkey, &dbdata, DB_NEXT) == 0)
1257     {
1258       if (dbkey.size != 4)
1259         return pool_error(state->pool, -1, "corrupt Packages database (key size)");
1260       dbid = db2rpmdbid(dbkey.data, state->byteswapped);
1261       if (dbid == 0)            /* the join key */
1262         continue;
1263       if (dbdata.size < 8)
1264         return pool_error(state->pool, -1, "corrupt rpm database (size %u)\n", dbdata.size);
1265       if (dbdata.size > state->rpmheadsize)
1266         {
1267           state->rpmheadsize = dbdata.size + 128;
1268           state->rpmhead = solv_realloc(state->rpmhead, sizeof(*state->rpmhead) + state->rpmheadsize);
1269         }
1270       rpmhead = state->rpmhead;
1271       memcpy(buf, dbdata.data, 8);
1272       rpmhead->forcebinary = 1;
1273       rpmhead->cnt = buf[0] << 24  | buf[1] << 16  | buf[2] << 8 | buf[3];
1274       rpmhead->dcnt = buf[4] << 24  | buf[5] << 16  | buf[6] << 8 | buf[7];
1275       if (8 + rpmhead->cnt * 16 + rpmhead->dcnt > dbdata.size)
1276         return pool_error(state->pool, -1, "corrupt rpm database (data size)\n");
1277       memcpy(rpmhead->data, (unsigned char *)dbdata.data + 8, rpmhead->cnt * 16 + rpmhead->dcnt);
1278       rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
1279       return dbid;
1280     }
1281   return 0;
1282 }
1283
1284 static void
1285 freestate(struct rpmdbstate *state)
1286 {
1287   /* close down */
1288   if (!state)
1289     return;
1290   if (state->rootdir)
1291     solv_free(state->rootdir);
1292   if (state->db)
1293     state->db->close(state->db, 0);
1294   if (state->dbenv)
1295     state->dbenv->close(state->dbenv, 0);
1296   solv_free(state->rpmhead);
1297 }
1298
1299 void *
1300 rpm_state_create(Pool *pool, const char *rootdir)
1301 {
1302   struct rpmdbstate *state;
1303   state = solv_calloc(1, sizeof(*state));
1304   state->pool = pool;
1305   if (rootdir)
1306     state->rootdir = solv_strdup(rootdir);
1307   return state;
1308 }
1309
1310 void *
1311 rpm_state_free(void *state)
1312 {
1313   freestate(state);
1314   return solv_free(state);
1315 }
1316
1317 static int
1318 count_headers(Pool *pool, const char *rootdir, DB_ENV *dbenv)
1319 {
1320   char dbpath[PATH_MAX];
1321   struct stat statbuf;
1322   DB *db = 0;
1323   DBC *dbc = 0;
1324   int count = 0;
1325   DBT dbkey;
1326   DBT dbdata;
1327
1328   snprintf(dbpath, PATH_MAX, "%s/var/lib/rpm/Name", rootdir ? rootdir : "");
1329   if (stat(dbpath, &statbuf))
1330     return 0;
1331   memset(&dbkey, 0, sizeof(dbkey));
1332   memset(&dbdata, 0, sizeof(dbdata));
1333   if (db_create(&db, dbenv, 0))
1334     {
1335       pool_error(pool, 0, "db_create: %s", strerror(errno));
1336       return 0;
1337     }
1338   if (db->open(db, 0, "Name", 0, DB_UNKNOWN, DB_RDONLY, 0664))
1339     {
1340       pool_error(pool, 0, "db->open Name: %s", strerror(errno));
1341       db->close(db, 0);
1342       return 0;
1343     }
1344   if (db->cursor(db, NULL, &dbc, 0))
1345     {
1346       db->close(db, 0);
1347       pool_error(pool, 0, "db->cursor: %s", strerror(errno));
1348       return 0;
1349     }
1350   while (dbc->c_get(dbc, &dbkey, &dbdata, DB_NEXT) == 0)
1351     count += dbdata.size / RPM_INDEX_SIZE;
1352   dbc->c_close(dbc);
1353   db->close(db, 0);
1354   return count;
1355 }
1356
1357 /******************************************************************/
1358
1359 static Offset
1360 copydeps(Pool *pool, Repo *repo, Offset fromoff, Repo *fromrepo)
1361 {
1362   int cc;
1363   Id *ida, *from;
1364   Offset ido;
1365
1366   if (!fromoff)
1367     return 0;
1368   from = fromrepo->idarraydata + fromoff;
1369   for (ida = from, cc = 0; *ida; ida++, cc++)
1370     ;
1371   if (cc == 0)
1372     return 0;
1373   ido = repo_reserve_ids(repo, 0, cc);
1374   ida = repo->idarraydata + ido;
1375   memcpy(ida, from, (cc + 1) * sizeof(Id));
1376   repo->idarraysize += cc + 1;
1377   return ido;
1378 }
1379
1380 #define COPYDIR_DIRCACHE_SIZE 512
1381
1382 static Id copydir_complex(Pool *pool, Repodata *data, Repodata *fromdata, Id did, Id *cache);
1383
1384 static inline Id
1385 copydir(Pool *pool, Repodata *data, Repodata *fromdata, Id did, Id *cache)
1386 {
1387   if (cache && cache[did & 255] == did)
1388     return cache[(did & 255) + 256];
1389   return copydir_complex(pool, data, fromdata, did, cache);
1390 }
1391
1392 static Id
1393 copydir_complex(Pool *pool, Repodata *data, Repodata *fromdata, Id did, Id *cache)
1394 {
1395   Id parent = dirpool_parent(&fromdata->dirpool, did);
1396   Id compid = dirpool_compid(&fromdata->dirpool, did);
1397   if (parent)
1398     parent = copydir(pool, data, fromdata, parent, cache);
1399   if (data->localpool || fromdata->localpool)
1400     compid = repodata_translate_id(data, fromdata, compid, 1);
1401   compid = dirpool_add_dir(&data->dirpool, parent, compid, 1);
1402   if (cache)
1403     {
1404       cache[did & 255] = did;
1405       cache[(did & 255) + 256] = compid;
1406     }
1407   return compid;
1408 }
1409
1410 struct solvable_copy_cbdata {
1411   Repodata *data;
1412   Id handle;
1413   Id subhandle;
1414   Id *dircache;
1415 };
1416
1417 static int
1418 solvable_copy_cb(void *vcbdata, Solvable *r, Repodata *fromdata, Repokey *key, KeyValue *kv)
1419 {
1420   struct solvable_copy_cbdata *cbdata = vcbdata;
1421   Id id, keyname;
1422   Repodata *data = cbdata->data;
1423   Id handle = cbdata->handle;
1424   Pool *pool = data->repo->pool;
1425
1426   keyname = key->name;
1427   switch(key->type)
1428     {
1429     case REPOKEY_TYPE_ID:
1430     case REPOKEY_TYPE_CONSTANTID:
1431     case REPOKEY_TYPE_IDARRAY:  /* used for triggers */
1432       id = kv->id;
1433       if (data->localpool || fromdata->localpool)
1434         id = repodata_translate_id(data, fromdata, id, 1);
1435       if (key->type == REPOKEY_TYPE_ID)
1436         repodata_set_id(data, handle, keyname, id);
1437       else if (key->type == REPOKEY_TYPE_CONSTANTID)
1438         repodata_set_constantid(data, handle, keyname, id);
1439       else
1440         repodata_add_idarray(data, handle, keyname, id);
1441       break;
1442     case REPOKEY_TYPE_STR:
1443       repodata_set_str(data, handle, keyname, kv->str);
1444       break;
1445     case REPOKEY_TYPE_VOID:
1446       repodata_set_void(data, handle, keyname);
1447       break;
1448     case REPOKEY_TYPE_NUM:
1449       repodata_set_num(data, handle, keyname, SOLV_KV_NUM64(kv));
1450       break;
1451     case REPOKEY_TYPE_CONSTANT:
1452       repodata_set_constant(data, handle, keyname, kv->num);
1453       break;
1454     case REPOKEY_TYPE_DIRNUMNUMARRAY:
1455       id = kv->id;
1456       id = copydir(pool, data, fromdata, id, cbdata->dircache);
1457       repodata_add_dirnumnum(data, handle, keyname, id, kv->num, kv->num2);
1458       break;
1459     case REPOKEY_TYPE_DIRSTRARRAY:
1460       id = kv->id;
1461       id = copydir(pool, data, fromdata, id, cbdata->dircache);
1462       repodata_add_dirstr(data, handle, keyname, id, kv->str);
1463       break;
1464     case REPOKEY_TYPE_FLEXARRAY:
1465       if (kv->eof == 2)
1466         {
1467           assert(cbdata->subhandle);
1468           cbdata->handle = cbdata->subhandle;
1469           cbdata->subhandle = 0;
1470           break;
1471         }
1472       if (!kv->entry)
1473         {
1474           assert(!cbdata->subhandle);
1475           cbdata->subhandle = cbdata->handle;
1476         }
1477       cbdata->handle = repodata_new_handle(data);
1478       repodata_add_flexarray(data, cbdata->subhandle, keyname, cbdata->handle);
1479       break;
1480     default:
1481       break;
1482     }
1483   return 0;
1484 }
1485
1486 static void
1487 solvable_copy(Solvable *s, Solvable *r, Repodata *data, Id *dircache)
1488 {
1489   int p, i;
1490   Repo *repo = s->repo;
1491   Pool *pool = repo->pool;
1492   Repo *fromrepo = r->repo;
1493   struct solvable_copy_cbdata cbdata;
1494
1495   /* copy solvable data */
1496   s->name = r->name;
1497   s->evr = r->evr;
1498   s->arch = r->arch;
1499   s->vendor = r->vendor;
1500   s->provides = copydeps(pool, repo, r->provides, fromrepo);
1501   s->requires = copydeps(pool, repo, r->requires, fromrepo);
1502   s->conflicts = copydeps(pool, repo, r->conflicts, fromrepo);
1503   s->obsoletes = copydeps(pool, repo, r->obsoletes, fromrepo);
1504   s->recommends = copydeps(pool, repo, r->recommends, fromrepo);
1505   s->suggests = copydeps(pool, repo, r->suggests, fromrepo);
1506   s->supplements = copydeps(pool, repo, r->supplements, fromrepo);
1507   s->enhances  = copydeps(pool, repo, r->enhances, fromrepo);
1508
1509   /* copy all attributes */
1510   if (!data)
1511     return;
1512   cbdata.data = data;
1513   cbdata.handle = s - pool->solvables;
1514   cbdata.subhandle = 0;
1515   cbdata.dircache = dircache;
1516   p = r - fromrepo->pool->solvables;
1517 #if 0
1518   repo_search(fromrepo, p, 0, 0, SEARCH_NO_STORAGE_SOLVABLE | SEARCH_SUB | SEARCH_ARRAYSENTINEL, solvable_copy_cb, &cbdata);
1519 #else
1520   FOR_REPODATAS(fromrepo, i, data)
1521     {
1522       if (p < data->start || p >= data->end)
1523         continue;
1524       repodata_search(data, p, 0, SEARCH_SUB | SEARCH_ARRAYSENTINEL, solvable_copy_cb, &cbdata);
1525     }
1526 #endif
1527 }
1528
1529 /* used to sort entries by package name that got returned in some database order */
1530 static int
1531 rpmids_sort_cmp(const void *va, const void *vb, void *dp)
1532 {
1533   struct rpmdbentry const *a = va, *b = vb;
1534   char *namedata = dp;
1535   int r;
1536   r = strcmp(namedata + a->nameoff, namedata + b->nameoff);
1537   if (r)
1538     return r;
1539   return a->rpmdbid - b->rpmdbid;
1540 }
1541
1542 static int
1543 pkgids_sort_cmp(const void *va, const void *vb, void *dp)
1544 {
1545   Repo *repo = dp;
1546   Pool *pool = repo->pool;
1547   Solvable *a = pool->solvables + *(Id *)va;
1548   Solvable *b = pool->solvables + *(Id *)vb;
1549   Id *rpmdbid;
1550
1551   if (a->name != b->name)
1552     return strcmp(pool_id2str(pool, a->name), pool_id2str(pool, b->name));
1553   rpmdbid = repo->rpmdbid;
1554   return rpmdbid[(a - pool->solvables) - repo->start] - rpmdbid[(b - pool->solvables) - repo->start];
1555 }
1556
1557 static void
1558 swap_solvables(Repo *repo, Repodata *data, Id pa, Id pb)
1559 {
1560   Pool *pool = repo->pool;
1561   Solvable tmp;
1562
1563   tmp = pool->solvables[pa];
1564   pool->solvables[pa] = pool->solvables[pb];
1565   pool->solvables[pb] = tmp;
1566   if (repo->rpmdbid)
1567     {
1568       Id tmpid = repo->rpmdbid[pa - repo->start];
1569       repo->rpmdbid[pa - repo->start] = repo->rpmdbid[pb - repo->start];
1570       repo->rpmdbid[pb - repo->start] = tmpid;
1571     }
1572   /* only works if nothing is already internalized! */
1573   if (data)
1574     repodata_swap_attrs(data, pa, pb);
1575 }
1576
1577 static void
1578 mkrpmdbcookie(struct stat *st, unsigned char *cookie)
1579 {
1580   memset(cookie, 0, 32);
1581   cookie[3] = RPMDB_COOKIE_VERSION;
1582   memcpy(cookie + 16, &st->st_ino, sizeof(st->st_ino));
1583   memcpy(cookie + 24, &st->st_dev, sizeof(st->st_dev));
1584 }
1585
1586 /*
1587  * read rpm db as repo
1588  *
1589  */
1590
1591 int
1592 repo_add_rpmdb(Repo *repo, Repo *ref, int flags)
1593 {
1594   Pool *pool = repo->pool;
1595   char dbpath[PATH_MAX];
1596   struct stat packagesstat;
1597   unsigned char newcookie[32];
1598   const unsigned char *oldcookie = 0;
1599   Id oldcookietype = 0;
1600   Repodata *data;
1601   int count = 0, done = 0;
1602   const char *rootdir = 0;
1603   struct rpmdbstate state;
1604   int i;
1605   Solvable *s;
1606   unsigned int now;
1607
1608   now = solv_timems(0);
1609   memset(&state, 0, sizeof(state));
1610   state.pool = pool;
1611
1612   data = repo_add_repodata(repo, flags);
1613
1614   if (ref && !(ref->nsolvables && ref->rpmdbid && ref->pool == repo->pool))
1615     {
1616       if ((flags & RPMDB_EMPTY_REFREPO) != 0)
1617         repo_empty(ref, 1);
1618       ref = 0;
1619     }
1620
1621   if (flags & REPO_USE_ROOTDIR)
1622     rootdir = pool_get_rootdir(pool);
1623   if (!opendbenv(&state, rootdir))
1624     return -1;
1625
1626   /* XXX: should get ro lock of Packages database! */
1627   snprintf(dbpath, PATH_MAX, "%s/var/lib/rpm/Packages", rootdir ? rootdir : "");
1628   if (stat(dbpath, &packagesstat))
1629     {
1630       pool_error(pool, -1, "%s: %s", dbpath, strerror(errno));
1631       freestate(&state);
1632       return -1;
1633     }
1634   mkrpmdbcookie(&packagesstat, newcookie);
1635   repodata_set_bin_checksum(data, SOLVID_META, REPOSITORY_RPMDBCOOKIE, REPOKEY_TYPE_SHA256, newcookie);
1636
1637   if (ref)
1638     oldcookie = repo_lookup_bin_checksum(ref, SOLVID_META, REPOSITORY_RPMDBCOOKIE, &oldcookietype);
1639   if (!ref || !oldcookie || oldcookietype != REPOKEY_TYPE_SHA256 || memcmp(oldcookie, newcookie, 32) != 0)
1640     {
1641       int solvstart = 0, solvend = 0;
1642       Id dbid;
1643       DBC *dbc = 0;
1644
1645       if (ref && (flags & RPMDB_EMPTY_REFREPO) != 0)
1646         repo_empty(ref, 1);     /* get it out of the way */
1647       if ((flags & RPMDB_REPORT_PROGRESS) != 0)
1648         count = count_headers(pool, rootdir, state.dbenv);
1649       if (!openpkgdb(&state))
1650         {
1651           freestate(&state);
1652           return -1;
1653         }
1654       if (state.db->cursor(state.db, NULL, &dbc, 0))
1655         {
1656           freestate(&state);
1657           return pool_error(pool, -1, "db->cursor failed");
1658         }
1659       i = 0;
1660       s = 0;
1661       while ((dbid = getrpmcursor(&state, dbc)) != 0)
1662         {
1663           if (dbid == -1)
1664             {
1665               dbc->c_close(dbc);
1666               freestate(&state);
1667               return -1;
1668             }
1669           if (!s)
1670             {
1671               s = pool_id2solvable(pool, repo_add_solvable(repo));
1672               if (!solvstart)
1673                 solvstart = s - pool->solvables;
1674               solvend = s - pool->solvables + 1;
1675             }
1676           if (!repo->rpmdbid)
1677             repo->rpmdbid = repo_sidedata_create(repo, sizeof(Id));
1678           repo->rpmdbid[(s - pool->solvables) - repo->start] = dbid;
1679           if (rpm2solv(pool, repo, data, s, state.rpmhead, flags | RPM_ADD_TRIGGERS))
1680             {
1681               i++;
1682               s = 0;
1683             }
1684           else
1685             {
1686               /* We can reuse this solvable, but make sure it's still
1687                  associated with this repo.  */
1688               memset(s, 0, sizeof(*s));
1689               s->repo = repo;
1690             }
1691           if ((flags & RPMDB_REPORT_PROGRESS) != 0)
1692             {
1693               if (done < count)
1694                 done++;
1695               if (done < count && (done - 1) * 100 / count != done * 100 / count)
1696                 pool_debug(pool, SOLV_ERROR, "%%%% %d\n", done * 100 / count);
1697             }
1698         }
1699       dbc->c_close(dbc);
1700       if (s)
1701         {
1702           /* oops, could not reuse. free it instead */
1703           repo_free_solvable(repo, s - pool->solvables, 1);
1704           solvend--;
1705           s = 0;
1706         }
1707       /* now sort all solvables in the new solvstart..solvend block */
1708       if (solvend - solvstart > 1)
1709         {
1710           Id *pkgids = solv_malloc2(solvend - solvstart, sizeof(Id));
1711           for (i = solvstart; i < solvend; i++)
1712             pkgids[i - solvstart] = i;
1713           solv_sort(pkgids, solvend - solvstart, sizeof(Id), pkgids_sort_cmp, repo);
1714           /* adapt order */
1715           for (i = solvstart; i < solvend; i++)
1716             {
1717               int j = pkgids[i - solvstart];
1718               while (j < i)
1719                 j = pkgids[i - solvstart] = pkgids[j - solvstart];
1720               if (j != i)
1721                 swap_solvables(repo, data, i, j);
1722             }
1723           solv_free(pkgids);
1724         }
1725     }
1726   else
1727     {
1728       Id dircache[COPYDIR_DIRCACHE_SIZE];               /* see copydir */
1729       struct rpmdbentry *entries = 0, *rp;
1730       int nentries = 0;
1731       char *namedata = 0;
1732       unsigned int refmask, h;
1733       Id id, *refhash;
1734       int res;
1735
1736       memset(dircache, 0, sizeof(dircache));
1737
1738       /* get ids of installed rpms */
1739       entries = getinstalledrpmdbids(&state, "Name", 0, &nentries, &namedata);
1740       if (!entries)
1741         {
1742           freestate(&state);
1743           return -1;
1744         }
1745
1746       /* sort by name */
1747       if (nentries > 1)
1748         solv_sort(entries, nentries, sizeof(*entries), rpmids_sort_cmp, namedata);
1749
1750       /* create hash from dbid to ref */
1751       refmask = mkmask(ref->nsolvables);
1752       refhash = solv_calloc(refmask + 1, sizeof(Id));
1753       for (i = 0; i < ref->end - ref->start; i++)
1754         {
1755           if (!ref->rpmdbid[i])
1756             continue;
1757           h = ref->rpmdbid[i] & refmask;
1758           while (refhash[h])
1759             h = (h + 317) & refmask;
1760           refhash[h] = i + 1;   /* make it non-zero */
1761         }
1762
1763       /* count the misses, they will cost us time */
1764       if ((flags & RPMDB_REPORT_PROGRESS) != 0)
1765         {
1766           for (i = 0, rp = entries; i < nentries; i++, rp++)
1767             {
1768               if (refhash)
1769                 {
1770                   Id dbid = rp->rpmdbid;
1771                   h = dbid & refmask;
1772                   while ((id = refhash[h]))
1773                     {
1774                       if (ref->rpmdbid[id - 1] == dbid)
1775                         break;
1776                       h = (h + 317) & refmask;
1777                     }
1778                   if (id)
1779                     continue;
1780                 }
1781               count++;
1782             }
1783         }
1784
1785       if (ref && (flags & RPMDB_EMPTY_REFREPO) != 0)
1786         s = pool_id2solvable(pool, repo_add_solvable_block_before(repo, nentries, ref));
1787       else
1788         s = pool_id2solvable(pool, repo_add_solvable_block(repo, nentries));
1789       if (!repo->rpmdbid)
1790         repo->rpmdbid = repo_sidedata_create(repo, sizeof(Id));
1791
1792       for (i = 0, rp = entries; i < nentries; i++, rp++, s++)
1793         {
1794           Id dbid = rp->rpmdbid;
1795           repo->rpmdbid[(s - pool->solvables) - repo->start] = rp->rpmdbid;
1796           if (refhash)
1797             {
1798               h = dbid & refmask;
1799               while ((id = refhash[h]))
1800                 {
1801                   if (ref->rpmdbid[id - 1] == dbid)
1802                     break;
1803                   h = (h + 317) & refmask;
1804                 }
1805               if (id)
1806                 {
1807                   Solvable *r = ref->pool->solvables + ref->start + (id - 1);
1808                   if (r->repo == ref)
1809                     {
1810                       solvable_copy(s, r, data, dircache);
1811                       continue;
1812                     }
1813                 }
1814             }
1815           res = getrpmdbid(&state, dbid);
1816           if (res <= 0)
1817             {
1818               if (!res)
1819                 return pool_error(pool, -1, "inconsistent rpm database, key %d not found. run 'rpm --rebuilddb' to fix.", dbid);
1820               freestate(&state);
1821               solv_free(entries);
1822               solv_free(namedata);
1823               solv_free(refhash);
1824               return -1;
1825             }
1826           rpm2solv(pool, repo, data, s, state.rpmhead, flags | RPM_ADD_TRIGGERS);
1827           if ((flags & RPMDB_REPORT_PROGRESS) != 0)
1828             {
1829               if (done < count)
1830                 done++;
1831               if (done < count && (done - 1) * 100 / count != done * 100 / count)
1832                 pool_debug(pool, SOLV_ERROR, "%%%% %d\n", done * 100 / count);
1833             }
1834         }
1835
1836       solv_free(entries);
1837       solv_free(namedata);
1838       solv_free(refhash);
1839       if (ref && (flags & RPMDB_EMPTY_REFREPO) != 0)
1840         repo_empty(ref, 1);
1841     }
1842
1843   freestate(&state);
1844   if (!(flags & REPO_NO_INTERNALIZE))
1845     repodata_internalize(data);
1846   if ((flags & RPMDB_REPORT_PROGRESS) != 0)
1847     pool_debug(pool, SOLV_ERROR, "%%%% 100\n");
1848   POOL_DEBUG(SOLV_DEBUG_STATS, "repo_add_rpmdb took %d ms\n", solv_timems(now));
1849   POOL_DEBUG(SOLV_DEBUG_STATS, "repo size: %d solvables\n", repo->nsolvables);
1850   POOL_DEBUG(SOLV_DEBUG_STATS, "repo memory used: %d K incore, %d K idarray\n", repodata_memused(data)/1024, repo->idarraysize / (int)(1024/sizeof(Id)));
1851   return 0;
1852 }
1853
1854 int
1855 repo_add_rpmdb_reffp(Repo *repo, FILE *fp, int flags)
1856 {
1857   int res;
1858   Repo *ref = 0;
1859
1860   if (!fp)
1861     return repo_add_rpmdb(repo, 0, flags);
1862   ref = repo_create(repo->pool, "add_rpmdb_reffp");
1863   if (repo_add_solv(ref, fp, 0) != 0)
1864     {
1865       repo_free(ref, 1);
1866       ref = 0;
1867     }
1868   if (ref && ref->start == ref->end)
1869     {
1870       repo_free(ref, 1);
1871       ref = 0;
1872     }
1873   if (ref)
1874     repo_disable_paging(ref);
1875   res = repo_add_rpmdb(repo, ref, flags | RPMDB_EMPTY_REFREPO);
1876   if (ref)
1877     repo_free(ref, 1);
1878   return res;
1879 }
1880
1881 static inline unsigned int
1882 getu32(const unsigned char *dp)
1883 {
1884   return dp[0] << 24 | dp[1] << 16 | dp[2] << 8 | dp[3];
1885 }
1886
1887
1888 Id
1889 repo_add_rpm(Repo *repo, const char *rpm, int flags)
1890 {
1891   unsigned int sigdsize, sigcnt, l;
1892   Pool *pool = repo->pool;
1893   Solvable *s;
1894   RpmHead *rpmhead = 0;
1895   int rpmheadsize = 0;
1896   char *payloadformat;
1897   FILE *fp;
1898   unsigned char lead[4096];
1899   int headerstart, headerend;
1900   struct stat stb;
1901   Repodata *data;
1902   unsigned char pkgid[16];
1903   unsigned char leadsigid[16];
1904   unsigned char hdrid[32];
1905   int pkgidtype, leadsigidtype, hdridtype;
1906   Id chksumtype = 0;
1907   void *chksumh = 0;
1908   void *leadsigchksumh = 0;
1909   int forcebinary = 0;
1910
1911   data = repo_add_repodata(repo, flags);
1912
1913   if ((flags & RPM_ADD_WITH_SHA256SUM) != 0)
1914     chksumtype = REPOKEY_TYPE_SHA256;
1915   else if ((flags & RPM_ADD_WITH_SHA1SUM) != 0)
1916     chksumtype = REPOKEY_TYPE_SHA1;
1917
1918   if ((fp = fopen(flags & REPO_USE_ROOTDIR ? pool_prepend_rootdir_tmp(pool, rpm) : rpm, "r")) == 0)
1919     {
1920       pool_error(pool, -1, "%s: %s", rpm, strerror(errno));
1921       return 0;
1922     }
1923   if (fstat(fileno(fp), &stb))
1924     {
1925       pool_error(pool, -1, "fstat: %s", strerror(errno));
1926       fclose(fp);
1927       return 0;
1928     }
1929   if (chksumtype)
1930     chksumh = solv_chksum_create(chksumtype);
1931   if ((flags & RPM_ADD_WITH_LEADSIGID) != 0)
1932     leadsigchksumh = solv_chksum_create(REPOKEY_TYPE_MD5);
1933   if (fread(lead, 96 + 16, 1, fp) != 1 || getu32(lead) != 0xedabeedb)
1934     {
1935       pool_error(pool, -1, "%s: not a rpm", rpm);
1936       fclose(fp);
1937       return 0;
1938     }
1939   forcebinary = lead[6] != 0 || lead[7] != 1;
1940   if (chksumh)
1941     solv_chksum_add(chksumh, lead, 96 + 16);
1942   if (leadsigchksumh)
1943     solv_chksum_add(leadsigchksumh, lead, 96 + 16);
1944   if (lead[78] != 0 || lead[79] != 5)
1945     {
1946       pool_error(pool, -1, "%s: not a rpm v5 header", rpm);
1947       fclose(fp);
1948       return 0;
1949     }
1950   if (getu32(lead + 96) != 0x8eade801)
1951     {
1952       pool_error(pool, -1, "%s: bad signature header", rpm);
1953       fclose(fp);
1954       return 0;
1955     }
1956   sigcnt = getu32(lead + 96 + 8);
1957   sigdsize = getu32(lead + 96 + 12);
1958   if (sigcnt >= 0x100000 || sigdsize >= 0x100000)
1959     {
1960       pool_error(pool, -1, "%s: bad signature header", rpm);
1961       fclose(fp);
1962       return 0;
1963     }
1964   sigdsize += sigcnt * 16;
1965   sigdsize = (sigdsize + 7) & ~7;
1966   headerstart = 96 + 16 + sigdsize;
1967   pkgidtype = leadsigidtype = hdridtype = 0;
1968   if ((flags & (RPM_ADD_WITH_PKGID | RPM_ADD_WITH_HDRID)) != 0)
1969     {
1970       /* extract pkgid or hdrid from the signature header */
1971       if (sigdsize > rpmheadsize)
1972         {
1973           rpmheadsize = sigdsize + 128;
1974           rpmhead = solv_realloc(rpmhead, sizeof(*rpmhead) + rpmheadsize);
1975         }
1976       if (fread(rpmhead->data, sigdsize, 1, fp) != 1)
1977         {
1978           pool_error(pool, -1, "%s: unexpected EOF", rpm);
1979           fclose(fp);
1980           return 0;
1981         }
1982       if (chksumh)
1983         solv_chksum_add(chksumh, rpmhead->data, sigdsize);
1984       if (leadsigchksumh)
1985         solv_chksum_add(leadsigchksumh, rpmhead->data, sigdsize);
1986       rpmhead->forcebinary = 0;
1987       rpmhead->cnt = sigcnt;
1988       rpmhead->dcnt = sigdsize - sigcnt * 16;
1989       rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
1990       if ((flags & RPM_ADD_WITH_PKGID) != 0)
1991         {
1992           unsigned char *chksum;
1993           unsigned int chksumsize;
1994           chksum = headbinary(rpmhead, SIGTAG_MD5, &chksumsize);
1995           if (chksum && chksumsize == 16)
1996             {
1997               pkgidtype = REPOKEY_TYPE_MD5;
1998               memcpy(pkgid, chksum, 16);
1999             }
2000         }
2001       if ((flags & RPM_ADD_WITH_HDRID) != 0)
2002         {
2003           const char *str = headstring(rpmhead, TAG_SHA1HEADER);
2004           if (str && strlen(str) == 40)
2005             {
2006               if (solv_hex2bin(&str, hdrid, 20) == 20)
2007                 hdridtype = REPOKEY_TYPE_SHA1;
2008             }
2009           else if (str && strlen(str) == 64)
2010             {
2011               if (solv_hex2bin(&str, hdrid, 32) == 32)
2012                 hdridtype = REPOKEY_TYPE_SHA256;
2013             }
2014         }
2015     }
2016   else
2017     {
2018       /* just skip the signature header */
2019       while (sigdsize)
2020         {
2021           l = sigdsize > 4096 ? 4096 : sigdsize;
2022           if (fread(lead, l, 1, fp) != 1)
2023             {
2024               pool_error(pool, -1, "%s: unexpected EOF", rpm);
2025               fclose(fp);
2026               return 0;
2027             }
2028           if (chksumh)
2029             solv_chksum_add(chksumh, lead, l);
2030           if (leadsigchksumh)
2031             solv_chksum_add(leadsigchksumh, lead, l);
2032           sigdsize -= l;
2033         }
2034     }
2035   if (leadsigchksumh)
2036     {
2037       leadsigchksumh = solv_chksum_free(leadsigchksumh, leadsigid);
2038       leadsigidtype = REPOKEY_TYPE_MD5;
2039     }
2040   if (fread(lead, 16, 1, fp) != 1)
2041     {
2042       pool_error(pool, -1, "%s: unexpected EOF", rpm);
2043       fclose(fp);
2044       return 0;
2045     }
2046   if (chksumh)
2047     solv_chksum_add(chksumh, lead, 16);
2048   if (getu32(lead) != 0x8eade801)
2049     {
2050       pool_error(pool, -1, "%s: bad header", rpm);
2051       fclose(fp);
2052       return 0;
2053     }
2054   sigcnt = getu32(lead + 8);
2055   sigdsize = getu32(lead + 12);
2056   if (sigcnt >= 0x100000 || sigdsize >= 0x2000000)
2057     {
2058       pool_error(pool, -1, "%s: bad header", rpm);
2059       fclose(fp);
2060       return 0;
2061     }
2062   l = sigdsize + sigcnt * 16;
2063   headerend = headerstart + 16 + l;
2064   if (l > rpmheadsize)
2065     {
2066       rpmheadsize = l + 128;
2067       rpmhead = solv_realloc(rpmhead, sizeof(*rpmhead) + rpmheadsize);
2068     }
2069   if (fread(rpmhead->data, l, 1, fp) != 1)
2070     {
2071       pool_error(pool, -1, "%s: unexpected EOF", rpm);
2072       fclose(fp);
2073       return 0;
2074     }
2075   if (chksumh)
2076     solv_chksum_add(chksumh, rpmhead->data, l);
2077   rpmhead->forcebinary = forcebinary;
2078   rpmhead->cnt = sigcnt;
2079   rpmhead->dcnt = sigdsize;
2080   rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
2081   if (headexists(rpmhead, TAG_PATCHESNAME))
2082     {
2083       /* this is a patch rpm, ignore */
2084       pool_error(pool, -1, "%s: is patch rpm", rpm);
2085       fclose(fp);
2086       solv_chksum_free(chksumh, 0);
2087       solv_free(rpmhead);
2088       return 0;
2089     }
2090   payloadformat = headstring(rpmhead, TAG_PAYLOADFORMAT);
2091   if (payloadformat && !strcmp(payloadformat, "drpm"))
2092     {
2093       /* this is a delta rpm */
2094       pool_error(pool, -1, "%s: is delta rpm", rpm);
2095       fclose(fp);
2096       solv_chksum_free(chksumh, 0);
2097       solv_free(rpmhead);
2098       return 0;
2099     }
2100   if (chksumh)
2101     while ((l = fread(lead, 1, sizeof(lead), fp)) > 0)
2102       solv_chksum_add(chksumh, lead, l);
2103   fclose(fp);
2104   s = pool_id2solvable(pool, repo_add_solvable(repo));
2105   if (!rpm2solv(pool, repo, data, s, rpmhead, flags & ~(RPM_ADD_WITH_HDRID | RPM_ADD_WITH_PKGID)))
2106     {
2107       repo_free_solvable(repo, s - pool->solvables, 1);
2108       solv_chksum_free(chksumh, 0);
2109       solv_free(rpmhead);
2110       return 0;
2111     }
2112   if (!(flags & REPO_NO_LOCATION))
2113     repodata_set_location(data, s - pool->solvables, 0, 0, rpm);
2114   if (S_ISREG(stb.st_mode))
2115     repodata_set_num(data, s - pool->solvables, SOLVABLE_DOWNLOADSIZE, (unsigned long long)stb.st_size);
2116   repodata_set_num(data, s - pool->solvables, SOLVABLE_HEADEREND, headerend);
2117   if (pkgidtype)
2118     repodata_set_bin_checksum(data, s - pool->solvables, SOLVABLE_PKGID, pkgidtype, pkgid);
2119   if (hdridtype)
2120     repodata_set_bin_checksum(data, s - pool->solvables, SOLVABLE_HDRID, hdridtype, hdrid);
2121   if (leadsigidtype)
2122     repodata_set_bin_checksum(data, s - pool->solvables, SOLVABLE_LEADSIGID, leadsigidtype, leadsigid);
2123   if (chksumh)
2124     {
2125       repodata_set_bin_checksum(data, s - pool->solvables, SOLVABLE_CHECKSUM, chksumtype, solv_chksum_get(chksumh, 0));
2126       chksumh = solv_chksum_free(chksumh, 0);
2127     }
2128   if (rpmhead)
2129     solv_free(rpmhead);
2130   if (!(flags & REPO_NO_INTERNALIZE))
2131     repodata_internalize(data);
2132   return s - pool->solvables;
2133 }
2134
2135 Id
2136 repo_add_rpm_handle(Repo *repo, void *rpmhandle, int flags)
2137 {
2138   Pool *pool = repo->pool;
2139   Repodata *data;
2140   RpmHead *rpmhead = rpmhandle;
2141   Solvable *s;
2142   char *payloadformat;
2143
2144   data = repo_add_repodata(repo, flags);
2145   if (headexists(rpmhead, TAG_PATCHESNAME))
2146     {
2147       pool_error(pool, -1, "is a patch rpm");
2148       return 0;
2149     }
2150   payloadformat = headstring(rpmhead, TAG_PAYLOADFORMAT);
2151   if (payloadformat && !strcmp(payloadformat, "drpm"))
2152     {
2153       /* this is a delta rpm */
2154       pool_error(pool, -1, "is a delta rpm");
2155       return 0;
2156     }
2157   s = pool_id2solvable(pool, repo_add_solvable(repo));
2158   if (!rpm2solv(pool, repo, data, s, rpmhead, flags))
2159     {
2160       repo_free_solvable(repo, s - pool->solvables, 1);
2161       return 0;
2162     }
2163   if (!(flags & REPO_NO_INTERNALIZE))
2164     repodata_internalize(data);
2165   return s - pool->solvables;
2166 }
2167
2168 static inline void
2169 linkhash(const char *lt, char *hash)
2170 {
2171   unsigned int r = 0;
2172   const unsigned char *str = (const unsigned char *)lt;
2173   int l, c;
2174
2175   l = strlen(lt);
2176   while ((c = *str++) != 0)
2177     r += (r << 3) + c;
2178   sprintf(hash, "%08x%08x%08x%08x", r, l, 0, 0);
2179 }
2180
2181 void
2182 rpm_iterate_filelist(void *rpmhandle, int flags, void (*cb)(void *, const char *, struct filelistinfo *), void *cbdata)
2183 {
2184   RpmHead *rpmhead = rpmhandle;
2185   char **bn;
2186   char **dn;
2187   char **md = 0;
2188   char **lt = 0;
2189   unsigned int *di, diidx;
2190   unsigned int *co = 0;
2191   unsigned int *ff = 0;
2192   unsigned int lastdir;
2193   int lastdirl;
2194   unsigned int *fm;
2195   int cnt, dcnt, cnt2;
2196   int i, l1, l;
2197   char *space = 0;
2198   int spacen = 0;
2199   char md5[33];
2200   struct filelistinfo info;
2201
2202   dn = headstringarray(rpmhead, TAG_DIRNAMES, &dcnt);
2203   if (!dn)
2204     return;
2205   if ((flags & RPM_ITERATE_FILELIST_ONLYDIRS) != 0)
2206     {
2207       for (i = 0; i < dcnt; i++)
2208         (*cb)(cbdata, dn[i], 0);
2209       solv_free(dn);
2210       return;
2211     }
2212   bn = headstringarray(rpmhead, TAG_BASENAMES, &cnt);
2213   if (!bn)
2214     {
2215       solv_free(dn);
2216       return;
2217     }
2218   di = headint32array(rpmhead, TAG_DIRINDEXES, &cnt2);
2219   if (!di || cnt != cnt2)
2220     {
2221       solv_free(di);
2222       solv_free(bn);
2223       solv_free(dn);
2224       return;
2225     }
2226   fm = headint16array(rpmhead, TAG_FILEMODES, &cnt2);
2227   if (!fm || cnt != cnt2)
2228     {
2229       solv_free(fm);
2230       solv_free(di);
2231       solv_free(bn);
2232       solv_free(dn);
2233       return;
2234     }
2235   if ((flags & RPM_ITERATE_FILELIST_WITHMD5) != 0)
2236     {
2237       md = headstringarray(rpmhead, TAG_FILEMD5S, &cnt2);
2238       if (!md || cnt != cnt2)
2239         {
2240           solv_free(md);
2241           solv_free(fm);
2242           solv_free(di);
2243           solv_free(bn);
2244           solv_free(dn);
2245           return;
2246         }
2247     }
2248   if ((flags & RPM_ITERATE_FILELIST_WITHCOL) != 0)
2249     {
2250       co = headint32array(rpmhead, TAG_FILECOLORS, &cnt2);
2251       if (!co || cnt != cnt2)
2252         {
2253           solv_free(co);
2254           solv_free(md);
2255           solv_free(fm);
2256           solv_free(di);
2257           solv_free(bn);
2258           solv_free(dn);
2259           return;
2260         }
2261     }
2262   if ((flags & RPM_ITERATE_FILELIST_NOGHOSTS) != 0)
2263     {
2264       ff = headint32array(rpmhead, TAG_FILEFLAGS, &cnt2);
2265       if (!ff || cnt != cnt2)
2266         {
2267           solv_free(ff);
2268           solv_free(co);
2269           solv_free(md);
2270           solv_free(fm);
2271           solv_free(di);
2272           solv_free(bn);
2273           solv_free(dn);
2274           return;
2275         }
2276     }
2277   lastdir = dcnt;
2278   lastdirl = 0;
2279   memset(&info, 0, sizeof(info));
2280   for (i = 0; i < cnt; i++)
2281     {
2282       if (ff && (ff[i] & FILEFLAG_GHOST) != 0)
2283         continue;
2284       diidx = di[i];
2285       if (diidx >= dcnt)
2286         continue;
2287       l1 = lastdir == diidx ? lastdirl : strlen(dn[diidx]);
2288       l = l1 + strlen(bn[i]) + 1;
2289       if (l > spacen)
2290         {
2291           spacen = l + 16;
2292           space = solv_realloc(space, spacen);
2293         }
2294       if (lastdir != diidx)
2295         {
2296           strcpy(space, dn[diidx]);
2297           lastdir = diidx;
2298           lastdirl = l1;
2299         }
2300       strcpy(space + l1, bn[i]);
2301       info.diridx = diidx;
2302       info.dirlen = l1;
2303       if (fm)
2304         info.mode = fm[i];
2305       if (md)
2306         {
2307           info.digest = md[i];
2308           if (fm && S_ISLNK(fm[i]))
2309             {
2310               info.digest = 0;
2311               if (!lt)
2312                 {
2313                   lt = headstringarray(rpmhead, TAG_FILELINKTOS, &cnt2);
2314                   if (cnt != cnt2)
2315                     lt = solv_free(lt);
2316                 }
2317               if (lt)
2318                 {
2319                   linkhash(lt[i], md5);
2320                   info.digest = md5;
2321                 }
2322             }
2323           if (!info.digest)
2324             {
2325               sprintf(md5, "%08x%08x%08x%08x", (fm[i] >> 12) & 65535, 0, 0, 0);
2326               info.digest = md5;
2327             }
2328         }
2329       if (co)
2330         info.color = co[i];
2331       (*cb)(cbdata, space, &info);
2332     }
2333   solv_free(space);
2334   solv_free(lt);
2335   solv_free(md);
2336   solv_free(fm);
2337   solv_free(di);
2338   solv_free(bn);
2339   solv_free(dn);
2340   solv_free(co);
2341   solv_free(ff);
2342 }
2343
2344 char *
2345 rpm_query(void *rpmhandle, Id what)
2346 {
2347   const char *name, *arch, *sourcerpm;
2348   char *evr, *r;
2349   int l;
2350
2351   RpmHead *rpmhead = rpmhandle;
2352   r = 0;
2353   switch (what)
2354     {
2355     case 0:
2356       name = headstring(rpmhead, TAG_NAME);
2357       if (!name)
2358         name = "";
2359       sourcerpm = headstring(rpmhead, TAG_SOURCERPM);
2360       if (sourcerpm || (rpmhead->forcebinary && !headexists(rpmhead, TAG_SOURCEPACKAGE)))
2361         arch = headstring(rpmhead, TAG_ARCH);
2362       else
2363         {
2364           if (headexists(rpmhead, TAG_NOSOURCE) || headexists(rpmhead, TAG_NOPATCH))
2365             arch = "nosrc";
2366           else
2367             arch = "src";
2368         }
2369       if (!arch)
2370         arch = "noarch";
2371       evr = headtoevr(rpmhead);
2372       l = strlen(name) + 1 + strlen(evr ? evr : "") + 1 + strlen(arch) + 1;
2373       r = solv_malloc(l);
2374       sprintf(r, "%s-%s.%s", name, evr ? evr : "", arch);
2375       solv_free(evr);
2376       break;
2377     case SOLVABLE_NAME:
2378       name = headstring(rpmhead, TAG_NAME);
2379       r = solv_strdup(name);
2380       break;
2381     case SOLVABLE_SUMMARY:
2382       name = headstring(rpmhead, TAG_SUMMARY);
2383       r = solv_strdup(name);
2384       break;
2385     case SOLVABLE_DESCRIPTION:
2386       name = headstring(rpmhead, TAG_DESCRIPTION);
2387       r = solv_strdup(name);
2388       break;
2389     case SOLVABLE_EVR:
2390       r = headtoevr(rpmhead);
2391       break;
2392     }
2393   return r;
2394 }
2395
2396 unsigned long long
2397 rpm_query_num(void *rpmhandle, Id what, unsigned long long notfound)
2398 {
2399   RpmHead *rpmhead = rpmhandle;
2400   unsigned int u32;
2401
2402   switch (what)
2403     {
2404     case SOLVABLE_INSTALLTIME:
2405       u32 = headint32(rpmhead, TAG_INSTALLTIME);
2406       return u32 ? u32 : notfound;
2407     }
2408   return notfound;
2409 }
2410
2411 int
2412 rpm_installedrpmdbids(void *rpmstate, const char *index, const char *match, Queue *rpmdbidq)
2413 {
2414   struct rpmdbentry *entries;
2415   int nentries, i;
2416
2417   entries = getinstalledrpmdbids(rpmstate, index ? index : "Name", match, &nentries, 0);
2418   if (rpmdbidq)
2419     {
2420       queue_empty(rpmdbidq);
2421       for (i = 0; i < nentries; i++)
2422         queue_push(rpmdbidq, entries[i].rpmdbid);
2423     }
2424   solv_free(entries);
2425   return nentries;
2426 }
2427
2428 void *
2429 rpm_byrpmdbid(void *rpmstate, Id rpmdbid)
2430 {
2431   struct rpmdbstate *state = rpmstate;
2432   int r;
2433
2434   r = getrpmdbid(state, rpmdbid);
2435   if (!r)
2436     pool_error(state->pool, 0, "header #%d not in database", rpmdbid);
2437   return r <= 0 ? 0 : state->rpmhead;
2438 }
2439
2440 void *
2441 rpm_byfp(void *rpmstate, FILE *fp, const char *name)
2442 {
2443   struct rpmdbstate *state = rpmstate;
2444   /* int headerstart, headerend; */
2445   RpmHead *rpmhead;
2446   unsigned int sigdsize, sigcnt, l;
2447   unsigned char lead[4096];
2448   int forcebinary = 0;
2449
2450   if (fread(lead, 96 + 16, 1, fp) != 1 || getu32(lead) != 0xedabeedb)
2451     {
2452       pool_error(state->pool, 0, "%s: not a rpm", name);
2453       return 0;
2454     }
2455   forcebinary = lead[6] != 0 || lead[7] != 1;
2456   if (lead[78] != 0 || lead[79] != 5)
2457     {
2458       pool_error(state->pool, 0, "%s: not a V5 header", name);
2459       return 0;
2460     }
2461   if (getu32(lead + 96) != 0x8eade801)
2462     {
2463       pool_error(state->pool, 0, "%s: bad signature header", name);
2464       return 0;
2465     }
2466   sigcnt = getu32(lead + 96 + 8);
2467   sigdsize = getu32(lead + 96 + 12);
2468   if (sigcnt >= 0x100000 || sigdsize >= 0x100000)
2469     {
2470       pool_error(state->pool, 0, "%s: bad signature header", name);
2471       return 0;
2472     }
2473   sigdsize += sigcnt * 16;
2474   sigdsize = (sigdsize + 7) & ~7;
2475   /* headerstart = 96 + 16 + sigdsize; */
2476   while (sigdsize)
2477     {
2478       l = sigdsize > 4096 ? 4096 : sigdsize;
2479       if (fread(lead, l, 1, fp) != 1)
2480         {
2481           pool_error(state->pool, 0, "%s: unexpected EOF", name);
2482           return 0;
2483         }
2484       sigdsize -= l;
2485     }
2486   if (fread(lead, 16, 1, fp) != 1)
2487     {
2488       pool_error(state->pool, 0, "%s: unexpected EOF", name);
2489       return 0;
2490     }
2491   if (getu32(lead) != 0x8eade801)
2492     {
2493       pool_error(state->pool, 0, "%s: bad header", name);
2494       return 0;
2495     }
2496   sigcnt = getu32(lead + 8);
2497   sigdsize = getu32(lead + 12);
2498   if (sigcnt >= 0x100000 || sigdsize >= 0x2000000)
2499     {
2500       pool_error(state->pool, 0, "%s: bad header", name);
2501       return 0;
2502     }
2503   l = sigdsize + sigcnt * 16;
2504   /* headerend = headerstart + 16 + l; */
2505   if (l > state->rpmheadsize)
2506     {
2507       state->rpmheadsize = l + 128;
2508       state->rpmhead = solv_realloc(state->rpmhead, sizeof(*state->rpmhead) + state->rpmheadsize);
2509     }
2510   rpmhead = state->rpmhead;
2511   if (fread(rpmhead->data, l, 1, fp) != 1)
2512     {
2513       pool_error(state->pool, 0, "%s: unexpected EOF", name);
2514       return 0;
2515     }
2516   rpmhead->forcebinary = forcebinary;
2517   rpmhead->cnt = sigcnt;
2518   rpmhead->dcnt = sigdsize;
2519   rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
2520   return rpmhead;
2521 }
2522
2523 #ifdef ENABLE_RPMDB_BYRPMHEADER
2524
2525 void *
2526 rpm_byrpmh(void *rpmstate, Header h)
2527 {
2528   struct rpmdbstate *state = rpmstate;
2529   const unsigned char *uh;
2530   unsigned int sigdsize, sigcnt, l;
2531   RpmHead *rpmhead;
2532
2533 #ifndef RPM5
2534   uh = headerUnload(h);
2535 #else
2536   uh = headerUnload(h, NULL);
2537 #endif
2538   if (!uh)
2539     return 0;
2540   sigcnt = getu32(uh);
2541   sigdsize = getu32(uh + 4);
2542   l = sigdsize + sigcnt * 16;
2543   if (l > state->rpmheadsize)
2544     {
2545       state->rpmheadsize = l + 128;
2546       state->rpmhead = solv_realloc(state->rpmhead, sizeof(*state->rpmhead) + state->rpmheadsize);
2547     }
2548   rpmhead = state->rpmhead;
2549   memcpy(rpmhead->data, uh + 8, l - 8);
2550   free((void *)uh);
2551   rpmhead->forcebinary = 0;
2552   rpmhead->cnt = sigcnt;
2553   rpmhead->dcnt = sigdsize;
2554   rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
2555   return rpmhead;
2556 }
2557
2558 #endif
2559