add repo_add_rpmdb_reffp to easily add rpmdb content when there is an old solv file
[platform/upstream/libsolv.git] / ext / repo_rpmdb.c
1 /*
2  * Copyright (c) 2007-2012, Novell Inc.
3  *
4  * This program is licensed under the BSD license, read LICENSE.BSD
5  * for further information
6  */
7
8 /*
9  * repo_rpmdb
10  *
11  * convert rpm db to repo
12  *
13  */
14
15 #include <sys/types.h>
16 #include <sys/stat.h>
17 #include <limits.h>
18 #include <fcntl.h>
19 #include <stdio.h>
20 #include <stdlib.h>
21 #include <string.h>
22 #include <unistd.h>
23 #include <assert.h>
24 #include <stdint.h>
25 #include <errno.h>
26
27 #include <rpm/rpmio.h>
28 #include <rpm/rpmpgp.h>
29 #ifndef RPM5
30 #include <rpm/header.h>
31 #endif
32 #include <rpm/rpmdb.h>
33
34 #ifndef DB_CREATE
35 # if defined(SUSE) || defined(HAVE_RPM_DB_H)
36 #  include <rpm/db.h>
37 # else
38 #  include <db.h>
39 # endif
40 #endif
41
42 #include "pool.h"
43 #include "repo.h"
44 #include "hash.h"
45 #include "util.h"
46 #include "queue.h"
47 #include "chksum.h"
48 #include "repo_rpmdb.h"
49 #include "repo_solv.h"
50
51 /* 3: added triggers */
52 /* 4: fixed triggers */
53 #define RPMDB_COOKIE_VERSION 4
54
55 #define TAG_NAME                1000
56 #define TAG_VERSION             1001
57 #define TAG_RELEASE             1002
58 #define TAG_EPOCH               1003
59 #define TAG_SUMMARY             1004
60 #define TAG_DESCRIPTION         1005
61 #define TAG_BUILDTIME           1006
62 #define TAG_BUILDHOST           1007
63 #define TAG_INSTALLTIME         1008
64 #define TAG_SIZE                1009
65 #define TAG_DISTRIBUTION        1010
66 #define TAG_VENDOR              1011
67 #define TAG_LICENSE             1014
68 #define TAG_PACKAGER            1015
69 #define TAG_GROUP               1016
70 #define TAG_URL                 1020
71 #define TAG_ARCH                1022
72 #define TAG_FILESIZES           1028
73 #define TAG_FILEMODES           1030
74 #define TAG_FILEMD5S            1035
75 #define TAG_FILELINKTOS         1036
76 #define TAG_FILEFLAGS           1037
77 #define TAG_SOURCERPM           1044
78 #define TAG_PROVIDENAME         1047
79 #define TAG_REQUIREFLAGS        1048
80 #define TAG_REQUIRENAME         1049
81 #define TAG_REQUIREVERSION      1050
82 #define TAG_NOSOURCE            1051
83 #define TAG_NOPATCH             1052
84 #define TAG_CONFLICTFLAGS       1053
85 #define TAG_CONFLICTNAME        1054
86 #define TAG_CONFLICTVERSION     1055
87 #define TAG_TRIGGERNAME         1066
88 #define TAG_TRIGGERVERSION      1067
89 #define TAG_TRIGGERFLAGS        1068
90 #define TAG_CHANGELOGTIME       1080
91 #define TAG_CHANGELOGNAME       1081
92 #define TAG_CHANGELOGTEXT       1082
93 #define TAG_OBSOLETENAME        1090
94 #define TAG_FILEDEVICES         1095
95 #define TAG_FILEINODES          1096
96 #define TAG_SOURCEPACKAGE       1106
97 #define TAG_PROVIDEFLAGS        1112
98 #define TAG_PROVIDEVERSION      1113
99 #define TAG_OBSOLETEFLAGS       1114
100 #define TAG_OBSOLETEVERSION     1115
101 #define TAG_DIRINDEXES          1116
102 #define TAG_BASENAMES           1117
103 #define TAG_DIRNAMES            1118
104 #define TAG_PAYLOADFORMAT       1124
105 #define TAG_PATCHESNAME         1133
106 #define TAG_FILECOLORS          1140
107 #define TAG_SUGGESTSNAME        1156
108 #define TAG_SUGGESTSVERSION     1157
109 #define TAG_SUGGESTSFLAGS       1158
110 #define TAG_ENHANCESNAME        1159
111 #define TAG_ENHANCESVERSION     1160
112 #define TAG_ENHANCESFLAGS       1161
113
114 /* rpm5 tags */
115 #define TAG_DISTEPOCH           1218
116
117 /* rpm4 tags */
118 #define TAG_LONGFILESIZES       5008
119 #define TAG_LONGSIZE            5009
120
121 /* signature tags */
122 #define TAG_SIGBASE             256
123 #define TAG_SIGMD5              (TAG_SIGBASE + 5)
124 #define TAG_SHA1HEADER          (TAG_SIGBASE + 13)
125
126 #define SIGTAG_SIZE             1000
127 #define SIGTAG_PGP              1002    /* RSA signature */
128 #define SIGTAG_MD5              1004    /* header+payload md5 checksum */
129 #define SIGTAG_GPG              1005    /* DSA signature */
130
131 #define DEP_LESS                (1 << 1)
132 #define DEP_GREATER             (1 << 2)
133 #define DEP_EQUAL               (1 << 3)
134 #define DEP_STRONG              (1 << 27)
135 #define DEP_PRE                 ((1 << 6) | (1 << 9) | (1 << 10) | (1 << 11) | (1 << 12))
136
137 #define FILEFLAG_GHOST          (1 <<  6)
138
139
140 #ifdef RPM5
141 # define RPM_INDEX_SIZE 4
142 #else
143 # define RPM_INDEX_SIZE 8
144 #endif
145
146
147 typedef struct rpmhead {
148   int cnt;
149   int dcnt;
150   unsigned char *dp;
151   int forcebinary;              /* sigh */
152   unsigned char data[1];
153 } RpmHead;
154
155
156 static inline unsigned char *
157 headfindtag(RpmHead *h, int tag)
158 {
159   unsigned int i;
160   unsigned char *d, taga[4];
161   d = h->dp - 16;
162   taga[0] = tag >> 24;
163   taga[1] = tag >> 16;
164   taga[2] = tag >> 8;
165   taga[3] = tag;
166   for (i = 0; i < h->cnt; i++, d -= 16)
167     if (d[3] == taga[3] && d[2] == taga[2] && d[1] == taga[1] && d[0] == taga[0])
168       return d;
169   return 0;
170 }
171
172 static int
173 headexists(RpmHead *h, int tag)
174 {
175   return headfindtag(h, tag) ? 1 : 0;
176 }
177
178 static unsigned int *
179 headint32array(RpmHead *h, int tag, int *cnt)
180 {
181   unsigned int i, o, *r;
182   unsigned char *d = headfindtag(h, tag);
183
184   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 4)
185     return 0;
186   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
187   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
188   if (o + 4 * i > h->dcnt)
189     return 0;
190   d = h->dp + o;
191   r = solv_calloc(i ? i : 1, sizeof(unsigned int));
192   if (cnt)
193     *cnt = i;
194   for (o = 0; o < i; o++, d += 4)
195     r[o] = d[0] << 24 | d[1] << 16 | d[2] << 8 | d[3];
196   return r;
197 }
198
199 /* returns the first entry of an integer array */
200 static unsigned int
201 headint32(RpmHead *h, int tag)
202 {
203   unsigned int i, o;
204   unsigned char *d = headfindtag(h, tag);
205
206   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 4)
207     return 0;
208   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
209   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
210   if (i == 0 || o + 4 * i > h->dcnt)
211     return 0;
212   d = h->dp + o;
213   return d[0] << 24 | d[1] << 16 | d[2] << 8 | d[3];
214 }
215
216 /* returns the first entry of an 64bit integer array */
217 static unsigned long long
218 headint64(RpmHead *h, int tag)
219 {
220   unsigned int i, o;
221   unsigned char *d = headfindtag(h, tag);
222   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 5)
223     return 0;
224   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
225   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
226   if (i == 0 || o + 8 * i > h->dcnt)
227     return 0;
228   d = h->dp + o;
229   i = d[0] << 24 | d[1] << 16 | d[2] << 8 | d[3];
230   return (unsigned long long)i << 32 | (d[4] << 24 | d[5] << 16 | d[6] << 8 | d[7]);
231 }
232
233 static unsigned int *
234 headint16array(RpmHead *h, int tag, int *cnt)
235 {
236   unsigned int i, o, *r;
237   unsigned char *d = headfindtag(h, tag);
238
239   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 3)
240     return 0;
241   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
242   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
243   if (o + 4 * i > h->dcnt)
244     return 0;
245   d = h->dp + o;
246   r = solv_calloc(i ? i : 1, sizeof(unsigned int));
247   if (cnt)
248     *cnt = i;
249   for (o = 0; o < i; o++, d += 2)
250     r[o] = d[0] << 8 | d[1];
251   return r;
252 }
253
254 static char *
255 headstring(RpmHead *h, int tag)
256 {
257   unsigned int o;
258   unsigned char *d = headfindtag(h, tag);
259   /* 6: STRING, 9: I18NSTRING */
260   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || (d[7] != 6 && d[7] != 9))
261     return 0;
262   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
263   if (o >= h->dcnt)
264     return 0;
265   return (char *)h->dp + o;
266 }
267
268 static char **
269 headstringarray(RpmHead *h, int tag, int *cnt)
270 {
271   unsigned int i, o;
272   unsigned char *d = headfindtag(h, tag);
273   char **r;
274
275   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 8)
276     return 0;
277   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
278   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
279   r = solv_calloc(i ? i : 1, sizeof(char *));
280   if (cnt)
281     *cnt = i;
282   d = h->dp + o;
283   for (o = 0; o < i; o++)
284     {
285       r[o] = (char *)d;
286       if (o + 1 < i)
287         d += strlen((char *)d) + 1;
288       if (d >= h->dp + h->dcnt)
289         {
290           solv_free(r);
291           return 0;
292         }
293     }
294   return r;
295 }
296
297 static unsigned char *
298 headbinary(RpmHead *h, int tag, unsigned int *sizep)
299 {
300   unsigned int i, o;
301   unsigned char *d = headfindtag(h, tag);
302   if (!d || d[4] != 0 || d[5] != 0 || d[6] != 0 || d[7] != 7)
303     return 0;
304   o = d[8] << 24 | d[9] << 16 | d[10] << 8 | d[11];
305   i = d[12] << 24 | d[13] << 16 | d[14] << 8 | d[15];
306   if (o > h->dcnt || o + i < o || o + i > h->dcnt)
307     return 0;
308   if (sizep)
309     *sizep = i;
310   return h->dp + o;
311 }
312
313 static char *headtoevr(RpmHead *h)
314 {
315   unsigned int epoch;
316   char *version, *v;
317   char *release;
318   char *evr;
319   char *distepoch;
320
321   version  = headstring(h, TAG_VERSION);
322   release  = headstring(h, TAG_RELEASE);
323   epoch = headint32(h, TAG_EPOCH);
324   if (!version || !release)
325     {
326       fprintf(stderr, "headtoevr: bad rpm header\n");
327       return 0;
328     }
329   for (v = version; *v >= '0' && *v <= '9'; v++)
330     ;
331   if (epoch || (v != version && *v == ':'))
332     {
333       char epochbuf[11];        /* 32bit decimal will fit in */
334       sprintf(epochbuf, "%u", epoch);
335       evr = solv_malloc(strlen(epochbuf) + 1 + strlen(version) + 1 + strlen(release) + 1);
336       sprintf(evr, "%s:%s-%s", epochbuf, version, release);
337     }
338   else
339     {
340       evr = solv_malloc(strlen(version) + 1 + strlen(release) + 1);
341       sprintf(evr, "%s-%s", version, release);
342     }
343   distepoch = headstring(h, TAG_DISTEPOCH);
344   if (distepoch && *distepoch)
345     {
346       int l = strlen(evr);
347       evr = solv_realloc(evr, l + strlen(distepoch) + 2);
348       evr[l++] = ':';
349       strcpy(evr + l, distepoch);
350     }
351   return evr;
352 }
353
354
355 static void
356 setutf8string(Repodata *repodata, Id handle, Id tag, const char *str)
357 {
358   const unsigned char *cp;
359   int state = 0;
360   int c;
361   unsigned char *buf = 0, *bp;
362
363   /* check if it's already utf8, code taken from screen ;-) */
364   cp = (const unsigned char *)str;
365   while ((c = *cp++) != 0)
366     {
367       if (state)
368         {
369           if ((c & 0xc0) != 0x80)
370             break; /* encoding error */
371           c = (c & 0x3f) | (state << 6);
372           if (!(state & 0x40000000))
373             {
374               /* check for overlong sequences */
375               if ((c & 0x820823e0) == 0x80000000)
376                 break;
377               else if ((c & 0x020821f0) == 0x02000000)
378                 break;
379               else if ((c & 0x000820f8) == 0x00080000)
380                 break;
381               else if ((c & 0x0000207c) == 0x00002000)
382                 break;
383             }
384         }
385       else
386         {
387           /* new sequence */
388           if (c >= 0xfe)
389             break;
390           else if (c >= 0xfc)
391             c = (c & 0x01) | 0xbffffffc;    /* 5 bytes to follow */
392           else if (c >= 0xf8)
393             c = (c & 0x03) | 0xbfffff00;    /* 4 */
394           else if (c >= 0xf0)
395             c = (c & 0x07) | 0xbfffc000;    /* 3 */
396           else if (c >= 0xe0)
397             c = (c & 0x0f) | 0xbff00000;    /* 2 */
398           else if (c >= 0xc2)
399             c = (c & 0x1f) | 0xfc000000;    /* 1 */
400           else if (c >= 0x80)
401             break;
402         }
403       state = (c & 0x80000000) ? c : 0;
404     }
405   if (c)
406     {
407       /* not utf8, assume latin1 */
408       buf = solv_malloc(2 * strlen(str) + 1);
409       cp = (const unsigned char *)str;
410       str = (char *)buf;
411       bp = buf;
412       while ((c = *cp++) != 0)
413         {
414           if (c >= 0xc0)
415             {
416               *bp++ = 0xc3;
417               c ^= 0x80;
418             }
419           else if (c >= 0x80)
420             *bp++ = 0xc2;
421           *bp++ = c;
422         }
423       *bp++ = 0;
424     }
425   repodata_set_str(repodata, handle, tag, str);
426   if (buf)
427     solv_free(buf);
428 }
429
430
431 #define MAKEDEPS_FILTER_WEAK    (1 << 0)
432 #define MAKEDEPS_FILTER_STRONG  (1 << 1)
433 #define MAKEDEPS_NO_RPMLIB      (1 << 2)
434
435 /*
436  * strong: 0: ignore strongness
437  *         1: filter to strong
438  *         2: filter to weak
439  */
440 static unsigned int
441 makedeps(Pool *pool, Repo *repo, RpmHead *rpmhead, int tagn, int tagv, int tagf, int flags)
442 {
443   char **n, **v;
444   unsigned int *f;
445   int i, cc, nc, vc, fc;
446   int haspre;
447   unsigned int olddeps;
448   Id *ida;
449   int strong;
450
451   strong = flags & (MAKEDEPS_FILTER_STRONG|MAKEDEPS_FILTER_WEAK);
452   n = headstringarray(rpmhead, tagn, &nc);
453   if (!n || !nc)
454     return 0;
455   vc = fc = 0;
456   v = headstringarray(rpmhead, tagv, &vc);
457   f = headint32array(rpmhead, tagf, &fc);
458   if (!v || !f || nc != vc || nc != fc)
459     {
460       char *pkgname = rpm_query(rpmhead, 0);
461       pool_error(pool, 0, "bad dependency entries for %s: %d %d %d", pkgname ? pkgname : "<NULL>", nc, vc, fc);
462       solv_free(pkgname);
463       solv_free(n);
464       solv_free(v);
465       solv_free(f);
466       return 0;
467     }
468
469   cc = nc;
470   haspre = 0;   /* add no prereq marker */
471   if (flags)
472     {
473       /* we do filtering */
474       cc = 0;
475       for (i = 0; i < nc; i++)
476         {
477           if (strong && (f[i] & DEP_STRONG) != (strong == MAKEDEPS_FILTER_WEAK ? 0 : DEP_STRONG))
478             continue;
479           if ((flags & MAKEDEPS_NO_RPMLIB) != 0)
480             if (!strncmp(n[i], "rpmlib(", 7))
481               continue;
482           if ((f[i] & DEP_PRE) != 0)
483             haspre = 1;
484           cc++;
485         }
486     }
487   else if (tagn == TAG_REQUIRENAME)
488     {
489       /* no filtering, just look for the first prereq */
490       for (i = 0; i < nc; i++)
491         if ((f[i] & DEP_PRE) != 0)
492           {
493             haspre = 1;
494             break;
495           }
496     }
497   if (cc == 0)
498     {
499       solv_free(n);
500       solv_free(v);
501       solv_free(f);
502       return 0;
503     }
504   cc += haspre;
505   olddeps = repo_reserve_ids(repo, 0, cc);
506   ida = repo->idarraydata + olddeps;
507   for (i = 0; ; i++)
508     {
509       if (i == nc)
510         {
511           if (haspre != 1)
512             break;
513           haspre = 2;   /* pass two: prereqs */
514           i = 0;
515           *ida++ = SOLVABLE_PREREQMARKER;
516         }
517       if (strong && (f[i] & DEP_STRONG) != (strong == MAKEDEPS_FILTER_WEAK ? 0 : DEP_STRONG))
518         continue;
519       if (haspre == 1 && (f[i] & DEP_PRE) != 0)
520         continue;
521       if (haspre == 2 && (f[i] & DEP_PRE) == 0)
522         continue;
523       if ((flags & MAKEDEPS_NO_RPMLIB) != 0)
524         if (!strncmp(n[i], "rpmlib(", 7))
525           continue;
526       if (f[i] & (DEP_LESS|DEP_GREATER|DEP_EQUAL))
527         {
528           Id name, evr;
529           int flags = 0;
530           if ((f[i] & DEP_LESS) != 0)
531             flags |= 4;
532           if ((f[i] & DEP_EQUAL) != 0)
533             flags |= 2;
534           if ((f[i] & DEP_GREATER) != 0)
535             flags |= 1;
536           name = pool_str2id(pool, n[i], 1);
537           if (v[i][0] == '0' && v[i][1] == ':' && v[i][2])
538             evr = pool_str2id(pool, v[i] + 2, 1);
539           else
540             evr = pool_str2id(pool, v[i], 1);
541           *ida++ = pool_rel2id(pool, name, evr, flags, 1);
542         }
543       else
544         *ida++ = pool_str2id(pool, n[i], 1);
545     }
546   *ida++ = 0;
547   repo->idarraysize += cc + 1;
548   solv_free(n);
549   solv_free(v);
550   solv_free(f);
551   return olddeps;
552 }
553
554
555 static void
556 adddudata(Repodata *data, Id handle, RpmHead *rpmhead, char **dn, unsigned int *di, int fc, int dc)
557 {
558   Id did;
559   int i, fszc;
560   unsigned int *fkb, *fn, *fsz, *fm, *fino;
561   unsigned int inotest[256], inotestok;
562
563   if (!fc)
564     return;
565   /* XXX: use TAG_LONGFILESIZES if available */
566   fsz = headint32array(rpmhead, TAG_FILESIZES, &fszc);
567   if (!fsz || fc != fszc)
568     {
569       solv_free(fsz);
570       return;
571     }
572   /* stupid rpm records sizes of directories, so we have to check the mode */
573   fm = headint16array(rpmhead, TAG_FILEMODES, &fszc);
574   if (!fm || fc != fszc)
575     {
576       solv_free(fsz);
577       solv_free(fm);
578       return;
579     }
580   fino = headint32array(rpmhead, TAG_FILEINODES, &fszc);
581   if (!fino || fc != fszc)
582     {
583       solv_free(fsz);
584       solv_free(fm);
585       solv_free(fino);
586       return;
587     }
588   inotestok = 0;
589   if (fc < sizeof(inotest))
590     {
591       memset(inotest, 0, sizeof(inotest));
592       for (i = 0; i < fc; i++)
593         {
594           int off, bit;
595           if (fsz[i] == 0 || !S_ISREG(fm[i]))
596             continue;
597           off = (fino[i] >> 5) & (sizeof(inotest)/sizeof(*inotest) - 1);
598           bit = 1 << (fino[i] & 31);
599           if ((inotest[off] & bit) != 0)
600             break;
601           inotest[off] |= bit;
602         }
603       if (i == fc)
604         inotestok = 1;
605     }
606   if (!inotestok)
607     {
608       unsigned int *fdev = headint32array(rpmhead, TAG_FILEDEVICES, &fszc);
609       unsigned int *fx, j;
610       unsigned int mask, hash, hh;
611       if (!fdev || fc != fszc)
612         {
613           solv_free(fsz);
614           solv_free(fm);
615           solv_free(fdev);
616           solv_free(fino);
617           return;
618         }
619       mask = fc;
620       while ((mask & (mask - 1)) != 0)
621         mask = mask & (mask - 1);
622       mask <<= 2;
623       if (mask > sizeof(inotest)/sizeof(*inotest))
624         fx = solv_calloc(mask, sizeof(unsigned int));
625       else
626         {
627           fx = inotest;
628           memset(fx, 0, mask * sizeof(unsigned int));
629         }
630       mask--;
631       for (i = 0; i < fc; i++)
632         {
633           if (fsz[i] == 0 || !S_ISREG(fm[i]))
634             continue;
635           hash = (fino[i] + fdev[i] * 31) & mask;
636           hh = 7;
637           while ((j = fx[hash]) != 0)
638             {
639               if (fino[j - 1] == fino[i] && fdev[j - 1] == fdev[i])
640                 {
641                   fsz[i] = 0;   /* kill entry */
642                   break;
643                 }
644               hash = (hash + hh++) & mask;
645             }
646           if (!j)
647             fx[hash] = i + 1;
648         }
649       if (fx != inotest)
650         solv_free(fx);
651       solv_free(fdev);
652     }
653   solv_free(fino);
654   fn = solv_calloc(dc, sizeof(unsigned int));
655   fkb = solv_calloc(dc, sizeof(unsigned int));
656   for (i = 0; i < fc; i++)
657     {
658       if (di[i] >= dc)
659         continue;
660       fn[di[i]]++;
661       if (fsz[i] == 0 || !S_ISREG(fm[i]))
662         continue;
663       fkb[di[i]] += fsz[i] / 1024 + 1;
664     }
665   solv_free(fsz);
666   solv_free(fm);
667   /* commit */
668   for (i = 0; i < dc; i++)
669     {
670       if (!fn[i])
671         continue;
672       if (!*dn[i])
673         {
674           Solvable *s = data->repo->pool->solvables + handle;
675           if (s->arch == ARCH_SRC || s->arch == ARCH_NOSRC)
676             did = repodata_str2dir(data, "/usr/src", 1);
677           else
678             continue;   /* work around rpm bug */
679         }
680       else
681         did = repodata_str2dir(data, dn[i], 1);
682       repodata_add_dirnumnum(data, handle, SOLVABLE_DISKUSAGE, did, fkb[i], fn[i]);
683     }
684   solv_free(fn);
685   solv_free(fkb);
686 }
687
688 static void
689 addfilelist(Repodata *data, Id handle, RpmHead *rpmhead)
690 {
691   char **bn;
692   char **dn;
693   unsigned int *di;
694   int bnc, dnc, dic;
695   int i;
696   Id lastdid = 0;
697   int lastdii = -1;
698
699   if (!data)
700     return;
701   bn = headstringarray(rpmhead, TAG_BASENAMES, &bnc);
702   if (!bn)
703     return;
704   dn = headstringarray(rpmhead, TAG_DIRNAMES, &dnc);
705   if (!dn)
706     {
707       solv_free(bn);
708       return;
709     }
710   di = headint32array(rpmhead, TAG_DIRINDEXES, &dic);
711   if (!di)
712     {
713       solv_free(bn);
714       solv_free(dn);
715       return;
716     }
717   if (bnc != dic)
718     {
719       pool_error(data->repo->pool, 0, "bad filelist");
720       return;
721     }
722
723   adddudata(data, handle, rpmhead, dn, di, bnc, dnc);
724
725   for (i = 0; i < bnc; i++)
726     {
727       Id did;
728       char *b = bn[i];
729
730       if (di[i] == lastdii)
731         did = lastdid;
732       else
733         {
734           did = repodata_str2dir(data, dn[di[i]], 1);
735           if (!did)
736             did = repodata_str2dir(data, "/", 1);
737           lastdid = did;
738           lastdii = di[i];
739         }
740       if (b && *b == '/')       /* work around rpm bug */
741         b++;
742       repodata_add_dirstr(data, handle, SOLVABLE_FILELIST, did, b);
743     }
744   solv_free(bn);
745   solv_free(dn);
746   solv_free(di);
747 }
748
749 static void
750 addchangelog(Repodata *data, Id handle, RpmHead *rpmhead)
751 {
752   char **cn;
753   char **cx;
754   unsigned int *ct;
755   int i, cnc, cxc, ctc;
756   Queue hq;
757
758   ct = headint32array(rpmhead, TAG_CHANGELOGTIME, &ctc);
759   cx = headstringarray(rpmhead, TAG_CHANGELOGTEXT, &cxc);
760   cn = headstringarray(rpmhead, TAG_CHANGELOGNAME, &cnc);
761   if (!ct || !cx || !cn || !ctc || ctc != cxc || ctc != cnc)
762     {
763       solv_free(ct);
764       solv_free(cx);
765       solv_free(cn);
766       return;
767     }
768   queue_init(&hq);
769   for (i = 0; i < ctc; i++)
770     {
771       Id h = repodata_new_handle(data);
772       if (ct[i])
773         repodata_set_num(data, h, SOLVABLE_CHANGELOG_TIME, ct[i]);
774       if (cn[i])
775         repodata_set_str(data, h, SOLVABLE_CHANGELOG_AUTHOR, cn[i]);
776       if (cx[i])
777         repodata_set_str(data, h, SOLVABLE_CHANGELOG_TEXT, cx[i]);
778       queue_push(&hq, h);
779     }
780   for (i = 0; i < hq.count; i++)
781     repodata_add_flexarray(data, handle, SOLVABLE_CHANGELOG, hq.elements[i]);
782   queue_free(&hq);
783   solv_free(ct);
784   solv_free(cx);
785   solv_free(cn);
786 }
787
788
789 static int
790 rpm2solv(Pool *pool, Repo *repo, Repodata *data, Solvable *s, RpmHead *rpmhead, int flags)
791 {
792   char *name;
793   char *evr;
794   char *sourcerpm;
795
796   name = headstring(rpmhead, TAG_NAME);
797   if (!name)
798     {
799       pool_error(pool, 0, "package has no name");
800       return 0;
801     }
802   if (!strcmp(name, "gpg-pubkey"))
803     return 0;
804   s->name = pool_str2id(pool, name, 1);
805   sourcerpm = headstring(rpmhead, TAG_SOURCERPM);
806   if (sourcerpm || (rpmhead->forcebinary && !headexists(rpmhead, TAG_SOURCEPACKAGE)))
807     s->arch = pool_str2id(pool, headstring(rpmhead, TAG_ARCH), 1);
808   else
809     {
810       if (headexists(rpmhead, TAG_NOSOURCE) || headexists(rpmhead, TAG_NOPATCH))
811         s->arch = ARCH_NOSRC;
812       else
813         s->arch = ARCH_SRC;
814     }
815   if (!s->arch)
816     s->arch = ARCH_NOARCH;
817   evr = headtoevr(rpmhead);
818   s->evr = pool_str2id(pool, evr, 1);
819   s->vendor = pool_str2id(pool, headstring(rpmhead, TAG_VENDOR), 1);
820
821   s->provides = makedeps(pool, repo, rpmhead, TAG_PROVIDENAME, TAG_PROVIDEVERSION, TAG_PROVIDEFLAGS, 0);
822   if (s->arch != ARCH_SRC && s->arch != ARCH_NOSRC)
823     s->provides = repo_addid_dep(repo, s->provides, pool_rel2id(pool, s->name, s->evr, REL_EQ, 1), 0);
824   s->requires = makedeps(pool, repo, rpmhead, TAG_REQUIRENAME, TAG_REQUIREVERSION, TAG_REQUIREFLAGS, (flags & RPM_ADD_NO_RPMLIBREQS) ? MAKEDEPS_NO_RPMLIB : 0);
825   s->conflicts = makedeps(pool, repo, rpmhead, TAG_CONFLICTNAME, TAG_CONFLICTVERSION, TAG_CONFLICTFLAGS, 0);
826   s->obsoletes = makedeps(pool, repo, rpmhead, TAG_OBSOLETENAME, TAG_OBSOLETEVERSION, TAG_OBSOLETEFLAGS, 0);
827
828   s->recommends = makedeps(pool, repo, rpmhead, TAG_SUGGESTSNAME, TAG_SUGGESTSVERSION, TAG_SUGGESTSFLAGS, MAKEDEPS_FILTER_STRONG);
829   s->suggests = makedeps(pool, repo, rpmhead, TAG_SUGGESTSNAME, TAG_SUGGESTSVERSION, TAG_SUGGESTSFLAGS, MAKEDEPS_FILTER_WEAK);
830   s->supplements = makedeps(pool, repo, rpmhead, TAG_ENHANCESNAME, TAG_ENHANCESVERSION, TAG_ENHANCESFLAGS, MAKEDEPS_FILTER_STRONG);
831   s->enhances  = makedeps(pool, repo, rpmhead, TAG_ENHANCESNAME, TAG_ENHANCESVERSION, TAG_ENHANCESFLAGS, MAKEDEPS_FILTER_WEAK);
832   s->supplements = repo_fix_supplements(repo, s->provides, s->supplements, 0);
833   s->conflicts = repo_fix_conflicts(repo, s->conflicts);
834
835   if (data)
836     {
837       Id handle;
838       char *str;
839       unsigned int u32;
840       unsigned long long u64;
841
842       handle = s - pool->solvables;
843       str = headstring(rpmhead, TAG_SUMMARY);
844       if (str)
845         setutf8string(data, handle, SOLVABLE_SUMMARY, str);
846       str = headstring(rpmhead, TAG_DESCRIPTION);
847       if (str)
848         {
849           char *aut, *p;
850           for (aut = str; (aut = strchr(aut, '\n')) != 0; aut++)
851             if (!strncmp(aut, "\nAuthors:\n--------\n", 19))
852               break;
853           if (aut)
854             {
855               /* oh my, found SUSE special author section */
856               int l = aut - str;
857               str = solv_strdup(str);
858               aut = str + l;
859               str[l] = 0;
860               while (l > 0 && str[l - 1] == '\n')
861                 str[--l] = 0;
862               if (l)
863                 setutf8string(data, handle, SOLVABLE_DESCRIPTION, str);
864               p = aut + 19;
865               aut = str;        /* copy over */
866               while (*p == ' ' || *p == '\n')
867                 p++;
868               while (*p)
869                 {
870                   if (*p == '\n')
871                     {
872                       *aut++ = *p++;
873                       while (*p == ' ')
874                         p++;
875                       continue;
876                     }
877                   *aut++ = *p++;
878                 }
879               while (aut != str && aut[-1] == '\n')
880                 aut--;
881               *aut = 0;
882               if (*str)
883                 setutf8string(data, handle, SOLVABLE_AUTHORS, str);
884               free(str);
885             }
886           else if (*str)
887             setutf8string(data, handle, SOLVABLE_DESCRIPTION, str);
888         }
889       str = headstring(rpmhead, TAG_GROUP);
890       if (str)
891         repodata_set_poolstr(data, handle, SOLVABLE_GROUP, str);
892       str = headstring(rpmhead, TAG_LICENSE);
893       if (str)
894         repodata_set_poolstr(data, handle, SOLVABLE_LICENSE, str);
895       str = headstring(rpmhead, TAG_URL);
896       if (str)
897         repodata_set_str(data, handle, SOLVABLE_URL, str);
898       str = headstring(rpmhead, TAG_DISTRIBUTION);
899       if (str)
900         repodata_set_poolstr(data, handle, SOLVABLE_DISTRIBUTION, str);
901       str = headstring(rpmhead, TAG_PACKAGER);
902       if (str)
903         repodata_set_poolstr(data, handle, SOLVABLE_PACKAGER, str);
904       if ((flags & RPM_ADD_WITH_PKGID) != 0)
905         {
906           unsigned char *chksum;
907           unsigned int chksumsize;
908           chksum = headbinary(rpmhead, TAG_SIGMD5, &chksumsize);
909           if (chksum && chksumsize == 16)
910             repodata_set_bin_checksum(data, handle, SOLVABLE_PKGID, REPOKEY_TYPE_MD5, chksum);
911         }
912       if ((flags & RPM_ADD_WITH_HDRID) != 0)
913         {
914           str = headstring(rpmhead, TAG_SHA1HEADER);
915           if (str && strlen(str) == 40)
916             repodata_set_checksum(data, handle, SOLVABLE_HDRID, REPOKEY_TYPE_SHA1, str);
917           else if (str && strlen(str) == 64)
918             repodata_set_checksum(data, handle, SOLVABLE_HDRID, REPOKEY_TYPE_SHA256, str);
919         }
920       u32 = headint32(rpmhead, TAG_BUILDTIME);
921       if (u32)
922         repodata_set_num(data, handle, SOLVABLE_BUILDTIME, u32);
923       u32 = headint32(rpmhead, TAG_INSTALLTIME);
924       if (u32)
925         repodata_set_num(data, handle, SOLVABLE_INSTALLTIME, u32);
926       u64 = headint64(rpmhead, TAG_LONGSIZE);
927       if (u64)
928         repodata_set_num(data, handle, SOLVABLE_INSTALLSIZE, u64);
929       else
930         {
931           u32 = headint32(rpmhead, TAG_SIZE);
932           if (u32)
933             repodata_set_num(data, handle, SOLVABLE_INSTALLSIZE, u32);
934         }
935       if (sourcerpm)
936         repodata_set_sourcepkg(data, handle, sourcerpm);
937       if ((flags & RPM_ADD_TRIGGERS) != 0)
938         {
939           Id id, lastid;
940           unsigned int ida = makedeps(pool, repo, rpmhead, TAG_TRIGGERNAME, TAG_TRIGGERVERSION, TAG_TRIGGERFLAGS, 0);
941
942           lastid = 0;
943           for (; (id = repo->idarraydata[ida]) != 0; ida++)
944             {
945               /* we currently do not support rel ids in incore data, so
946                * strip off versioning information */
947               while (ISRELDEP(id))
948                 {
949                   Reldep *rd = GETRELDEP(pool, id);
950                   id = rd->name;
951                 }
952               if (id == lastid)
953                 continue;
954               repodata_add_idarray(data, handle, SOLVABLE_TRIGGERS, id);
955               lastid = id;
956             }
957         }
958       if ((flags & RPM_ADD_NO_FILELIST) == 0)
959         addfilelist(data, handle, rpmhead);
960       if ((flags & RPM_ADD_WITH_CHANGELOG) != 0)
961         addchangelog(data, handle, rpmhead);
962     }
963   solv_free(evr);
964   return 1;
965 }
966
967
968 /******************************************************************/
969 /*  Rpm Database stuff
970  */
971
972 struct rpmdbstate {
973   Pool *pool; 
974   char *rootdir;
975
976   RpmHead *rpmhead;     /* header storage space */
977   int rpmheadsize;
978
979   int dbopened;
980   DB_ENV *dbenv;        /* database environment */
981   DB *db;               /* packages database */
982   int byteswapped;      /* endianess of packages database */
983 };
984
985 struct rpmdbentry {
986   Id rpmdbid;
987   Id nameoff;
988 };
989
990 #define ENTRIES_BLOCK 255
991 #define NAMEDATA_BLOCK 1023
992
993
994 static inline Id db2rpmdbid(unsigned char *db, int byteswapped)
995 {
996 #ifdef RPM5
997   return db[0] << 24 | db[1] << 16 | db[2] << 8 | db[3];
998 #else
999 # if defined(WORDS_BIGENDIAN)
1000   if (!byteswapped)
1001 # else
1002   if (byteswapped)
1003 # endif
1004     return db[0] << 24 | db[1] << 16 | db[2] << 8 | db[3];
1005   else
1006     return db[3] << 24 | db[2] << 16 | db[1] << 8 | db[0];
1007 #endif
1008 }
1009
1010 static inline void rpmdbid2db(unsigned char *db, Id id, int byteswapped)
1011 {
1012 #ifdef RPM5
1013   db[0] = id >> 24, db[1] = id >> 16, db[2] = id >> 8, db[3] = id;
1014 #else
1015 # if defined(WORDS_BIGENDIAN)
1016   if (!byteswapped)
1017 # else
1018   if (byteswapped)
1019 # endif
1020     db[0] = id >> 24, db[1] = id >> 16, db[2] = id >> 8, db[3] = id;
1021   else
1022     db[3] = id >> 24, db[2] = id >> 16, db[1] = id >> 8, db[0] = id;
1023 #endif
1024 }
1025
1026 /* should look in /usr/lib/rpm/macros instead, but we want speed... */
1027 static int
1028 opendbenv(struct rpmdbstate *state, const char *rootdir)
1029 {
1030   char dbpath[PATH_MAX];
1031   DB_ENV *dbenv = 0;
1032   int r;
1033
1034   if (db_env_create(&dbenv, 0))
1035     return pool_error(state->pool, 0, "db_env_create: %s", strerror(errno));
1036 #if defined(FEDORA) && (DB_VERSION_MAJOR >= 5 || (DB_VERSION_MAJOR == 4 && DB_VERSION_MINOR >= 5))
1037   dbenv->set_thread_count(dbenv, 8);
1038 #endif
1039   snprintf(dbpath, PATH_MAX, "%s/var/lib/rpm", rootdir ? rootdir : "");
1040   if (access(dbpath, W_OK) == -1)
1041     {
1042       r = dbenv->open(dbenv, dbpath, DB_CREATE|DB_PRIVATE|DB_INIT_MPOOL, 0);
1043     }
1044   else
1045     {
1046 #ifdef FEDORA
1047       r = dbenv->open(dbenv, dbpath, DB_CREATE|DB_INIT_CDB|DB_INIT_MPOOL, 0644);
1048 #else
1049       r = dbenv->open(dbenv, dbpath, DB_CREATE|DB_PRIVATE|DB_INIT_MPOOL, 0);
1050 #endif
1051     }
1052   if (r)
1053     {
1054       pool_error(state->pool, 0, "dbenv->open: %s", strerror(errno));
1055       dbenv->close(dbenv, 0);
1056       return 0;
1057     }
1058   state->dbenv = dbenv;
1059   return 1;
1060 }
1061
1062 static int
1063 openpkgdb(struct rpmdbstate *state)
1064 {
1065   if (state->dbopened)
1066     return state->dbopened > 0 ? 1 : 0;
1067   state->dbopened = -1;
1068   if (!state->dbenv && !opendbenv(state, state->rootdir))
1069     return 0;
1070   if (db_create(&state->db, state->dbenv, 0))
1071     {
1072       pool_error(state->pool, 0, "db_create: %s", strerror(errno));
1073       state->db = 0;
1074       state->dbenv->close(state->dbenv, 0);
1075       state->dbenv = 0;
1076       return 0;
1077     }
1078   if (state->db->open(state->db, 0, "Packages", 0, DB_UNKNOWN, DB_RDONLY, 0664))
1079     {
1080       pool_error(state->pool, 0, "db->open Packages: %s", strerror(errno));
1081       state->db->close(state->db, 0);
1082       state->db = 0;
1083       state->dbenv->close(state->dbenv, 0);
1084       state->dbenv = 0;
1085       return 0;
1086     }
1087   if (state->db->get_byteswapped(state->db, &state->byteswapped))
1088     {
1089       pool_error(state->pool, 0, "db->get_byteswapped: %s", strerror(errno));
1090       state->db->close(state->db, 0);
1091       state->db = 0;
1092       state->dbenv->close(state->dbenv, 0);
1093       state->dbenv = 0;
1094       return 0;
1095     }
1096   state->dbopened = 1;
1097   return 1;
1098 }
1099
1100 /* get the rpmdbids of all installed packages from the Name index database.
1101  * This is much faster then querying the big Packages database */
1102 static struct rpmdbentry *
1103 getinstalledrpmdbids(struct rpmdbstate *state, const char *index, const char *match, int *nentriesp, char **namedatap)
1104 {
1105   DB_ENV *dbenv = 0;
1106   DB *db = 0;
1107   DBC *dbc = 0;
1108   int byteswapped;
1109   DBT dbkey;
1110   DBT dbdata;
1111   unsigned char *dp;
1112   int dl;
1113   Id nameoff;
1114
1115   char *namedata = 0;
1116   int namedatal = 0;
1117   struct rpmdbentry *entries = 0;
1118   int nentries = 0;
1119
1120   *nentriesp = 0;
1121   if (namedatap)
1122     *namedatap = 0;
1123
1124   if (!state->dbenv && !opendbenv(state, state->rootdir))
1125     return 0;
1126   dbenv = state->dbenv;
1127   if (db_create(&db, dbenv, 0))
1128     {
1129       pool_error(state->pool, 0, "db_create: %s", strerror(errno));
1130       return 0;
1131     }
1132   if (db->open(db, 0, index, 0, DB_UNKNOWN, DB_RDONLY, 0664))
1133     {
1134       pool_error(state->pool, 0, "db->open %s: %s", index, strerror(errno));
1135       db->close(db, 0);
1136       return 0;
1137     }
1138   if (db->get_byteswapped(db, &byteswapped))
1139     {
1140       pool_error(state->pool, 0, "db->get_byteswapped: %s", strerror(errno));
1141       db->close(db, 0);
1142       return 0;
1143     }
1144   if (db->cursor(db, NULL, &dbc, 0))
1145     {
1146       pool_error(state->pool, 0, "db->cursor: %s", strerror(errno));
1147       db->close(db, 0);
1148       return 0;
1149     }
1150   memset(&dbkey, 0, sizeof(dbkey));
1151   memset(&dbdata, 0, sizeof(dbdata));
1152   if (match)
1153     {
1154       dbkey.data = (void *)match;
1155       dbkey.size = strlen(match);
1156     }
1157   while (dbc->c_get(dbc, &dbkey, &dbdata, match ? DB_SET : DB_NEXT) == 0)
1158     {
1159       if (!match && dbkey.size == 10 && !memcmp(dbkey.data, "gpg-pubkey", 10))
1160         continue;
1161       dl = dbdata.size;
1162       dp = dbdata.data;
1163       nameoff = namedatal;
1164       if (namedatap)
1165         {
1166           namedata = solv_extend(namedata, namedatal, dbkey.size + 1, 1, NAMEDATA_BLOCK);
1167           memcpy(namedata + namedatal, dbkey.data, dbkey.size);
1168           namedata[namedatal + dbkey.size] = 0;
1169           namedatal += dbkey.size + 1;
1170         }
1171       while(dl >= RPM_INDEX_SIZE)
1172         {
1173           entries = solv_extend(entries, nentries, 1, sizeof(*entries), ENTRIES_BLOCK);
1174           entries[nentries].rpmdbid = db2rpmdbid(dp, byteswapped);
1175           entries[nentries].nameoff = nameoff;
1176           nentries++;
1177           dp += RPM_INDEX_SIZE;
1178           dl -= RPM_INDEX_SIZE;
1179         }
1180       if (match)
1181         break;
1182     }
1183   dbc->c_close(dbc);
1184   db->close(db, 0);
1185   /* make sure that enteries is != 0 if there was no error */
1186   if (!entries)
1187     entries = solv_extend(entries, 1, 1, sizeof(*entries), ENTRIES_BLOCK);
1188   *nentriesp = nentries;
1189   if (namedatap)
1190     *namedatap = namedata;
1191   return entries;
1192 }
1193
1194 /* retrive header by rpmdbid */
1195 static int
1196 getrpmdbid(struct rpmdbstate *state, Id rpmdbid)
1197 {
1198   unsigned char buf[16];
1199   DBT dbkey;
1200   DBT dbdata;
1201   RpmHead *rpmhead;
1202
1203   if (!rpmdbid)
1204     {
1205       pool_error(state->pool, 0, "illegal rpmdbid");
1206       return -1;
1207     }
1208   if (state->dbopened != 1 && !openpkgdb(state))
1209     return -1;
1210   rpmdbid2db(buf, rpmdbid, state->byteswapped);
1211   memset(&dbkey, 0, sizeof(dbkey));
1212   memset(&dbdata, 0, sizeof(dbdata));
1213   dbkey.data = buf;
1214   dbkey.size = 4;
1215   dbdata.data = 0;
1216   dbdata.size = 0;
1217   if (state->db->get(state->db, NULL, &dbkey, &dbdata, 0))
1218     return 0;
1219   if (dbdata.size < 8)
1220     {
1221       pool_error(state->pool, 0, "corrupt rpm database (size)");
1222       return -1;
1223     }
1224   if (dbdata.size > state->rpmheadsize)
1225     {
1226       state->rpmheadsize = dbdata.size + 128;
1227       state->rpmhead = solv_realloc(state->rpmhead, sizeof(*rpmhead) + state->rpmheadsize);
1228     }
1229   rpmhead = state->rpmhead;
1230   memcpy(buf, dbdata.data, 8);
1231   rpmhead->forcebinary = 1;
1232   rpmhead->cnt = buf[0] << 24  | buf[1] << 16  | buf[2] << 8 | buf[3];
1233   rpmhead->dcnt = buf[4] << 24  | buf[5] << 16  | buf[6] << 8 | buf[7];
1234   if (8 + rpmhead->cnt * 16 + rpmhead->dcnt > dbdata.size)
1235     {
1236       pool_error(state->pool, 0, "corrupt rpm database (data size)");
1237       return -1;
1238     }
1239   memcpy(rpmhead->data, (unsigned char *)dbdata.data + 8, rpmhead->cnt * 16 + rpmhead->dcnt);
1240   rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
1241   return 1;
1242 }
1243
1244 /* retrive header by berkeleydb cursor */
1245 static Id
1246 getrpmcursor(struct rpmdbstate *state, DBC *dbc)
1247 {
1248   unsigned char buf[16];
1249   DBT dbkey;
1250   DBT dbdata;
1251   RpmHead *rpmhead;
1252   Id dbid;
1253
1254   memset(&dbkey, 0, sizeof(dbkey));
1255   memset(&dbdata, 0, sizeof(dbdata));
1256   while (dbc->c_get(dbc, &dbkey, &dbdata, DB_NEXT) == 0)
1257     {
1258       if (dbkey.size != 4)
1259         return pool_error(state->pool, -1, "corrupt Packages database (key size)");
1260       dbid = db2rpmdbid(dbkey.data, state->byteswapped);
1261       if (dbid == 0)            /* the join key */
1262         continue;
1263       if (dbdata.size < 8)
1264         return pool_error(state->pool, -1, "corrupt rpm database (size %u)\n", dbdata.size);
1265       if (dbdata.size > state->rpmheadsize)
1266         {
1267           state->rpmheadsize = dbdata.size + 128;
1268           state->rpmhead = solv_realloc(state->rpmhead, sizeof(*state->rpmhead) + state->rpmheadsize);
1269         }
1270       rpmhead = state->rpmhead;
1271       memcpy(buf, dbdata.data, 8);
1272       rpmhead->forcebinary = 1;
1273       rpmhead->cnt = buf[0] << 24  | buf[1] << 16  | buf[2] << 8 | buf[3];
1274       rpmhead->dcnt = buf[4] << 24  | buf[5] << 16  | buf[6] << 8 | buf[7];
1275       if (8 + rpmhead->cnt * 16 + rpmhead->dcnt > dbdata.size)
1276         return pool_error(state->pool, -1, "corrupt rpm database (data size)\n");
1277       memcpy(rpmhead->data, (unsigned char *)dbdata.data + 8, rpmhead->cnt * 16 + rpmhead->dcnt);
1278       rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
1279       return dbid;
1280     }
1281   return 0;
1282 }
1283
1284 static void
1285 freestate(struct rpmdbstate *state)
1286 {
1287   /* close down */
1288   if (!state)
1289     return;
1290   if (state->rootdir)
1291     solv_free(state->rootdir);
1292   if (state->db)
1293     state->db->close(state->db, 0);
1294   if (state->dbenv)
1295     state->dbenv->close(state->dbenv, 0);
1296   solv_free(state->rpmhead);
1297 }
1298
1299 void *
1300 rpm_state_create(Pool *pool, const char *rootdir)
1301 {
1302   struct rpmdbstate *state;
1303   state = solv_calloc(1, sizeof(*state));
1304   state->pool = pool;
1305   if (rootdir)
1306     state->rootdir = solv_strdup(rootdir);
1307   return state;
1308 }
1309
1310 void *
1311 rpm_state_free(void *state)
1312 {
1313   freestate(state);
1314   return solv_free(state);
1315 }
1316
1317 static int
1318 count_headers(Pool *pool, const char *rootdir, DB_ENV *dbenv)
1319 {
1320   char dbpath[PATH_MAX];
1321   struct stat statbuf;
1322   DB *db = 0;
1323   DBC *dbc = 0;
1324   int count = 0;
1325   DBT dbkey;
1326   DBT dbdata;
1327
1328   snprintf(dbpath, PATH_MAX, "%s/var/lib/rpm/Name", rootdir ? rootdir : "");
1329   if (stat(dbpath, &statbuf))
1330     return 0;
1331   memset(&dbkey, 0, sizeof(dbkey));
1332   memset(&dbdata, 0, sizeof(dbdata));
1333   if (db_create(&db, dbenv, 0))
1334     {
1335       pool_error(pool, 0, "db_create: %s", strerror(errno));
1336       return 0;
1337     }
1338   if (db->open(db, 0, "Name", 0, DB_UNKNOWN, DB_RDONLY, 0664))
1339     {
1340       pool_error(pool, 0, "db->open Name: %s", strerror(errno));
1341       db->close(db, 0);
1342       return 0;
1343     }
1344   if (db->cursor(db, NULL, &dbc, 0))
1345     {
1346       db->close(db, 0);
1347       pool_error(pool, 0, "db->cursor: %s", strerror(errno));
1348       return 0;
1349     }
1350   while (dbc->c_get(dbc, &dbkey, &dbdata, DB_NEXT) == 0)
1351     count += dbdata.size / RPM_INDEX_SIZE;
1352   dbc->c_close(dbc);
1353   db->close(db, 0);
1354   return count;
1355 }
1356
1357 /******************************************************************/
1358
1359 static Offset
1360 copydeps(Pool *pool, Repo *repo, Offset fromoff, Repo *fromrepo)
1361 {
1362   int cc;
1363   Id *ida, *from;
1364   Offset ido;
1365
1366   if (!fromoff)
1367     return 0;
1368   from = fromrepo->idarraydata + fromoff;
1369   for (ida = from, cc = 0; *ida; ida++, cc++)
1370     ;
1371   if (cc == 0)
1372     return 0;
1373   ido = repo_reserve_ids(repo, 0, cc);
1374   ida = repo->idarraydata + ido;
1375   memcpy(ida, from, (cc + 1) * sizeof(Id));
1376   repo->idarraysize += cc + 1;
1377   return ido;
1378 }
1379
1380 #define COPYDIR_DIRCACHE_SIZE 512
1381
1382 static Id copydir_complex(Pool *pool, Repodata *data, Repodata *fromdata, Id did, Id *cache);
1383
1384 static inline Id
1385 copydir(Pool *pool, Repodata *data, Repodata *fromdata, Id did, Id *cache)
1386 {
1387   if (cache && cache[did & 255] == did)
1388     return cache[(did & 255) + 256];
1389   return copydir_complex(pool, data, fromdata, did, cache);
1390 }
1391
1392 static Id
1393 copydir_complex(Pool *pool, Repodata *data, Repodata *fromdata, Id did, Id *cache)
1394 {
1395   Id parent = dirpool_parent(&fromdata->dirpool, did);
1396   Id compid = dirpool_compid(&fromdata->dirpool, did);
1397   if (parent)
1398     parent = copydir(pool, data, fromdata, parent, cache);
1399   if (fromdata->localpool)
1400     compid = repodata_globalize_id(fromdata, compid, 1);
1401   compid = dirpool_add_dir(&data->dirpool, parent, compid, 1);
1402   if (cache)
1403     {
1404       cache[did & 255] = did;
1405       cache[(did & 255) + 256] = compid;
1406     }
1407   return compid;
1408 }
1409
1410 struct solvable_copy_cbdata {
1411   Repodata *data;
1412   Id handle;
1413   Id subhandle;
1414   Id *dircache;
1415 };
1416
1417 static int
1418 solvable_copy_cb(void *vcbdata, Solvable *r, Repodata *fromdata, Repokey *key, KeyValue *kv)
1419 {
1420   struct solvable_copy_cbdata *cbdata = vcbdata;
1421   Id id, keyname;
1422   Repodata *data = cbdata->data;
1423   Id handle = cbdata->handle;
1424   Pool *pool = data->repo->pool;
1425
1426   keyname = key->name;
1427   switch(key->type)
1428     {
1429     case REPOKEY_TYPE_ID:
1430     case REPOKEY_TYPE_CONSTANTID:
1431     case REPOKEY_TYPE_IDARRAY:  /* used for triggers */
1432       id = kv->id;
1433       if (fromdata->localpool)
1434         id = repodata_globalize_id(fromdata, id, 1);
1435       assert(!data->localpool); /* implement me! */
1436       if (key->type == REPOKEY_TYPE_ID)
1437         repodata_set_id(data, handle, keyname, id);
1438       else if (key->type == REPOKEY_TYPE_CONSTANTID)
1439         repodata_set_constantid(data, handle, keyname, id);
1440       else
1441         repodata_add_idarray(data, handle, keyname, id);
1442       break;
1443     case REPOKEY_TYPE_STR:
1444       repodata_set_str(data, handle, keyname, kv->str);
1445       break;
1446     case REPOKEY_TYPE_VOID:
1447       repodata_set_void(data, handle, keyname);
1448       break;
1449     case REPOKEY_TYPE_NUM:
1450       repodata_set_num(data, handle, keyname, SOLV_KV_NUM64(kv));
1451       break;
1452     case REPOKEY_TYPE_CONSTANT:
1453       repodata_set_constant(data, handle, keyname, kv->num);
1454       break;
1455     case REPOKEY_TYPE_DIRNUMNUMARRAY:
1456       id = kv->id;
1457       id = copydir(pool, data, fromdata, id, cbdata->dircache);
1458       assert(!data->localpool); /* implement me! */
1459       repodata_add_dirnumnum(data, handle, keyname, id, kv->num, kv->num2);
1460       break;
1461     case REPOKEY_TYPE_DIRSTRARRAY:
1462       id = kv->id;
1463       id = copydir(pool, data, fromdata, id, cbdata->dircache);
1464       assert(!data->localpool); /* implement me! */
1465       repodata_add_dirstr(data, handle, keyname, id, kv->str);
1466       break;
1467     case REPOKEY_TYPE_FLEXARRAY:
1468       if (kv->eof == 2)
1469         {
1470           assert(cbdata->subhandle);
1471           cbdata->handle = cbdata->subhandle;
1472           cbdata->subhandle = 0;
1473           break;
1474         }
1475       if (!kv->entry)
1476         {
1477           assert(!cbdata->subhandle);
1478           cbdata->subhandle = cbdata->handle;
1479         }
1480       cbdata->handle = repodata_new_handle(data);
1481       repodata_add_flexarray(data, cbdata->subhandle, keyname, cbdata->handle);
1482       break;
1483     default:
1484       break;
1485     }
1486   return 0;
1487 }
1488
1489 static void
1490 solvable_copy(Solvable *s, Solvable *r, Repodata *data, Id *dircache)
1491 {
1492   Repo *repo = s->repo;
1493   Pool *pool = repo->pool;
1494   Repo *fromrepo = r->repo;
1495   struct solvable_copy_cbdata cbdata;
1496
1497   /* copy solvable data */
1498   s->name = r->name;
1499   s->evr = r->evr;
1500   s->arch = r->arch;
1501   s->vendor = r->vendor;
1502   s->provides = copydeps(pool, repo, r->provides, fromrepo);
1503   s->requires = copydeps(pool, repo, r->requires, fromrepo);
1504   s->conflicts = copydeps(pool, repo, r->conflicts, fromrepo);
1505   s->obsoletes = copydeps(pool, repo, r->obsoletes, fromrepo);
1506   s->recommends = copydeps(pool, repo, r->recommends, fromrepo);
1507   s->suggests = copydeps(pool, repo, r->suggests, fromrepo);
1508   s->supplements = copydeps(pool, repo, r->supplements, fromrepo);
1509   s->enhances  = copydeps(pool, repo, r->enhances, fromrepo);
1510
1511   /* copy all attributes */
1512   if (!data)
1513     return;
1514   cbdata.data = data;
1515   cbdata.handle = s - pool->solvables;
1516   cbdata.subhandle = 0;
1517   cbdata.dircache = dircache;
1518   repo_search(fromrepo, (r - fromrepo->pool->solvables), 0, 0, SEARCH_NO_STORAGE_SOLVABLE | SEARCH_SUB | SEARCH_ARRAYSENTINEL, solvable_copy_cb, &cbdata);
1519 }
1520
1521 /* used to sort entries by package name that got returned in some database order */
1522 static int
1523 rpmids_sort_cmp(const void *va, const void *vb, void *dp)
1524 {
1525   struct rpmdbentry const *a = va, *b = vb;
1526   char *namedata = dp;
1527   int r;
1528   r = strcmp(namedata + a->nameoff, namedata + b->nameoff);
1529   if (r)
1530     return r;
1531   return a->rpmdbid - b->rpmdbid;
1532 }
1533
1534 static int
1535 pkgids_sort_cmp(const void *va, const void *vb, void *dp)
1536 {
1537   Repo *repo = dp;
1538   Pool *pool = repo->pool;
1539   Solvable *a = pool->solvables + *(Id *)va;
1540   Solvable *b = pool->solvables + *(Id *)vb;
1541   Id *rpmdbid;
1542
1543   if (a->name != b->name)
1544     return strcmp(pool_id2str(pool, a->name), pool_id2str(pool, b->name));
1545   rpmdbid = repo->rpmdbid;
1546   return rpmdbid[(a - pool->solvables) - repo->start] - rpmdbid[(b - pool->solvables) - repo->start];
1547 }
1548
1549 static void
1550 swap_solvables(Repo *repo, Repodata *data, Id pa, Id pb)
1551 {
1552   Pool *pool = repo->pool;
1553   Solvable tmp;
1554
1555   tmp = pool->solvables[pa];
1556   pool->solvables[pa] = pool->solvables[pb];
1557   pool->solvables[pb] = tmp;
1558   if (repo->rpmdbid)
1559     {
1560       Id tmpid = repo->rpmdbid[pa - repo->start];
1561       repo->rpmdbid[pa - repo->start] = repo->rpmdbid[pb - repo->start];
1562       repo->rpmdbid[pb - repo->start] = tmpid;
1563     }
1564   /* only works if nothing is already internalized! */
1565   if (data)
1566     repodata_swap_attrs(data, pa, pb);
1567 }
1568
1569 static void
1570 mkrpmdbcookie(struct stat *st, unsigned char *cookie)
1571 {
1572   memset(cookie, 0, 32);
1573   cookie[3] = RPMDB_COOKIE_VERSION;
1574   memcpy(cookie + 16, &st->st_ino, sizeof(st->st_ino));
1575   memcpy(cookie + 24, &st->st_dev, sizeof(st->st_dev));
1576 }
1577
1578 /*
1579  * read rpm db as repo
1580  *
1581  */
1582
1583 int
1584 repo_add_rpmdb(Repo *repo, Repo *ref, int flags)
1585 {
1586   Pool *pool = repo->pool;
1587   char dbpath[PATH_MAX];
1588   struct stat packagesstat;
1589   unsigned char newcookie[32];
1590   const unsigned char *oldcookie = 0;
1591   Id oldcookietype = 0;
1592   Repodata *data;
1593   int count = 0, done = 0;
1594   const char *rootdir = 0;
1595   struct rpmdbstate state;
1596   int i;
1597   Solvable *s;
1598   unsigned int now;
1599
1600   now = solv_timems(0);
1601   memset(&state, 0, sizeof(state));
1602   state.pool = pool;
1603
1604   data = repo_add_repodata(repo, flags);
1605
1606   if (ref && !(ref->nsolvables && ref->rpmdbid && ref->pool == repo->pool))
1607     {
1608       if ((flags & RPMDB_EMPTY_REFREPO) != 0)
1609         repo_empty(ref, 1);
1610       ref = 0;
1611     }
1612
1613   if (flags & REPO_USE_ROOTDIR)
1614     rootdir = pool_get_rootdir(pool);
1615   if (!opendbenv(&state, rootdir))
1616     return -1;
1617
1618   /* XXX: should get ro lock of Packages database! */
1619   snprintf(dbpath, PATH_MAX, "%s/var/lib/rpm/Packages", rootdir ? rootdir : "");
1620   if (stat(dbpath, &packagesstat))
1621     {
1622       pool_error(pool, -1, "%s: %s", dbpath, strerror(errno));
1623       freestate(&state);
1624       return -1;
1625     }
1626   mkrpmdbcookie(&packagesstat, newcookie);
1627   repodata_set_bin_checksum(data, SOLVID_META, REPOSITORY_RPMDBCOOKIE, REPOKEY_TYPE_SHA256, newcookie);
1628
1629   if (ref)
1630     oldcookie = repo_lookup_bin_checksum(ref, SOLVID_META, REPOSITORY_RPMDBCOOKIE, &oldcookietype);
1631   if (!ref || !oldcookie || oldcookietype != REPOKEY_TYPE_SHA256 || memcmp(oldcookie, newcookie, 32) != 0)
1632     {
1633       int solvstart = 0, solvend = 0;
1634       Id dbid;
1635       DBC *dbc = 0;
1636
1637       if (ref && (flags & RPMDB_EMPTY_REFREPO) != 0)
1638         repo_empty(ref, 1);     /* get it out of the way */
1639       if ((flags & RPMDB_REPORT_PROGRESS) != 0)
1640         count = count_headers(pool, rootdir, state.dbenv);
1641       if (!openpkgdb(&state))
1642         {
1643           freestate(&state);
1644           return -1;
1645         }
1646       if (state.db->cursor(state.db, NULL, &dbc, 0))
1647         {
1648           freestate(&state);
1649           return pool_error(pool, -1, "db->cursor failed");
1650         }
1651       i = 0;
1652       s = 0;
1653       while ((dbid = getrpmcursor(&state, dbc)) != 0)
1654         {
1655           if (dbid == -1)
1656             {
1657               dbc->c_close(dbc);
1658               freestate(&state);
1659               return -1;
1660             }
1661           if (!s)
1662             {
1663               s = pool_id2solvable(pool, repo_add_solvable(repo));
1664               if (!solvstart)
1665                 solvstart = s - pool->solvables;
1666               solvend = s - pool->solvables + 1;
1667             }
1668           if (!repo->rpmdbid)
1669             repo->rpmdbid = repo_sidedata_create(repo, sizeof(Id));
1670           repo->rpmdbid[(s - pool->solvables) - repo->start] = dbid;
1671           if (rpm2solv(pool, repo, data, s, state.rpmhead, flags | RPM_ADD_TRIGGERS))
1672             {
1673               i++;
1674               s = 0;
1675             }
1676           else
1677             {
1678               /* We can reuse this solvable, but make sure it's still
1679                  associated with this repo.  */
1680               memset(s, 0, sizeof(*s));
1681               s->repo = repo;
1682             }
1683           if ((flags & RPMDB_REPORT_PROGRESS) != 0)
1684             {
1685               if (done < count)
1686                 done++;
1687               if (done < count && (done - 1) * 100 / count != done * 100 / count)
1688                 pool_debug(pool, SOLV_ERROR, "%%%% %d\n", done * 100 / count);
1689             }
1690         }
1691       dbc->c_close(dbc);
1692       if (s)
1693         {
1694           /* oops, could not reuse. free it instead */
1695           repo_free_solvable(repo, s - pool->solvables, 1);
1696           solvend--;
1697           s = 0;
1698         }
1699       /* now sort all solvables in the new solvstart..solvend block */
1700       if (solvend - solvstart > 1)
1701         {
1702           Id *pkgids = solv_malloc2(solvend - solvstart, sizeof(Id));
1703           for (i = solvstart; i < solvend; i++)
1704             pkgids[i - solvstart] = i;
1705           solv_sort(pkgids, solvend - solvstart, sizeof(Id), pkgids_sort_cmp, repo);
1706           /* adapt order */
1707           for (i = solvstart; i < solvend; i++)
1708             {
1709               int j = pkgids[i - solvstart];
1710               while (j < i)
1711                 j = pkgids[i - solvstart] = pkgids[j - solvstart];
1712               if (j != i)
1713                 swap_solvables(repo, data, i, j);
1714             }
1715           solv_free(pkgids);
1716         }
1717     }
1718   else
1719     {
1720       Id dircache[COPYDIR_DIRCACHE_SIZE];               /* see copydir */
1721       struct rpmdbentry *entries = 0, *rp;
1722       int nentries = 0;
1723       char *namedata = 0;
1724       unsigned int refmask, h;
1725       Id id, *refhash;
1726       int res;
1727
1728       memset(dircache, 0, sizeof(dircache));
1729
1730       /* get ids of installed rpms */
1731       entries = getinstalledrpmdbids(&state, "Name", 0, &nentries, &namedata);
1732       if (!entries)
1733         {
1734           freestate(&state);
1735           return -1;
1736         }
1737
1738       /* sort by name */
1739       if (nentries > 1)
1740         solv_sort(entries, nentries, sizeof(*entries), rpmids_sort_cmp, namedata);
1741
1742       /* create hash from dbid to ref */
1743       refmask = mkmask(ref->nsolvables);
1744       refhash = solv_calloc(refmask + 1, sizeof(Id));
1745       for (i = 0; i < ref->end - ref->start; i++)
1746         {
1747           if (!ref->rpmdbid[i])
1748             continue;
1749           h = ref->rpmdbid[i] & refmask;
1750           while (refhash[h])
1751             h = (h + 317) & refmask;
1752           refhash[h] = i + 1;   /* make it non-zero */
1753         }
1754
1755       /* count the misses, they will cost us time */
1756       if ((flags & RPMDB_REPORT_PROGRESS) != 0)
1757         {
1758           for (i = 0, rp = entries; i < nentries; i++, rp++)
1759             {
1760               if (refhash)
1761                 {
1762                   Id dbid = rp->rpmdbid;
1763                   h = dbid & refmask;
1764                   while ((id = refhash[h]))
1765                     {
1766                       if (ref->rpmdbid[id - 1] == dbid)
1767                         break;
1768                       h = (h + 317) & refmask;
1769                     }
1770                   if (id)
1771                     continue;
1772                 }
1773               count++;
1774             }
1775         }
1776
1777       if (ref && (flags & RPMDB_EMPTY_REFREPO) != 0)
1778         s = pool_id2solvable(pool, repo_add_solvable_block_before(repo, nentries, ref));
1779       else
1780         s = pool_id2solvable(pool, repo_add_solvable_block(repo, nentries));
1781       if (!repo->rpmdbid)
1782         repo->rpmdbid = repo_sidedata_create(repo, sizeof(Id));
1783
1784       for (i = 0, rp = entries; i < nentries; i++, rp++, s++)
1785         {
1786           Id dbid = rp->rpmdbid;
1787           repo->rpmdbid[(s - pool->solvables) - repo->start] = rp->rpmdbid;
1788           if (refhash)
1789             {
1790               h = dbid & refmask;
1791               while ((id = refhash[h]))
1792                 {
1793                   if (ref->rpmdbid[id - 1] == dbid)
1794                     break;
1795                   h = (h + 317) & refmask;
1796                 }
1797               if (id)
1798                 {
1799                   Solvable *r = ref->pool->solvables + ref->start + (id - 1);
1800                   if (r->repo == ref)
1801                     {
1802                       solvable_copy(s, r, data, dircache);
1803                       continue;
1804                     }
1805                 }
1806             }
1807           res = getrpmdbid(&state, dbid);
1808           if (res <= 0)
1809             {
1810               if (!res)
1811                 return pool_error(pool, -1, "inconsistent rpm database, key %d not found. run 'rpm --rebuilddb' to fix.", dbid);
1812               freestate(&state);
1813               solv_free(entries);
1814               solv_free(namedata);
1815               solv_free(refhash);
1816               return -1;
1817             }
1818           rpm2solv(pool, repo, data, s, state.rpmhead, flags | RPM_ADD_TRIGGERS);
1819           if ((flags & RPMDB_REPORT_PROGRESS) != 0)
1820             {
1821               if (done < count)
1822                 done++;
1823               if (done < count && (done - 1) * 100 / count != done * 100 / count)
1824                 pool_debug(pool, SOLV_ERROR, "%%%% %d\n", done * 100 / count);
1825             }
1826         }
1827
1828       solv_free(entries);
1829       solv_free(namedata);
1830       solv_free(refhash);
1831       if (ref && (flags & RPMDB_EMPTY_REFREPO) != 0)
1832         repo_empty(ref, 1);
1833     }
1834
1835   freestate(&state);
1836   if (!(flags & REPO_NO_INTERNALIZE))
1837     repodata_internalize(data);
1838   if ((flags & RPMDB_REPORT_PROGRESS) != 0)
1839     pool_debug(pool, SOLV_ERROR, "%%%% 100\n");
1840   POOL_DEBUG(SOLV_DEBUG_STATS, "repo_add_rpmdb took %d ms\n", solv_timems(now));
1841   POOL_DEBUG(SOLV_DEBUG_STATS, "repo size: %d solvables\n", repo->nsolvables);
1842   POOL_DEBUG(SOLV_DEBUG_STATS, "repo memory used: %d K incore, %d K idarray\n", repodata_memused(data)/1024, repo->idarraysize / (int)(1024/sizeof(Id)));
1843   return 0;
1844 }
1845
1846 int
1847 repo_add_rpmdb_reffp(Repo *repo, FILE *fp, int flags)
1848 {
1849   int res;
1850   Repo *ref = 0;
1851
1852   if (!fp)
1853     return repo_add_rpmdb(repo, 0, flags);
1854   ref = repo_create(repo->pool, "add_rpmdb_reffp");
1855   if (repo_add_solv(ref, fp, 0) != 0)
1856     {
1857       repo_free(ref, 1);
1858       ref = 0;
1859     }
1860   if (ref && ref->start == ref->end)
1861     {
1862       repo_free(ref, 1);
1863       ref = 0;
1864     }
1865   if (ref)
1866     repo_disable_paging(ref);
1867   res = repo_add_rpmdb(repo, ref, flags | RPMDB_EMPTY_REFREPO);
1868   if (ref)
1869     repo_free(ref, 1);
1870   return res;
1871 }
1872
1873 static inline unsigned int
1874 getu32(const unsigned char *dp)
1875 {
1876   return dp[0] << 24 | dp[1] << 16 | dp[2] << 8 | dp[3];
1877 }
1878
1879
1880 Id
1881 repo_add_rpm(Repo *repo, const char *rpm, int flags)
1882 {
1883   unsigned int sigdsize, sigcnt, l;
1884   Pool *pool = repo->pool;
1885   Solvable *s;
1886   RpmHead *rpmhead = 0;
1887   int rpmheadsize = 0;
1888   char *payloadformat;
1889   FILE *fp;
1890   unsigned char lead[4096];
1891   int headerstart, headerend;
1892   struct stat stb;
1893   Repodata *data;
1894   unsigned char pkgid[16];
1895   unsigned char leadsigid[16];
1896   unsigned char hdrid[32];
1897   int pkgidtype, leadsigidtype, hdridtype;
1898   Id chksumtype = 0;
1899   void *chksumh = 0;
1900   void *leadsigchksumh = 0;
1901   int forcebinary = 0;
1902
1903   data = repo_add_repodata(repo, flags);
1904
1905   if ((flags & RPM_ADD_WITH_SHA256SUM) != 0)
1906     chksumtype = REPOKEY_TYPE_SHA256;
1907   else if ((flags & RPM_ADD_WITH_SHA1SUM) != 0)
1908     chksumtype = REPOKEY_TYPE_SHA1;
1909
1910   if ((fp = fopen(flags & REPO_USE_ROOTDIR ? pool_prepend_rootdir_tmp(pool, rpm) : rpm, "r")) == 0)
1911     {
1912       pool_error(pool, -1, "%s: %s", rpm, strerror(errno));
1913       return 0;
1914     }
1915   if (fstat(fileno(fp), &stb))
1916     {
1917       pool_error(pool, -1, "fstat: %s", strerror(errno));
1918       fclose(fp);
1919       return 0;
1920     }
1921   if (chksumtype)
1922     chksumh = solv_chksum_create(chksumtype);
1923   if ((flags & RPM_ADD_WITH_LEADSIGID) != 0)
1924     leadsigchksumh = solv_chksum_create(REPOKEY_TYPE_MD5);
1925   if (fread(lead, 96 + 16, 1, fp) != 1 || getu32(lead) != 0xedabeedb)
1926     {
1927       pool_error(pool, -1, "%s: not a rpm", rpm);
1928       fclose(fp);
1929       return 0;
1930     }
1931   forcebinary = lead[6] != 0 || lead[7] != 1;
1932   if (chksumh)
1933     solv_chksum_add(chksumh, lead, 96 + 16);
1934   if (leadsigchksumh)
1935     solv_chksum_add(leadsigchksumh, lead, 96 + 16);
1936   if (lead[78] != 0 || lead[79] != 5)
1937     {
1938       pool_error(pool, -1, "%s: not a rpm v5 header", rpm);
1939       fclose(fp);
1940       return 0;
1941     }
1942   if (getu32(lead + 96) != 0x8eade801)
1943     {
1944       pool_error(pool, -1, "%s: bad signature header", rpm);
1945       fclose(fp);
1946       return 0;
1947     }
1948   sigcnt = getu32(lead + 96 + 8);
1949   sigdsize = getu32(lead + 96 + 12);
1950   if (sigcnt >= 0x100000 || sigdsize >= 0x100000)
1951     {
1952       pool_error(pool, -1, "%s: bad signature header", rpm);
1953       fclose(fp);
1954       return 0;
1955     }
1956   sigdsize += sigcnt * 16;
1957   sigdsize = (sigdsize + 7) & ~7;
1958   headerstart = 96 + 16 + sigdsize;
1959   pkgidtype = leadsigidtype = hdridtype = 0;
1960   if ((flags & (RPM_ADD_WITH_PKGID | RPM_ADD_WITH_HDRID)) != 0)
1961     {
1962       /* extract pkgid or hdrid from the signature header */
1963       if (sigdsize > rpmheadsize)
1964         {
1965           rpmheadsize = sigdsize + 128;
1966           rpmhead = solv_realloc(rpmhead, sizeof(*rpmhead) + rpmheadsize);
1967         }
1968       if (fread(rpmhead->data, sigdsize, 1, fp) != 1)
1969         {
1970           pool_error(pool, -1, "%s: unexpected EOF", rpm);
1971           fclose(fp);
1972           return 0;
1973         }
1974       if (chksumh)
1975         solv_chksum_add(chksumh, rpmhead->data, sigdsize);
1976       if (leadsigchksumh)
1977         solv_chksum_add(leadsigchksumh, rpmhead->data, sigdsize);
1978       rpmhead->forcebinary = 0;
1979       rpmhead->cnt = sigcnt;
1980       rpmhead->dcnt = sigdsize - sigcnt * 16;
1981       rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
1982       if ((flags & RPM_ADD_WITH_PKGID) != 0)
1983         {
1984           unsigned char *chksum;
1985           unsigned int chksumsize;
1986           chksum = headbinary(rpmhead, SIGTAG_MD5, &chksumsize);
1987           if (chksum && chksumsize == 16)
1988             {
1989               pkgidtype = REPOKEY_TYPE_MD5;
1990               memcpy(pkgid, chksum, 16);
1991             }
1992         }
1993       if ((flags & RPM_ADD_WITH_HDRID) != 0)
1994         {
1995           const char *str = headstring(rpmhead, TAG_SHA1HEADER);
1996           if (str && strlen(str) == 40)
1997             {
1998               if (solv_hex2bin(&str, hdrid, 20) == 20)
1999                 hdridtype = REPOKEY_TYPE_SHA1;
2000             }
2001           else if (str && strlen(str) == 64)
2002             {
2003               if (solv_hex2bin(&str, hdrid, 32) == 32)
2004                 hdridtype = REPOKEY_TYPE_SHA256;
2005             }
2006         }
2007     }
2008   else
2009     {
2010       /* just skip the signature header */
2011       while (sigdsize)
2012         {
2013           l = sigdsize > 4096 ? 4096 : sigdsize;
2014           if (fread(lead, l, 1, fp) != 1)
2015             {
2016               pool_error(pool, -1, "%s: unexpected EOF", rpm);
2017               fclose(fp);
2018               return 0;
2019             }
2020           if (chksumh)
2021             solv_chksum_add(chksumh, lead, l);
2022           if (leadsigchksumh)
2023             solv_chksum_add(leadsigchksumh, lead, l);
2024           sigdsize -= l;
2025         }
2026     }
2027   if (leadsigchksumh)
2028     {
2029       leadsigchksumh = solv_chksum_free(leadsigchksumh, leadsigid);
2030       leadsigidtype = REPOKEY_TYPE_MD5;
2031     }
2032   if (fread(lead, 16, 1, fp) != 1)
2033     {
2034       pool_error(pool, -1, "%s: unexpected EOF", rpm);
2035       fclose(fp);
2036       return 0;
2037     }
2038   if (chksumh)
2039     solv_chksum_add(chksumh, lead, 16);
2040   if (getu32(lead) != 0x8eade801)
2041     {
2042       pool_error(pool, -1, "%s: bad header", rpm);
2043       fclose(fp);
2044       return 0;
2045     }
2046   sigcnt = getu32(lead + 8);
2047   sigdsize = getu32(lead + 12);
2048   if (sigcnt >= 0x100000 || sigdsize >= 0x2000000)
2049     {
2050       pool_error(pool, -1, "%s: bad header", rpm);
2051       fclose(fp);
2052       return 0;
2053     }
2054   l = sigdsize + sigcnt * 16;
2055   headerend = headerstart + 16 + l;
2056   if (l > rpmheadsize)
2057     {
2058       rpmheadsize = l + 128;
2059       rpmhead = solv_realloc(rpmhead, sizeof(*rpmhead) + rpmheadsize);
2060     }
2061   if (fread(rpmhead->data, l, 1, fp) != 1)
2062     {
2063       pool_error(pool, -1, "%s: unexpected EOF", rpm);
2064       fclose(fp);
2065       return 0;
2066     }
2067   if (chksumh)
2068     solv_chksum_add(chksumh, rpmhead->data, l);
2069   rpmhead->forcebinary = forcebinary;
2070   rpmhead->cnt = sigcnt;
2071   rpmhead->dcnt = sigdsize;
2072   rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
2073   if (headexists(rpmhead, TAG_PATCHESNAME))
2074     {
2075       /* this is a patch rpm, ignore */
2076       pool_error(pool, -1, "%s: is patch rpm", rpm);
2077       fclose(fp);
2078       solv_chksum_free(chksumh, 0);
2079       solv_free(rpmhead);
2080       return 0;
2081     }
2082   payloadformat = headstring(rpmhead, TAG_PAYLOADFORMAT);
2083   if (payloadformat && !strcmp(payloadformat, "drpm"))
2084     {
2085       /* this is a delta rpm */
2086       pool_error(pool, -1, "%s: is delta rpm", rpm);
2087       fclose(fp);
2088       solv_chksum_free(chksumh, 0);
2089       solv_free(rpmhead);
2090       return 0;
2091     }
2092   if (chksumh)
2093     while ((l = fread(lead, 1, sizeof(lead), fp)) > 0)
2094       solv_chksum_add(chksumh, lead, l);
2095   fclose(fp);
2096   s = pool_id2solvable(pool, repo_add_solvable(repo));
2097   if (!rpm2solv(pool, repo, data, s, rpmhead, flags & ~(RPM_ADD_WITH_HDRID | RPM_ADD_WITH_PKGID)))
2098     {
2099       repo_free_solvable(repo, s - pool->solvables, 1);
2100       solv_chksum_free(chksumh, 0);
2101       solv_free(rpmhead);
2102       return 0;
2103     }
2104   if (!(flags & REPO_NO_LOCATION))
2105     repodata_set_location(data, s - pool->solvables, 0, 0, rpm);
2106   if (S_ISREG(stb.st_mode))
2107     repodata_set_num(data, s - pool->solvables, SOLVABLE_DOWNLOADSIZE, (unsigned long long)stb.st_size);
2108   repodata_set_num(data, s - pool->solvables, SOLVABLE_HEADEREND, headerend);
2109   if (pkgidtype)
2110     repodata_set_bin_checksum(data, s - pool->solvables, SOLVABLE_PKGID, pkgidtype, pkgid);
2111   if (hdridtype)
2112     repodata_set_bin_checksum(data, s - pool->solvables, SOLVABLE_HDRID, hdridtype, hdrid);
2113   if (leadsigidtype)
2114     repodata_set_bin_checksum(data, s - pool->solvables, SOLVABLE_LEADSIGID, leadsigidtype, leadsigid);
2115   if (chksumh)
2116     {
2117       repodata_set_bin_checksum(data, s - pool->solvables, SOLVABLE_CHECKSUM, chksumtype, solv_chksum_get(chksumh, 0));
2118       chksumh = solv_chksum_free(chksumh, 0);
2119     }
2120   if (rpmhead)
2121     solv_free(rpmhead);
2122   if (!(flags & REPO_NO_INTERNALIZE))
2123     repodata_internalize(data);
2124   return s - pool->solvables;
2125 }
2126
2127 Id
2128 repo_add_rpm_handle(Repo *repo, void *rpmhandle, int flags)
2129 {
2130   Pool *pool = repo->pool;
2131   Repodata *data;
2132   RpmHead *rpmhead = rpmhandle;
2133   Solvable *s;
2134   char *payloadformat;
2135
2136   data = repo_add_repodata(repo, flags);
2137   if (headexists(rpmhead, TAG_PATCHESNAME))
2138     {
2139       pool_error(pool, -1, "is a patch rpm");
2140       return 0;
2141     }
2142   payloadformat = headstring(rpmhead, TAG_PAYLOADFORMAT);
2143   if (payloadformat && !strcmp(payloadformat, "drpm"))
2144     {
2145       /* this is a delta rpm */
2146       pool_error(pool, -1, "is a delta rpm");
2147       return 0;
2148     }
2149   s = pool_id2solvable(pool, repo_add_solvable(repo));
2150   if (!rpm2solv(pool, repo, data, s, rpmhead, flags))
2151     {
2152       repo_free_solvable(repo, s - pool->solvables, 1);
2153       return 0;
2154     }
2155   if (!(flags & REPO_NO_INTERNALIZE))
2156     repodata_internalize(data);
2157   return s - pool->solvables;
2158 }
2159
2160 static inline void
2161 linkhash(const char *lt, char *hash)
2162 {
2163   unsigned int r = 0;
2164   const unsigned char *str = (const unsigned char *)lt;
2165   int l, c;
2166
2167   l = strlen(lt);
2168   while ((c = *str++) != 0)
2169     r += (r << 3) + c;
2170   sprintf(hash, "%08x%08x%08x%08x", r, l, 0, 0);
2171 }
2172
2173 void
2174 rpm_iterate_filelist(void *rpmhandle, int flags, void (*cb)(void *, const char *, struct filelistinfo *), void *cbdata)
2175 {
2176   RpmHead *rpmhead = rpmhandle;
2177   char **bn;
2178   char **dn;
2179   char **md = 0;
2180   char **lt = 0;
2181   unsigned int *di, diidx;
2182   unsigned int *co = 0;
2183   unsigned int *ff = 0;
2184   unsigned int lastdir;
2185   int lastdirl;
2186   unsigned int *fm;
2187   int cnt, dcnt, cnt2;
2188   int i, l1, l;
2189   char *space = 0;
2190   int spacen = 0;
2191   char md5[33];
2192   struct filelistinfo info;
2193
2194   dn = headstringarray(rpmhead, TAG_DIRNAMES, &dcnt);
2195   if (!dn)
2196     return;
2197   if ((flags & RPM_ITERATE_FILELIST_ONLYDIRS) != 0)
2198     {
2199       for (i = 0; i < dcnt; i++)
2200         (*cb)(cbdata, dn[i], 0);
2201       solv_free(dn);
2202       return;
2203     }
2204   bn = headstringarray(rpmhead, TAG_BASENAMES, &cnt);
2205   if (!bn)
2206     {
2207       solv_free(dn);
2208       return;
2209     }
2210   di = headint32array(rpmhead, TAG_DIRINDEXES, &cnt2);
2211   if (!di || cnt != cnt2)
2212     {
2213       solv_free(di);
2214       solv_free(bn);
2215       solv_free(dn);
2216       return;
2217     }
2218   fm = headint16array(rpmhead, TAG_FILEMODES, &cnt2);
2219   if (!fm || cnt != cnt2)
2220     {
2221       solv_free(fm);
2222       solv_free(di);
2223       solv_free(bn);
2224       solv_free(dn);
2225       return;
2226     }
2227   if ((flags & RPM_ITERATE_FILELIST_WITHMD5) != 0)
2228     {
2229       md = headstringarray(rpmhead, TAG_FILEMD5S, &cnt2);
2230       if (!md || cnt != cnt2)
2231         {
2232           solv_free(md);
2233           solv_free(fm);
2234           solv_free(di);
2235           solv_free(bn);
2236           solv_free(dn);
2237           return;
2238         }
2239     }
2240   if ((flags & RPM_ITERATE_FILELIST_WITHCOL) != 0)
2241     {
2242       co = headint32array(rpmhead, TAG_FILECOLORS, &cnt2);
2243       if (!co || cnt != cnt2)
2244         {
2245           solv_free(co);
2246           solv_free(md);
2247           solv_free(fm);
2248           solv_free(di);
2249           solv_free(bn);
2250           solv_free(dn);
2251           return;
2252         }
2253     }
2254   if ((flags & RPM_ITERATE_FILELIST_NOGHOSTS) != 0)
2255     {
2256       ff = headint32array(rpmhead, TAG_FILEFLAGS, &cnt2);
2257       if (!ff || cnt != cnt2)
2258         {
2259           solv_free(ff);
2260           solv_free(co);
2261           solv_free(md);
2262           solv_free(fm);
2263           solv_free(di);
2264           solv_free(bn);
2265           solv_free(dn);
2266           return;
2267         }
2268     }
2269   lastdir = dcnt;
2270   lastdirl = 0;
2271   memset(&info, 0, sizeof(info));
2272   for (i = 0; i < cnt; i++)
2273     {
2274       if (ff && (ff[i] & FILEFLAG_GHOST) != 0)
2275         continue;
2276       diidx = di[i];
2277       if (diidx >= dcnt)
2278         continue;
2279       l1 = lastdir == diidx ? lastdirl : strlen(dn[diidx]);
2280       l = l1 + strlen(bn[i]) + 1;
2281       if (l > spacen)
2282         {
2283           spacen = l + 16;
2284           space = solv_realloc(space, spacen);
2285         }
2286       if (lastdir != diidx)
2287         {
2288           strcpy(space, dn[diidx]);
2289           lastdir = diidx;
2290           lastdirl = l1;
2291         }
2292       strcpy(space + l1, bn[i]);
2293       info.diridx = diidx;
2294       info.dirlen = l1;
2295       if (fm)
2296         info.mode = fm[i];
2297       if (md)
2298         {
2299           info.digest = md[i];
2300           if (fm && S_ISLNK(fm[i]))
2301             {
2302               info.digest = 0;
2303               if (!lt)
2304                 {
2305                   lt = headstringarray(rpmhead, TAG_FILELINKTOS, &cnt2);
2306                   if (cnt != cnt2)
2307                     lt = solv_free(lt);
2308                 }
2309               if (lt)
2310                 {
2311                   linkhash(lt[i], md5);
2312                   info.digest = md5;
2313                 }
2314             }
2315           if (!info.digest)
2316             {
2317               sprintf(md5, "%08x%08x%08x%08x", (fm[i] >> 12) & 65535, 0, 0, 0);
2318               info.digest = md5;
2319             }
2320         }
2321       if (co)
2322         info.color = co[i];
2323       (*cb)(cbdata, space, &info);
2324     }
2325   solv_free(space);
2326   solv_free(lt);
2327   solv_free(md);
2328   solv_free(fm);
2329   solv_free(di);
2330   solv_free(bn);
2331   solv_free(dn);
2332   solv_free(co);
2333   solv_free(ff);
2334 }
2335
2336 char *
2337 rpm_query(void *rpmhandle, Id what)
2338 {
2339   const char *name, *arch, *sourcerpm;
2340   char *evr, *r;
2341   int l;
2342
2343   RpmHead *rpmhead = rpmhandle;
2344   r = 0;
2345   switch (what)
2346     {
2347     case 0:
2348       name = headstring(rpmhead, TAG_NAME);
2349       if (!name)
2350         name = "";
2351       sourcerpm = headstring(rpmhead, TAG_SOURCERPM);
2352       if (sourcerpm || (rpmhead->forcebinary && !headexists(rpmhead, TAG_SOURCEPACKAGE)))
2353         arch = headstring(rpmhead, TAG_ARCH);
2354       else
2355         {
2356           if (headexists(rpmhead, TAG_NOSOURCE) || headexists(rpmhead, TAG_NOPATCH))
2357             arch = "nosrc";
2358           else
2359             arch = "src";
2360         }
2361       if (!arch)
2362         arch = "noarch";
2363       evr = headtoevr(rpmhead);
2364       l = strlen(name) + 1 + strlen(evr ? evr : "") + 1 + strlen(arch) + 1;
2365       r = solv_malloc(l);
2366       sprintf(r, "%s-%s.%s", name, evr ? evr : "", arch);
2367       solv_free(evr);
2368       break;
2369     case SOLVABLE_NAME:
2370       name = headstring(rpmhead, TAG_NAME);
2371       r = solv_strdup(name);
2372       break;
2373     case SOLVABLE_SUMMARY:
2374       name = headstring(rpmhead, TAG_SUMMARY);
2375       r = solv_strdup(name);
2376       break;
2377     case SOLVABLE_DESCRIPTION:
2378       name = headstring(rpmhead, TAG_DESCRIPTION);
2379       r = solv_strdup(name);
2380       break;
2381     case SOLVABLE_EVR:
2382       r = headtoevr(rpmhead);
2383       break;
2384     }
2385   return r;
2386 }
2387
2388 unsigned long long
2389 rpm_query_num(void *rpmhandle, Id what, unsigned long long notfound)
2390 {
2391   RpmHead *rpmhead = rpmhandle;
2392   unsigned int u32;
2393
2394   switch (what)
2395     {
2396     case SOLVABLE_INSTALLTIME:
2397       u32 = headint32(rpmhead, TAG_INSTALLTIME);
2398       return u32 ? u32 : notfound;
2399     }
2400   return notfound;
2401 }
2402
2403 int
2404 rpm_installedrpmdbids(void *rpmstate, const char *index, const char *match, Queue *rpmdbidq)
2405 {
2406   struct rpmdbentry *entries;
2407   int nentries, i;
2408
2409   entries = getinstalledrpmdbids(rpmstate, index ? index : "Name", match, &nentries, 0);
2410   if (rpmdbidq)
2411     {
2412       queue_empty(rpmdbidq);
2413       for (i = 0; i < nentries; i++)
2414         queue_push(rpmdbidq, entries[i].rpmdbid);
2415     }
2416   solv_free(entries);
2417   return nentries;
2418 }
2419
2420 void *
2421 rpm_byrpmdbid(void *rpmstate, Id rpmdbid)
2422 {
2423   struct rpmdbstate *state = rpmstate;
2424   int r;
2425
2426   r = getrpmdbid(state, rpmdbid);
2427   if (!r)
2428     pool_error(state->pool, 0, "header #%d not in database", rpmdbid);
2429   return r <= 0 ? 0 : state->rpmhead;
2430 }
2431
2432 void *
2433 rpm_byfp(void *rpmstate, FILE *fp, const char *name)
2434 {
2435   struct rpmdbstate *state = rpmstate;
2436   /* int headerstart, headerend; */
2437   RpmHead *rpmhead;
2438   unsigned int sigdsize, sigcnt, l;
2439   unsigned char lead[4096];
2440   int forcebinary = 0;
2441
2442   if (fread(lead, 96 + 16, 1, fp) != 1 || getu32(lead) != 0xedabeedb)
2443     {
2444       pool_error(state->pool, 0, "%s: not a rpm", name);
2445       return 0;
2446     }
2447   forcebinary = lead[6] != 0 || lead[7] != 1;
2448   if (lead[78] != 0 || lead[79] != 5)
2449     {
2450       pool_error(state->pool, 0, "%s: not a V5 header", name);
2451       return 0;
2452     }
2453   if (getu32(lead + 96) != 0x8eade801)
2454     {
2455       pool_error(state->pool, 0, "%s: bad signature header", name);
2456       return 0;
2457     }
2458   sigcnt = getu32(lead + 96 + 8);
2459   sigdsize = getu32(lead + 96 + 12);
2460   if (sigcnt >= 0x100000 || sigdsize >= 0x100000)
2461     {
2462       pool_error(state->pool, 0, "%s: bad signature header", name);
2463       return 0;
2464     }
2465   sigdsize += sigcnt * 16;
2466   sigdsize = (sigdsize + 7) & ~7;
2467   /* headerstart = 96 + 16 + sigdsize; */
2468   while (sigdsize)
2469     {
2470       l = sigdsize > 4096 ? 4096 : sigdsize;
2471       if (fread(lead, l, 1, fp) != 1)
2472         {
2473           pool_error(state->pool, 0, "%s: unexpected EOF", name);
2474           return 0;
2475         }
2476       sigdsize -= l;
2477     }
2478   if (fread(lead, 16, 1, fp) != 1)
2479     {
2480       pool_error(state->pool, 0, "%s: unexpected EOF", name);
2481       return 0;
2482     }
2483   if (getu32(lead) != 0x8eade801)
2484     {
2485       pool_error(state->pool, 0, "%s: bad header", name);
2486       return 0;
2487     }
2488   sigcnt = getu32(lead + 8);
2489   sigdsize = getu32(lead + 12);
2490   if (sigcnt >= 0x100000 || sigdsize >= 0x2000000)
2491     {
2492       pool_error(state->pool, 0, "%s: bad header", name);
2493       return 0;
2494     }
2495   l = sigdsize + sigcnt * 16;
2496   /* headerend = headerstart + 16 + l; */
2497   if (l > state->rpmheadsize)
2498     {
2499       state->rpmheadsize = l + 128;
2500       state->rpmhead = solv_realloc(state->rpmhead, sizeof(*state->rpmhead) + state->rpmheadsize);
2501     }
2502   rpmhead = state->rpmhead;
2503   if (fread(rpmhead->data, l, 1, fp) != 1)
2504     {
2505       pool_error(state->pool, 0, "%s: unexpected EOF", name);
2506       return 0;
2507     }
2508   rpmhead->forcebinary = forcebinary;
2509   rpmhead->cnt = sigcnt;
2510   rpmhead->dcnt = sigdsize;
2511   rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
2512   return rpmhead;
2513 }
2514
2515 #ifdef ENABLE_RPMDB_BYRPMHEADER
2516
2517 void *
2518 rpm_byrpmh(void *rpmstate, Header h)
2519 {
2520   struct rpmdbstate *state = rpmstate;
2521   const unsigned char *uh;
2522   unsigned int sigdsize, sigcnt, l;
2523   RpmHead *rpmhead;
2524
2525 #ifndef RPM5
2526   uh = headerUnload(h);
2527 #else
2528   uh = headerUnload(h, NULL);
2529 #endif
2530   if (!uh)
2531     return 0;
2532   sigcnt = getu32(uh);
2533   sigdsize = getu32(uh + 4);
2534   l = sigdsize + sigcnt * 16;
2535   if (l > state->rpmheadsize)
2536     {
2537       state->rpmheadsize = l + 128;
2538       state->rpmhead = solv_realloc(state->rpmhead, sizeof(*state->rpmhead) + state->rpmheadsize);
2539     }
2540   rpmhead = state->rpmhead;
2541   memcpy(rpmhead->data, uh + 8, l - 8);
2542   free((void *)uh);
2543   rpmhead->forcebinary = 0;
2544   rpmhead->cnt = sigcnt;
2545   rpmhead->dcnt = sigdsize;
2546   rpmhead->dp = rpmhead->data + rpmhead->cnt * 16;
2547   return rpmhead;
2548 }
2549
2550 #endif
2551