- fix file descriptor leak
[platform/upstream/libsolv.git] / src / repo_solv.c
1 /*
2  * Copyright (c) 2007, Novell Inc.
3  *
4  * This program is licensed under the BSD license, read LICENSE.BSD
5  * for further information
6  */
7
8 /*
9  * repo_solv.c
10  * 
11  * Read the binary dump of a Repo and create a Repo * from it
12  * 
13  *  See
14  *   Repo *pool_addrepo_solv(Pool *pool, FILE *fp)
15  * below
16  * 
17  */
18
19
20
21 #include <stdio.h>
22 #include <stdlib.h>
23 #include <unistd.h>
24 #include <string.h>
25
26 #include "repo_solv.h"
27 #include "util.h"
28
29 #define INTERESTED_START        SOLVABLE_NAME
30 #define INTERESTED_END          SOLVABLE_FRESHENS
31
32 #define SOLV_ERROR_NOT_SOLV     1
33 #define SOLV_ERROR_UNSUPPORTED  2
34 #define SOLV_ERROR_EOF          3
35 #define SOLV_ERROR_ID_RANGE     4
36 #define SOLV_ERROR_OVERFLOW     5
37 #define SOLV_ERROR_CORRUPT      6
38
39 static Pool *mypool;            /* for pool_debug... */
40
41 /*-----------------------------------------------------------------*/
42 /* .solv read functions */
43
44 /*
45  * read u32
46  */
47
48 static unsigned int
49 read_u32(Repodata *data)
50 {
51   int c, i;
52   unsigned int x = 0;
53
54   if (data->error)
55     return 0;
56   for (i = 0; i < 4; i++)
57     {
58       c = getc(data->fp);
59       if (c == EOF)
60         {
61           pool_debug(mypool, SAT_ERROR, "unexpected EOF\n");
62           data->error = SOLV_ERROR_EOF;
63           return 0;
64         }
65       x = (x << 8) | c;
66     }
67   return x;
68 }
69
70
71 /*
72  * read u8
73  */
74
75 static unsigned int
76 read_u8(Repodata *data)
77 {
78   int c;
79
80   if (data->error)
81     return 0;
82   c = getc(data->fp);
83   if (c == EOF)
84     {
85       pool_debug(mypool, SAT_ERROR, "unexpected EOF\n");
86       data->error = SOLV_ERROR_EOF;
87       return 0;
88     }
89   return c;
90 }
91
92
93 /*
94  * read Id
95  */
96
97 static Id
98 read_id(Repodata *data, Id max)
99 {
100   unsigned int x = 0;
101   int c, i;
102
103   if (data->error)
104     return 0;
105   for (i = 0; i < 5; i++)
106     {
107       c = getc(data->fp);
108       if (c == EOF)
109         {
110           pool_debug(mypool, SAT_ERROR, "unexpected EOF\n");
111           data->error = SOLV_ERROR_EOF;
112           return 0;
113         }
114       if (!(c & 128))
115         {
116           x = (x << 7) | c;
117           if (max && x >= max)
118             {
119               pool_debug(mypool, SAT_ERROR, "read_id: id too large (%u/%u)\n", x, max);
120               data->error = SOLV_ERROR_ID_RANGE;
121               return 0;
122             }
123           return x;
124         }
125       x = (x << 7) ^ c ^ 128;
126     }
127   pool_debug(mypool, SAT_ERROR, "read_id: id too long\n");
128   data->error = SOLV_ERROR_CORRUPT;
129   return 0;
130 }
131
132
133 /*
134  * read array of Ids
135  */
136
137 static Id *
138 read_rel_idarray(Repodata *data, Id max, Id *map, Id *store, Id *end, Id marker)
139 {
140   unsigned int x = 0;
141   int c;
142   Id old = 0;
143
144   if (data->error)
145     return 0;
146   for (;;)
147     {
148       c = getc(data->fp);
149       if (c == EOF)
150         {
151           pool_debug(mypool, SAT_ERROR, "unexpected EOF\n");
152           data->error = SOLV_ERROR_EOF;
153           return 0;
154         }
155       if ((c & 128) != 0)
156         {
157           x = (x << 7) ^ c ^ 128;
158           continue;
159         }
160       x = (x << 6) | (c & 63);
161       if (x == 0 && c == 0x40)
162         {
163           /* marker hack */
164           if (store == end)
165             {
166               pool_debug(mypool, SAT_ERROR, "read_rel_idarray: array overflow\n");
167               data->error = SOLV_ERROR_OVERFLOW;
168               return 0;
169             }
170           *store++ = marker;    /* do not map! */
171           old = 0;
172           x = 0;
173           continue;
174         }
175       x = (x - 1) + old;
176       old = x;
177       if (max && x >= max)
178         {
179           pool_debug(mypool, SAT_ERROR, "read_rel_idarray: id too large (%u/%u)\n", x, max);
180           data->error = SOLV_ERROR_ID_RANGE;
181           return 0;
182         }
183       if (map)
184         x = map[x];
185       if (store == end)
186         {
187           pool_debug(mypool, SAT_ERROR, "read_rel_idarray: array overflow\n");
188           return 0;
189         }
190       *store++ = x;
191       if ((c & 64) == 0)
192         {
193           if (x == 0)   /* already have trailing zero? */
194             return store;
195           if (store == end)
196             {
197               pool_debug(mypool, SAT_ERROR, "read_rel_idarray: array overflow\n");
198               data->error = SOLV_ERROR_OVERFLOW;
199               return 0;
200             }
201           *store++ = 0;
202           return store;
203         }
204       x = 0;
205     }
206 }
207
208 static Id *
209 read_idarray(Repodata *data, Id max, Id *map, Id *store, Id *end)
210 {
211   unsigned int x = 0;
212   int c;
213
214   if (data->error)
215     return 0;
216   for (;;)
217     {
218       c = getc(data->fp);
219       if (c == EOF)
220         {
221           pool_debug(mypool, SAT_ERROR, "unexpected EOF\n");
222           data->error = SOLV_ERROR_EOF;
223           return 0;
224         }
225       if ((c & 128) != 0)
226         {
227           x = (x << 7) ^ c ^ 128;
228           continue;
229         }
230       x = (x << 6) | (c & 63);
231       if (max && x >= max)
232         {
233           pool_debug(mypool, SAT_ERROR, "read_idarray: id too large (%u/%u)\n", x, max);
234           data->error = SOLV_ERROR_ID_RANGE;
235           return 0;
236         }
237       if (map)
238         x = map[x];
239       if (store == end)
240         {
241           pool_debug(mypool, SAT_ERROR, "read_idarray: array overflow\n");
242           return 0;
243         }
244       *store++ = x;
245       if ((c & 64) == 0)
246         {
247           if (x == 0)   /* already have trailing zero? */
248             return store;
249           if (store == end)
250             {
251               pool_debug(mypool, SAT_ERROR, "read_idarray: array overflow\n");
252               data->error = SOLV_ERROR_OVERFLOW;
253               return 0;
254             }
255           *store++ = 0;
256           return store;
257         }
258       x = 0;
259     }
260 }
261
262 static void
263 read_str(Repodata *data, char **inbuf, unsigned *len)
264 {
265   unsigned char *buf = (unsigned char*)*inbuf;
266   if (!buf)
267     {
268       buf = sat_malloc(1024);
269       *len = 1024;
270     }
271   int c;
272   unsigned ofs = 0;
273   while((c = getc(data->fp)) != 0)
274     {
275       if (c == EOF)
276         {
277           pool_debug (mypool, SAT_ERROR, "unexpected EOF\n");
278           data->error = SOLV_ERROR_EOF;
279           return;
280         }
281       /* Plus 1 as we also want to add the 0.  */
282       if (ofs + 1 >= *len)
283         {
284           *len += 256;
285           /* Don't realloc on the inbuf, it might be on the stack.  */
286           if (buf == (unsigned char*)*inbuf)
287             {
288               buf = sat_malloc(*len);
289               memcpy(buf, *inbuf, *len - 256);
290             }
291           else
292             buf = sat_realloc(buf, *len);
293         }
294       buf[ofs++] = c;
295     }
296   buf[ofs++] = 0;
297   *inbuf = (char*)buf;
298 }
299
300 static void
301 skip_item (Repodata *data, unsigned type, unsigned numid, unsigned numrel)
302 {
303   switch (type)
304     {
305       case TYPE_VOID:
306       case TYPE_CONSTANT:
307         break;
308       case TYPE_ID:
309         read_id(data, numid + numrel);          /* just check Id */
310         break;
311       case TYPE_DIR:
312         read_id(data, numid + data->dirpool.ndirs);     /* just check Id */
313         break;
314       case TYPE_NUM:
315         read_id(data, 0);
316         break;
317       case TYPE_U32:
318         read_u32(data);
319         break;
320       case TYPE_ATTR_STRING:
321       case TYPE_STR:
322         while (read_u8(data) != 0)
323           ;
324         break;
325       case TYPE_IDARRAY:
326       case TYPE_REL_IDARRAY:
327       case TYPE_ATTR_INTLIST:
328         while ((read_u8(data) & 0xc0) != 0)
329           ;
330         break;
331       case TYPE_DIRNUMNUMARRAY:
332         for (;;)
333           {
334             read_id(data, numid + data->dirpool.ndirs); /* just check Id */
335             read_id(data, 0);
336             if (!(read_id(data, 0) & 0x40))
337               break;
338           }
339         break;
340       case TYPE_DIRSTRARRAY:
341         for (;;)
342           {
343             Id id = read_id(data, 0);
344             while (read_u8(data) != 0)
345               ;
346             if (!(id & 0x40))
347               break;
348           }
349         break;
350       case TYPE_COUNT_NAMED:
351         {
352           unsigned count = read_id(data, 0);
353           while (count--)
354             {
355               read_id(data, numid);    /* Name */
356               unsigned t = read_id(data, TYPE_ATTR_TYPE_MAX + 1);
357               skip_item(data, t, numid, numrel);
358             }
359         }
360         break;
361       case TYPE_COUNTED:
362         {
363           unsigned count = read_id(data, 0);
364           unsigned t = read_id(data, TYPE_ATTR_TYPE_MAX + 1);
365           while (count--)
366             skip_item(data, t, numid, numrel);
367         }
368         break;
369       case TYPE_ATTR_CHUNK:
370         read_id(data, 0);
371         /* Fallthrough.  */
372       case TYPE_ATTR_INT:
373         read_id(data, 0);
374         break;
375       case TYPE_ATTR_LOCALIDS:
376         while (read_id(data, 0) != 0)
377           ;
378         break;
379       default:
380         pool_debug(mypool, SAT_ERROR, "unknown type %d\n", type);
381         data->error = SOLV_ERROR_CORRUPT;
382         break;
383     }
384 }
385
386 static int
387 key_cmp (const void *pa, const void *pb)
388 {
389   Repokey *a = (Repokey *)pa;
390   Repokey *b = (Repokey *)pb;
391   return a->name - b->name;
392 }
393
394 static void repodata_load_solv(Repodata *data);
395
396 static void
397 parse_repodata(Repodata *maindata, Id *keyp, Repokey *keys, Id *idmap, unsigned numid, unsigned numrel, Repo *repo)
398 {
399   Id key, id;
400   Id *ida, *ide;
401   Repodata *data;
402   int i, n;
403
404   repo->repodata = sat_realloc2(repo->repodata, repo->nrepodata + 1, sizeof (*data));
405   data = repo->repodata + repo->nrepodata++;
406   memset(data, 0, sizeof(*data));
407   data->repo = repo;
408   data->state = REPODATA_STUB;
409   data->loadcallback = repodata_load_solv;
410
411   while ((key = *keyp++) != 0)
412     {
413       id = keys[key].name;
414       switch (keys[key].type)
415         {
416         case TYPE_IDVALUEARRAY:
417           if (id != REPODATA_KEYS)
418             {
419               skip_item(maindata, TYPE_IDVALUEARRAY, numid, numrel);
420               break;
421             }
422           /* read_idarray writes a terminating 0, that's why the + 1 */
423           ida = sat_calloc(keys[key].size + 1, sizeof(Id));
424           ide = read_idarray(maindata, 0, 0, ida, ida + keys[key].size + 1);
425           n = ide - ida - 1;
426           if (n & 1)
427             {
428               pool_debug (mypool, SAT_ERROR, "invalid attribute data\n");
429               data->error = SOLV_ERROR_CORRUPT;
430               return;
431             }
432           data->nkeys = 1 + (n >> 1);
433           data->keys = sat_malloc2(data->nkeys, sizeof(data->keys[0]));
434           memset(data->keys, 0, sizeof(Repokey));
435           for (i = 1, ide = ida; i < data->nkeys; i++)
436             {
437               if (*ide >= numid)
438                 {
439                   pool_debug (mypool, SAT_ERROR, "invalid attribute data\n");
440                   data->error = SOLV_ERROR_CORRUPT;
441                   return;
442                 }
443               data->keys[i].name = idmap ? idmap[*ide++] : *ide++;
444               data->keys[i].type = *ide++;
445               data->keys[i].size = 0;
446               data->keys[i].storage = 0;
447             }
448           sat_free(ida);
449           if (data->nkeys > 2)
450             qsort(data->keys + 1, data->nkeys - 1, sizeof(data->keys[0]), key_cmp);
451           break;
452         case TYPE_STR:
453           if (id != REPODATA_LOCATION)
454             skip_item(maindata, TYPE_STR, numid, numrel);
455           else
456             {
457               char buf[1024];
458               unsigned len = sizeof (buf);
459               char *filename = buf;
460               read_str(maindata, &filename, &len);
461               data->location = strdup(filename);
462               if (filename != buf)
463                 free(filename);
464             }
465           break;
466         default:
467           skip_item(maindata, keys[key].type, numid, numrel);
468           break;
469         }
470     }
471 }
472
473 /*-----------------------------------------------------------------*/
474
475
476 static void
477 skip_schema(Repodata *data, Id *keyp, Repokey *keys, unsigned int numid, unsigned int numrel)
478 {
479   Id key;
480   while ((key = *keyp++) != 0)
481     skip_item(data, keys[key].type, numid, numrel);
482 }
483
484 /*-----------------------------------------------------------------*/
485
486 static void
487 incore_add_id(Repodata *data, Id x)
488 {
489   unsigned char *dp;
490   /* make sure we have at least 5 bytes free */
491   if (data->incoredatafree < 5)
492     {
493       data->incoredata = sat_realloc(data->incoredata, data->incoredatalen + 1024);
494       data->incoredatafree = 1024;
495     }
496   dp = data->incoredata + data->incoredatalen;
497   if (x < 0)
498     abort();
499   if (x >= (1 << 14))
500     {
501       if (x >= (1 << 28))
502         *dp++ = (x >> 28) | 128;
503       if (x >= (1 << 21))
504         *dp++ = (x >> 21) | 128;
505       *dp++ = (x >> 14) | 128;
506     }
507   if (x >= (1 << 7))
508     *dp++ = (x >> 7) | 128;
509   *dp++ = x & 127;
510   data->incoredatafree -= dp - (data->incoredata + data->incoredatalen);
511   data->incoredatalen = dp - data->incoredata;
512 }
513
514 static void
515 incore_add_u32(Repodata *data, unsigned int x)
516 {
517   unsigned char *dp;
518   /* make sure we have at least 4 bytes free */
519   if (data->incoredatafree < 4)
520     {
521       data->incoredata = sat_realloc(data->incoredata, data->incoredatalen + 1024);
522       data->incoredatafree = 1024;
523     }
524   dp = data->incoredata + data->incoredatalen;
525   *dp++ = x >> 24;
526   *dp++ = x >> 16;
527   *dp++ = x >> 8;
528   *dp++ = x;
529   data->incoredatafree -= 4;
530   data->incoredatalen += 4;
531 }
532
533 static void
534 incore_add_u8(Repodata *data, unsigned int x)
535 {
536   unsigned char *dp;
537   /* make sure we have at least 1 byte free */
538   if (data->incoredatafree < 1)
539     {
540       data->incoredata = sat_realloc(data->incoredata, data->incoredatalen + 1024);
541       data->incoredatafree = 1024;
542     }
543   dp = data->incoredata + data->incoredatalen;
544   *dp++ = x;
545   data->incoredatafree--;
546   data->incoredatalen++;
547 }
548
549
550
551 // ----------------------------------------------
552
553
554 /*
555  * read repo from .solv file
556  *  and add it to pool
557  */
558
559 static int
560 repo_add_solv_parent(Repo *repo, FILE *fp, Repodata *parent)
561 {
562   Pool *pool = repo->pool;
563   int i, l;
564   unsigned int numid, numrel, numdir, numsolv;
565   unsigned int numkeys, numschemata, numinfo;
566
567   Offset sizeid;
568   Offset *str;                         /* map Id -> Offset into string space */
569   char *strsp;                         /* repo string space */
570   char *sp;                            /* pointer into string space */
571   Id *idmap;                           /* map of repo Ids to pool Ids */
572   Id id;
573   unsigned int hashmask, h;
574   int hh;
575   Id *hashtbl;
576   Id name, evr, did;
577   int flags;
578   Reldep *ran;
579   unsigned int size_idarray;
580   Id *idarraydatap, *idarraydataend;
581   Offset ido;
582   Solvable *s;
583   unsigned int solvflags;
584   unsigned int solvversion;
585   Repokey *keys;
586   Id *schemadata, *schemadatap, *schemadataend;
587   Id *schemata, key;
588   int have_xdata;
589   unsigned oldnrepodata;
590
591   struct _Stringpool *spool;
592
593   Repodata data;
594
595   memset(&data, 0, sizeof(data));
596   data.repo = repo;
597   data.fp = fp;
598
599   mypool = pool;
600
601   if (read_u32(&data) != ('S' << 24 | 'O' << 16 | 'L' << 8 | 'V'))
602     {
603       pool_debug(pool, SAT_ERROR, "not a SOLV file\n");
604       return SOLV_ERROR_NOT_SOLV;
605     }
606   solvversion = read_u32(&data);
607   switch (solvversion)
608     {
609       case SOLV_VERSION_1:
610       case SOLV_VERSION_2:
611       case SOLV_VERSION_3:
612       case SOLV_VERSION_4:
613       case SOLV_VERSION_5:
614       /* Version 6 existed only intermittantly.  It's equivalent to
615          version 5.  */
616       case 6:
617         break;
618       default:
619         pool_debug(pool, SAT_ERROR, "unsupported SOLV version\n");
620         return SOLV_ERROR_UNSUPPORTED;
621     }
622
623   pool_freeidhashes(pool);
624
625   numid = read_u32(&data);
626   numrel = read_u32(&data);
627   if (solvversion >= SOLV_VERSION_4)
628     numdir = read_u32(&data);
629   else
630     numdir = 0;
631   numsolv = read_u32(&data);
632   numkeys = read_u32(&data);
633   numschemata = read_u32(&data);
634   numinfo = read_u32(&data);
635   solvflags = read_u32(&data);
636
637   if (solvversion < SOLV_VERSION_5)
638     numschemata++;
639
640   if (numdir && numdir < 2)
641     {
642       pool_debug(pool, SAT_ERROR, "bad number of dirs\n");
643       return SOLV_ERROR_CORRUPT;
644     }
645   if (numinfo && solvversion < SOLV_VERSION_3)
646     {
647       pool_debug(pool, SAT_ERROR, "unsupported SOLV format (has info)\n");
648       return SOLV_ERROR_UNSUPPORTED;
649     }
650
651   if (parent)
652     {
653       if (numrel)
654         {
655           pool_debug(pool, SAT_ERROR, "relations are forbidden in a store\n");
656           return SOLV_ERROR_CORRUPT;
657         }
658       if (parent->end - parent->start != numsolv)
659         {
660           pool_debug(pool, SAT_ERROR, "unequal number of solvables in a store\n");
661           return SOLV_ERROR_CORRUPT;
662         }
663       if (numinfo)
664         {
665           pool_debug(pool, SAT_ERROR, "info blocks are forbidden in a store\n");
666           return SOLV_ERROR_CORRUPT;
667         }
668     }
669
670   /*******  Part 1: string IDs  *****************************************/
671
672   sizeid = read_u32(&data);            /* size of string+Id space */
673
674   /*
675    * read strings and Ids
676    * 
677    */
678
679   
680   /*
681    * alloc buffers
682    */
683
684   if (!parent)
685     spool = &pool->ss;
686   else
687     {
688       data.localpool = 1;
689       spool = &data.spool;
690       spool->stringspace = sat_malloc(7);
691       strcpy(spool->stringspace, "<NULL>");
692       spool->sstrings = 7;
693       spool->nstrings = 0;
694     }
695
696   /* alloc string buffer */
697   spool->stringspace = sat_realloc(spool->stringspace, spool->sstrings + sizeid + 1);
698   /* alloc string offsets (Id -> Offset into string space) */
699   spool->strings = sat_realloc2(spool->strings, spool->nstrings + numid, sizeof(Offset));
700
701   strsp = spool->stringspace;
702   str = spool->strings;                /* array of offsets into strsp, indexed by Id */
703
704   /* point to _BEHIND_ already allocated string/Id space */
705   strsp += spool->sstrings;
706
707
708   /*
709    * read new repo at end of pool
710    */
711   
712   if ((solvflags & SOLV_FLAG_PREFIX_POOL) == 0)
713     {
714       if (sizeid && fread(strsp, sizeid, 1, fp) != 1)
715         {
716           pool_debug(pool, SAT_ERROR, "read error while reading strings\n");
717           return SOLV_ERROR_EOF;
718         }
719     }
720   else
721     {
722       unsigned int pfsize = read_u32(&data);
723       char *prefix = sat_malloc(pfsize);
724       char *pp = prefix;
725       char *old_str = 0;
726       char *dest = strsp;
727       if (pfsize && fread(prefix, pfsize, 1, fp) != 1)
728         {
729           pool_debug(pool, SAT_ERROR, "read error while reading strings\n");
730           sat_free(prefix);
731           return SOLV_ERROR_EOF;
732         }
733       for (i = 1; i < numid; i++)
734         {
735           int same = (unsigned char)*pp++;
736           size_t len = strlen (pp) + 1;
737           if (same)
738             memcpy(dest, old_str, same);
739           memcpy(dest + same, pp, len);
740           pp += len;
741           old_str = dest;
742           dest += same + len;
743         }
744       sat_free(prefix);
745     }
746   strsp[sizeid] = 0;                   /* make string space \0 terminated */
747   sp = strsp;
748
749   if (parent)
750     {
751       /* no shared pool, thus no idmap and no unification */
752       idmap = 0;
753       spool->nstrings = numid;
754       str[0] = 0;
755       if (*sp)
756         {
757           /* we need the '' for directories */
758           pool_debug(pool, SAT_ERROR, "store strings don't start with ''\n");
759           return SOLV_ERROR_CORRUPT;
760         }
761       for (i = 1; i < spool->nstrings; i++)
762         {
763           if (sp >= strsp + sizeid)
764             {
765               pool_debug(pool, SAT_ERROR, "not enough strings\n");
766               return SOLV_ERROR_OVERFLOW;
767             }
768           str[i] = sp - spool->stringspace;
769           sp += strlen(sp) + 1;
770         }
771       spool->sstrings = sp - spool->stringspace;
772     }
773   else
774     {
775
776       /* alloc id map for name and rel Ids. this maps ids in the solv files
777        * to the ids in our pool */
778       idmap = sat_calloc(numid + numrel, sizeof(Id));
779
780       /*
781        * build hashes for all read strings
782        * 
783        */
784       
785       hashmask = mkmask(spool->nstrings + numid);
786
787 #if 0
788       POOL_DEBUG(SAT_DEBUG_STATS, "read %d strings\n", numid);
789       POOL_DEBUG(SAT_DEBUG_STATS, "string hash buckets: %d\n", hashmask + 1);
790 #endif
791
792       /*
793        * create hashtable with strings already in pool
794        */
795
796       hashtbl = sat_calloc(hashmask + 1, sizeof(Id));
797       for (i = 1; i < spool->nstrings; i++)  /* leave out our dummy zero id */
798         {
799           h = strhash(spool->stringspace + spool->strings[i]) & hashmask;
800           hh = HASHCHAIN_START;
801           while (hashtbl[h])
802             h = HASHCHAIN_NEXT(h, hh, hashmask);
803           hashtbl[h] = i;
804         }
805
806       /*
807        * run over string space, calculate offsets
808        * 
809        * build id map (maps solv Id -> pool Id)
810        */
811       
812       for (i = 1; i < numid; i++)
813         {
814           if (sp >= strsp + sizeid)
815             {
816               sat_free(hashtbl);
817               sat_free(idmap);
818               pool_debug(pool, SAT_ERROR, "not enough strings\n");
819               return SOLV_ERROR_OVERFLOW;
820             }
821           if (!*sp)                            /* empty string */
822             {
823               idmap[i] = ID_EMPTY;
824               sp++;
825               continue;
826             }
827
828           /* find hash slot */
829           h = strhash(sp) & hashmask;
830           hh = HASHCHAIN_START;
831           for (;;)
832             {
833               id = hashtbl[h];
834               if (id == 0)
835                 break;
836               if (!strcmp(spool->stringspace + spool->strings[id], sp))
837                 break;                 /* existing string */
838               h = HASHCHAIN_NEXT(h, hh, hashmask);
839             }
840
841           /* length == offset to next string */
842           l = strlen(sp) + 1;
843           if (id == ID_NULL)           /* end of hash chain -> new string */
844             {
845               id = spool->nstrings++;
846               hashtbl[h] = id;
847               str[id] = spool->sstrings;    /* save Offset */
848               if (sp != spool->stringspace + spool->sstrings)   /* not at end-of-buffer */
849                 memmove(spool->stringspace + spool->sstrings, sp, l);   /* append to pool buffer */
850               spool->sstrings += l;
851             }
852           idmap[i] = id;                       /* repo relative -> pool relative */
853           sp += l;                             /* next string */
854         }
855       sat_free(hashtbl);
856     }
857   pool_shrink_strings(pool);           /* vacuum */
858
859   
860   /*******  Part 2: Relation IDs  ***************************************/
861
862   /*
863    * read RelDeps
864    * 
865    */
866   
867   if (numrel)
868     {
869       /* extend rels */
870       pool->rels = sat_realloc2(pool->rels, pool->nrels + numrel, sizeof(Reldep));
871       ran = pool->rels;
872
873       hashmask = mkmask(pool->nrels + numrel);
874 #if 0
875       POOL_DEBUG(SAT_DEBUG_STATS, "read %d rels\n", numrel);
876       POOL_DEBUG(SAT_DEBUG_STATS, "rel hash buckets: %d\n", hashmask + 1);
877 #endif
878       /*
879        * prep hash table with already existing RelDeps
880        */
881       
882       hashtbl = sat_calloc(hashmask + 1, sizeof(Id));
883       for (i = 1; i < pool->nrels; i++)
884         {
885           h = relhash(ran[i].name, ran[i].evr, ran[i].flags) & hashmask;
886           hh = HASHCHAIN_START;
887           while (hashtbl[h])
888             h = HASHCHAIN_NEXT(h, hh, hashmask);
889           hashtbl[h] = i;
890         }
891
892       /*
893        * read RelDeps from repo
894        */
895       
896       for (i = 0; i < numrel; i++)
897         {
898           name = read_id(&data, i + numid);     /* read (repo relative) Ids */
899           evr = read_id(&data, i + numid);
900           flags = read_u8(&data);
901           name = idmap[name];           /* map to (pool relative) Ids */
902           evr = idmap[evr];
903           h = relhash(name, evr, flags) & hashmask;
904           hh = HASHCHAIN_START;
905           for (;;)
906             {
907               id = hashtbl[h];
908               if (id == ID_NULL)        /* end of hash chain */
909                 break;
910               if (ran[id].name == name && ran[id].evr == evr && ran[id].flags == flags)
911                 break;
912               h = HASHCHAIN_NEXT(h, hh, hashmask);
913             }
914           if (id == ID_NULL)            /* new RelDep */
915             {
916               id = pool->nrels++;
917               hashtbl[h] = id;
918               ran[id].name = name;
919               ran[id].evr = evr;
920               ran[id].flags = flags;
921             }
922           idmap[i + numid] = MAKERELDEP(id);   /* fill Id map */
923         }
924       sat_free(hashtbl);
925       pool_shrink_rels(pool);           /* vacuum */
926     }
927
928
929   /*******  Part 3: Dirs  ***********************************************/
930   if (numdir)
931     {
932       data.dirpool.dirs = sat_malloc2(numdir, sizeof(Id));
933       data.dirpool.ndirs = numdir;
934       data.dirpool.dirs[0] = 0;         /* dir 0: virtual root */
935       data.dirpool.dirs[1] = 1;         /* dir 1: / */
936       for (i = 2; i < numdir; i++)
937         {
938           id = read_id(&data, i + numid);
939           if (id >= numid)
940             data.dirpool.dirs[i] = -(id - numid);
941           else if (idmap)
942             data.dirpool.dirs[i] = idmap[id];
943           else
944             data.dirpool.dirs[i] = id;
945         }
946     }
947
948   /*******  Part 4: Keys  ***********************************************/
949
950   keys = sat_calloc(numkeys, sizeof(*keys));
951   /* keys start at 1 */
952   for (i = 1; i < numkeys; i++)
953     {
954       id = read_id(&data, numid);
955       if (idmap)
956         id = idmap[id];
957       else if (parent)
958         id = str2id(pool, stringpool_id2str(spool, id), 1);
959       keys[i].name = id;
960       keys[i].type = read_id(&data, 0);
961       keys[i].size = read_id(&data, 0);
962 #if 0
963       fprintf (stderr, "key %d %s %d %d\n", i, id2str(pool,id), keys[i].type,
964                keys[i].size);
965 #endif
966       if (solvversion >= SOLV_VERSION_5)
967         {
968           keys[i].storage = read_id(&data, 0);
969           continue;
970         }
971       keys[i].storage = KEY_STORAGE_DROPPED;
972       if (parent)
973         {
974           keys[i].storage = KEY_STORAGE_INCORE;
975           continue;
976         }
977       switch (keys[i].type)
978         {
979         case TYPE_VOID:
980         case TYPE_CONSTANT:
981         case TYPE_STR:
982         case TYPE_NUM:
983         case TYPE_DIRNUMNUMARRAY:
984           keys[i].storage = KEY_STORAGE_INCORE;
985           break;
986         case TYPE_ID:
987           switch(id)
988             {
989             case SOLVABLE_NAME:
990             case SOLVABLE_ARCH:
991             case SOLVABLE_EVR:
992             case SOLVABLE_VENDOR:
993               keys[i].storage = KEY_STORAGE_SOLVABLE;
994               break;
995             default:
996               keys[i].storage = KEY_STORAGE_INCORE;
997               break;
998             }
999           break;
1000         case TYPE_IDARRAY:
1001         case TYPE_REL_IDARRAY:
1002           if (id >= INTERESTED_START && id <= INTERESTED_END)
1003             keys[i].storage = KEY_STORAGE_SOLVABLE;
1004           else
1005             keys[i].storage = KEY_STORAGE_INCORE;
1006           break;
1007         case TYPE_U32:
1008           if (id == RPM_RPMDBID)
1009             keys[i].storage = KEY_STORAGE_SOLVABLE;
1010           else
1011             keys[i].storage = KEY_STORAGE_INCORE;
1012           break;
1013         default:
1014           break;
1015         }
1016     }
1017
1018   have_xdata = parent ? 1 : 0;
1019   for (i = 1; i < numkeys; i++)
1020     if (keys[i].storage == KEY_STORAGE_INCORE || keys[i].storage == KEY_STORAGE_VERTICAL_OFFSET)
1021       have_xdata = 1;
1022
1023   data.keys = keys;
1024   data.nkeys = numkeys;
1025
1026   /*******  Part 5: Schemata ********************************************/
1027   
1028   id = read_id(&data, 0);
1029   schemadata = sat_calloc(id + 1, sizeof(Id));
1030   schemadatap = schemadata + 1;
1031   schemadataend = schemadatap + id;
1032   schemata = sat_calloc(numschemata, sizeof(Id));
1033   for (i = 1; i < numschemata; i++)
1034     {
1035       schemata[i] = schemadatap - schemadata;
1036       schemadatap = read_idarray(&data, numid, 0, schemadatap, schemadataend);
1037 #if 0
1038       Id *sp = schemadata + schemata[i];
1039       fprintf (stderr, "schema %d:", i);
1040       for (; *sp; sp++)
1041         fprintf (stderr, " %d", *sp);
1042       fprintf (stderr, "\n");
1043 #endif
1044     }
1045   data.schemata = schemata;
1046   data.nschemata = numschemata;
1047   data.schemadata = schemadata;
1048   data.schemadatalen = schemadataend - data.schemadata;
1049
1050
1051   /*******  Part 6: Info  ***********************************************/
1052   oldnrepodata = repo->nrepodata;
1053   for (i = 0; i < numinfo; i++)
1054     {
1055       /* for now we're just interested in data that starts with
1056        * the repodata_external id
1057        */
1058       Id *keyp;
1059       id = read_id(&data, numschemata);
1060       if (solvversion < SOLV_VERSION_5)
1061         id++;
1062       keyp = schemadata + schemata[id];
1063       key = *keyp;
1064       if (keys[key].name == REPODATA_EXTERNAL && keys[key].type == TYPE_VOID)
1065         {
1066           /* external data for some ids */
1067           parse_repodata(&data, keyp, keys, idmap, numid, numrel, repo);
1068         }
1069       else
1070         skip_schema(&data, keyp, keys, numid, numrel);
1071     }
1072
1073
1074   /*******  Part 7: packed sizes (optional)  ****************************/
1075   char *exists = 0;
1076   if ((solvflags & SOLV_FLAG_PACKEDSIZES) != 0)
1077     {
1078       exists = sat_malloc (numsolv);
1079       for (i = 0; i < numsolv; i++)
1080         exists[i] = read_id(&data, 0) != 0;
1081     }
1082
1083
1084   /*******  Part 8: item data *******************************************/
1085
1086   /* calculate idarray size */
1087   size_idarray = 0;
1088   for (i = 1; i < numkeys; i++)
1089     {
1090       id = keys[i].name;
1091       if ((keys[i].type == TYPE_IDARRAY || keys[i].type == TYPE_REL_IDARRAY)
1092           && id >= INTERESTED_START && id <= INTERESTED_END)
1093         size_idarray += keys[i].size;
1094     }
1095
1096   /* allocate needed space in repo */
1097   if (size_idarray)
1098     {
1099       repo_reserve_ids(repo, 0, size_idarray);
1100       idarraydatap = repo->idarraydata + repo->idarraysize;
1101       repo->idarraysize += size_idarray;
1102       idarraydataend = idarraydatap + size_idarray;
1103       repo->lastoff = 0;
1104     }
1105   else
1106     {
1107       idarraydatap = 0;
1108       idarraydataend = 0;
1109     }
1110
1111   /* read solvables */
1112   if (numsolv)
1113     {
1114       if (parent)
1115         s = pool_id2solvable(pool, parent->start);
1116       else
1117         s = pool_id2solvable(pool, repo_add_solvable_block(repo, numsolv));
1118       /* store start and end of our id block */
1119       data.start = s - pool->solvables;
1120       data.end = data.start + numsolv;
1121       /* In case we have info blocks, make them refer to our part of the 
1122          repository now.  */
1123       for (i = oldnrepodata; i < repo->nrepodata; i++)
1124         {
1125           repo->repodata[i].start = data.start;
1126           repo->repodata[i].end = data.end;
1127         }
1128     }
1129   else
1130     s = 0;
1131
1132   if (have_xdata)
1133     repodata_extend_block(&data, data.start, numsolv);
1134
1135   for (i = 0; i < numsolv; i++, s++)
1136     {
1137       Id *keyp;
1138       if (data.error)
1139         break;
1140       if (exists && !exists[i])
1141         continue;
1142       id = read_id(&data, numschemata);
1143       if (solvversion < SOLV_VERSION_5)
1144         id++;
1145       if (have_xdata)
1146         {
1147           data.incoreoffset[i] = data.incoredatalen;
1148           incore_add_id(&data, id);
1149         }
1150       keyp = schemadata + schemata[id];
1151       while ((key = *keyp++) != 0)
1152         {
1153           id = keys[key].name;
1154 #if 0
1155 fprintf(stderr, "solv %d name %d type %d class %d\n", i, id, keys[key].type, keys[key].storage);
1156 #endif
1157           if (keys[key].storage == KEY_STORAGE_VERTICAL_OFFSET)
1158             {
1159               /* copy offset/length into incore */
1160               did = read_id(&data, 0);
1161               incore_add_id(&data, did);
1162               did = read_id(&data, 0);
1163               incore_add_id(&data, did);
1164               continue;
1165             }
1166           switch (keys[key].type)
1167             {
1168             case TYPE_VOID:
1169             case TYPE_CONSTANT:
1170               break;
1171             case TYPE_ID:
1172               did = read_id(&data, numid + numrel);
1173               if (idmap)
1174                 did = idmap[did];
1175               if (id == SOLVABLE_NAME)
1176                 s->name = did;
1177               else if (id == SOLVABLE_ARCH)
1178                 s->arch = did;
1179               else if (id == SOLVABLE_EVR)
1180                 s->evr = did;
1181               else if (id == SOLVABLE_VENDOR)
1182                 s->vendor = did;
1183               else if (keys[key].storage == KEY_STORAGE_INCORE)
1184                 incore_add_id(&data, did);
1185 #if 0
1186               POOL_DEBUG(SAT_DEBUG_STATS, "%s -> %s\n", id2str(pool, id), id2str(pool, did));
1187 #endif
1188               break;
1189             case TYPE_NUM:
1190               did = read_id(&data, 0);
1191               if (keys[key].storage == KEY_STORAGE_INCORE)
1192                 incore_add_id(&data, did);
1193 #if 0
1194               POOL_DEBUG(SAT_DEBUG_STATS, "%s -> %d\n", id2str(pool, id), did);
1195 #endif
1196               break;
1197             case TYPE_U32:
1198               h = read_u32(&data);
1199 #if 0
1200               POOL_DEBUG(SAT_DEBUG_STATS, "%s -> %u\n", id2str(pool, id), h);
1201 #endif
1202               if (id == RPM_RPMDBID)
1203                 {
1204                   if (!repo->rpmdbid)
1205                     repo->rpmdbid = sat_calloc(numsolv, sizeof(Id));
1206                   repo->rpmdbid[i] = h;
1207                 }
1208               else if (keys[key].storage == KEY_STORAGE_INCORE)
1209                 incore_add_u32(&data, h);
1210               break;
1211             case TYPE_STR:
1212               if (keys[key].storage == KEY_STORAGE_INCORE)
1213                 {
1214                   while ((h = read_u8(&data)) != 0)
1215                     incore_add_u8(&data, h);
1216                   incore_add_u8(&data, 0);
1217                 }
1218               else
1219                 {
1220                   while (read_u8(&data) != 0)
1221                     ;
1222                 }
1223               break;
1224             case TYPE_IDARRAY:
1225             case TYPE_REL_IDARRAY:
1226               if (id < INTERESTED_START || id > INTERESTED_END)
1227                 {
1228                   if (keys[key].storage == KEY_STORAGE_INCORE)
1229                     {
1230                       if (idmap)
1231                         {
1232                           abort();      /* implement me! */
1233                         }
1234                       else
1235                         {
1236                           while (((h = read_u8(&data)) & 0xc0) != 0)
1237                             incore_add_u8(&data, h);
1238                           break;
1239                         }
1240                     }
1241                   else
1242                     {
1243                       while ((read_u8(&data) & 0xc0) != 0)
1244                         ;
1245                       break;
1246                     }
1247                   break;
1248                 }
1249               ido = idarraydatap - repo->idarraydata;
1250               if (keys[key].type == TYPE_IDARRAY)
1251                 idarraydatap = read_idarray(&data, numid + numrel, idmap, idarraydatap, idarraydataend);
1252               else if (id == SOLVABLE_REQUIRES)
1253                 idarraydatap = read_rel_idarray(&data, numid + numrel, idmap, idarraydatap, idarraydataend, SOLVABLE_PREREQMARKER);
1254               else if (id == SOLVABLE_PROVIDES)
1255                 idarraydatap = read_rel_idarray(&data, numid + numrel, idmap, idarraydatap, idarraydataend, SOLVABLE_FILEMARKER);
1256               else
1257                 idarraydatap = read_rel_idarray(&data, numid + numrel, idmap, idarraydatap, idarraydataend, 0);
1258               if (id == SOLVABLE_PROVIDES)
1259                 s->provides = ido;
1260               else if (id == SOLVABLE_OBSOLETES)
1261                 s->obsoletes = ido;
1262               else if (id == SOLVABLE_CONFLICTS)
1263                 s->conflicts = ido;
1264               else if (id == SOLVABLE_REQUIRES)
1265                 s->requires = ido;
1266               else if (id == SOLVABLE_RECOMMENDS)
1267                 s->recommends= ido;
1268               else if (id == SOLVABLE_SUPPLEMENTS)
1269                 s->supplements = ido;
1270               else if (id == SOLVABLE_SUGGESTS)
1271                 s->suggests = ido;
1272               else if (id == SOLVABLE_ENHANCES)
1273                 s->enhances = ido;
1274               else if (id == SOLVABLE_FRESHENS)
1275                 s->freshens = ido;
1276 #if 0
1277               POOL_DEBUG(SAT_DEBUG_STATS, "%s ->\n", id2str(pool, id));
1278               for (; repo->idarraydata[ido]; ido++)
1279                 POOL_DEBUG(SAT_DEBUG_STATS,"  %s\n", dep2str(pool, repo->idarraydata[ido]));
1280 #endif
1281               break;
1282             case TYPE_DIRNUMNUMARRAY:
1283               for (;;)
1284                 {
1285                   Id num, num2;
1286                   did = read_id(&data, numdir);
1287                   num = read_id(&data, 0);
1288                   num2 = read_id(&data, 0);
1289                   if (keys[key].storage == KEY_STORAGE_INCORE)
1290                     {
1291 #if 0
1292                       POOL_DEBUG(SAT_DEBUG_STATS, "%s -> %d %d %d\n", id2str(pool, id), did, num, num2);
1293 #endif
1294                       incore_add_id(&data, did);
1295                       incore_add_id(&data, num);
1296                       incore_add_id(&data, num2);
1297                     }
1298                   if (!(num2 & 0x40))
1299                     break;
1300                 }
1301               break;
1302             case TYPE_DIRSTRARRAY:
1303               for (;;)
1304                 {
1305                   did = read_id(&data, 0);
1306                   if (keys[key].storage == KEY_STORAGE_INCORE)
1307                     {
1308                       incore_add_id(&data, did);
1309                       while ((h = read_u8(&data)) != 0)
1310                         incore_add_u8(&data, h);
1311                       incore_add_u8(&data, 0);
1312                     }
1313                   else
1314                     {
1315                       while (read_u8(&data) != 0)
1316                         ;
1317                     }
1318                   if (!(did & 0x40))
1319                     break;
1320                 }
1321               break;
1322             default:
1323               skip_item(&data, keys[key].type, numid, numrel);
1324             }
1325         }
1326     }
1327
1328   if (data.error)
1329     {
1330       /* free solvables */
1331       repo_free_solvable_block(repo, data.start, data.end - data.start, 1);
1332       /* free id array */
1333       repo->idarraysize -= size_idarray;
1334       /* free incore data */
1335       data.incoredata = sat_free(data.incoredata);
1336       data.incoredatalen = data.incoredatafree = 0;
1337     }
1338
1339   if (data.incoredatafree)
1340     {
1341       /* shrink excess size */
1342       data.incoredata = sat_realloc(data.incoredata, data.incoredatalen);
1343       data.incoredatafree = 0;
1344     }
1345
1346   for (i = 1; i < numkeys; i++)
1347     if (keys[i].storage == KEY_STORAGE_VERTICAL_OFFSET)
1348       break;
1349   if (i < numkeys && !data.error)
1350     {
1351       Id fileoffset = 0;
1352       unsigned int pagesize;
1353       
1354       /* we have vertical data, make it available */
1355       data.verticaloffset = sat_calloc(numkeys, sizeof(Id));
1356       for (i = 1; i < numkeys; i++)
1357         if (keys[i].storage == KEY_STORAGE_VERTICAL_OFFSET)
1358           {
1359             data.verticaloffset[i] = fileoffset;
1360             fileoffset += keys[i].size;
1361           }
1362       data.lastverticaloffset = fileoffset;
1363       pagesize = read_u32(&data);
1364       repodata_read_or_setup_pages(&data, pagesize, fileoffset);
1365     }
1366   else
1367     {
1368       /* no longer needed */
1369       data.fp = 0;
1370     }
1371
1372   if (parent)
1373     {
1374       /* we're a store */
1375       sat_free(parent->schemata);
1376       sat_free(parent->schemadata);
1377       sat_free(parent->keys);
1378       sat_free(parent->location);
1379       *parent = data;
1380     }
1381   else if (data.incoredatalen || data.fp)
1382     {
1383       /* we got some data, make it available */
1384       repo->repodata = sat_realloc2(repo->repodata, repo->nrepodata + 1, sizeof(data));
1385       repo->repodata[repo->nrepodata++] = data;
1386     }
1387   else
1388     {
1389       /* discard data */
1390       sat_free(data.dirpool.dirs);
1391       sat_free(data.incoreoffset);
1392       sat_free(schemata);
1393       sat_free(schemadata);
1394       sat_free(keys);
1395     }
1396
1397   sat_free(exists);
1398   sat_free(idmap);
1399   mypool = 0;
1400   return data.error;
1401 }
1402
1403 int
1404 repo_add_solv(Repo *repo, FILE *fp)
1405 {
1406   return repo_add_solv_parent(repo, fp, 0);
1407 }
1408
1409 static void
1410 repodata_load_solv(Repodata *data)
1411 {
1412   FILE *fp;
1413   Pool *pool = data->repo->pool;
1414   if (!pool->loadcallback)
1415     {   
1416       data->state = REPODATA_ERROR;
1417       return;
1418     }   
1419   fp = pool->loadcallback(pool, data, pool->loadcallbackdata);
1420   if (!fp)
1421     {   
1422       data->state = REPODATA_ERROR;
1423       return;
1424     }   
1425   if (repo_add_solv_parent(data->repo, fp, data))
1426     data->state = REPODATA_ERROR;
1427   else
1428     data->state = REPODATA_AVAILABLE;
1429   fclose(fp);
1430 }