Support for generating separate sub files and bugfixes in the reader
[platform/upstream/libsolv.git] / src / repo_solv.c
1 /*
2  * Copyright (c) 2007, Novell Inc.
3  *
4  * This program is licensed under the BSD license, read LICENSE.BSD
5  * for further information
6  */
7
8 /*
9  * repo_solv.c
10  * 
11  * Read the binary dump of a Repo and create a Repo * from it
12  * 
13  *  See
14  *   Repo *pool_addrepo_solv(Pool *pool, FILE *fp)
15  * below
16  * 
17  */
18
19
20
21 #include <stdio.h>
22 #include <stdlib.h>
23 #include <unistd.h>
24 #include <string.h>
25
26 #include "repo_solv.h"
27 #include "util.h"
28 #if 0
29 #include "attr_store_p.h"
30 #endif
31
32 #define INTERESTED_START        SOLVABLE_NAME
33 #define INTERESTED_END          SOLVABLE_FRESHENS
34
35 #define SOLV_ERROR_NOT_SOLV     1
36 #define SOLV_ERROR_UNSUPPORTED  2
37 #define SOLV_ERROR_EOF          3
38 #define SOLV_ERROR_ID_RANGE     4
39 #define SOLV_ERROR_OVERFLOW     5
40 #define SOLV_ERROR_CORRUPT      6
41
42 static Pool *mypool;            /* for pool_debug... */
43
44 /*-----------------------------------------------------------------*/
45 /* .solv read functions */
46
47 /*
48  * read u32
49  */
50
51 static unsigned int
52 read_u32(Repodata *data)
53 {
54   int c, i;
55   unsigned int x = 0;
56
57   if (data->error)
58     return 0;
59   for (i = 0; i < 4; i++)
60     {
61       c = getc(data->fp);
62       if (c == EOF)
63         {
64           pool_debug(mypool, SAT_ERROR, "unexpected EOF\n");
65           data->error = SOLV_ERROR_EOF;
66           return 0;
67         }
68       x = (x << 8) | c;
69     }
70   return x;
71 }
72
73
74 /*
75  * read u8
76  */
77
78 static unsigned int
79 read_u8(Repodata *data)
80 {
81   int c;
82
83   if (data->error)
84     return 0;
85   c = getc(data->fp);
86   if (c == EOF)
87     {
88       pool_debug(mypool, SAT_ERROR, "unexpected EOF\n");
89       data->error = SOLV_ERROR_EOF;
90       return 0;
91     }
92   return c;
93 }
94
95
96 /*
97  * read Id
98  */
99
100 static Id
101 read_id(Repodata *data, Id max)
102 {
103   unsigned int x = 0;
104   int c, i;
105
106   if (data->error)
107     return 0;
108   for (i = 0; i < 5; i++)
109     {
110       c = getc(data->fp);
111       if (c == EOF)
112         {
113           pool_debug(mypool, SAT_ERROR, "unexpected EOF\n");
114           data->error = SOLV_ERROR_EOF;
115           return 0;
116         }
117       if (!(c & 128))
118         {
119           x = (x << 7) | c;
120           if (max && x >= max)
121             {
122               pool_debug(mypool, SAT_ERROR, "read_id: id too large (%u/%u)\n", x, max);
123               data->error = SOLV_ERROR_ID_RANGE;
124               return 0;
125             }
126           return x;
127         }
128       x = (x << 7) ^ c ^ 128;
129     }
130   pool_debug(mypool, SAT_ERROR, "read_id: id too long\n");
131   data->error = SOLV_ERROR_CORRUPT;
132   return 0;
133 }
134
135
136 /*
137  * read array of Ids
138  */
139
140 static Id *
141 read_idarray(Repodata *data, Id max, Id *map, Id *store, Id *end, int relative)
142 {
143   unsigned int x = 0;
144   int c;
145   Id old = 0;
146
147   if (data->error)
148     return 0;
149   for (;;)
150     {
151       c = getc(data->fp);
152       if (c == EOF)
153         {
154           pool_debug(mypool, SAT_ERROR, "unexpected EOF\n");
155           data->error = SOLV_ERROR_EOF;
156           return 0;
157         }
158       if ((c & 128) == 0)
159         {
160           x = (x << 6) | (c & 63);
161           if (relative)
162             {
163               if (x == 0 && c == 0x40)
164                 {
165                   /* prereq hack */
166                   if (store == end)
167                     {
168                       pool_debug(mypool, SAT_ERROR, "read_idarray: array overflow\n");
169                       data->error = SOLV_ERROR_OVERFLOW;
170                       return 0;
171                     }
172                   *store++ = SOLVABLE_PREREQMARKER;
173                   old = 0;
174                   x = 0;
175                   continue;
176                 }
177               x = (x - 1) + old;
178               old = x;
179             }
180           if (max && x >= max)
181             {
182               pool_debug(mypool, SAT_ERROR, "read_idarray: id too large (%u/%u)\n", x, max);
183               data->error = SOLV_ERROR_ID_RANGE;
184               return 0;
185             }
186           if (map)
187             x = map[x];
188           if (store == end)
189             {
190               pool_debug(mypool, SAT_ERROR, "read_idarray: array overflow\n");
191               return 0;
192             }
193           *store++ = x;
194           if ((c & 64) == 0)
195             {
196               if (x == 0)       /* already have trailing zero? */
197                 return store;
198               if (store == end)
199                 {
200                   pool_debug(mypool, SAT_ERROR, "read_idarray: array overflow\n");
201                   data->error = SOLV_ERROR_OVERFLOW;
202                   return 0;
203                 }
204               *store++ = 0;
205               return store;
206             }
207           x = 0;
208           continue;
209         }
210       x = (x << 7) ^ c ^ 128;
211     }
212 }
213
214 static void
215 read_str(Repodata *data, char **inbuf, unsigned *len)
216 {
217   unsigned char *buf = (unsigned char*)*inbuf;
218   if (!buf)
219     {
220       buf = sat_malloc(1024);
221       *len = 1024;
222     }
223   int c;
224   unsigned ofs = 0;
225   while((c = getc(data->fp)) != 0)
226     {
227       if (c == EOF)
228         {
229           pool_debug (mypool, SAT_ERROR, "unexpected EOF\n");
230           data->error = SOLV_ERROR_EOF;
231           return;
232         }
233       /* Plus 1 as we also want to add the 0.  */
234       if (ofs + 1 >= *len)
235         {
236           *len += 256;
237           /* Don't realloc on the inbuf, it might be on the stack.  */
238           if (buf == (unsigned char*)*inbuf)
239             {
240               buf = sat_malloc(*len);
241               memcpy(buf, *inbuf, *len - 256);
242             }
243           else
244             buf = sat_realloc(buf, *len);
245         }
246       buf[ofs++] = c;
247     }
248   buf[ofs++] = 0;
249   *inbuf = (char*)buf;
250 }
251
252 static void
253 skip_item (Repodata *data, unsigned type, unsigned numid, unsigned numrel)
254 {
255   switch (type)
256     {
257       case TYPE_VOID:
258       case TYPE_CONSTANT:
259         break;
260       case TYPE_ID:
261         read_id(data, numid + numrel);          /* just check Id */
262         break;
263       case TYPE_DIR:
264         read_id(data, numid + data->dirpool.ndirs);     /* just check Id */
265         break;
266       case TYPE_NUM:
267         read_id(data, 0);
268         break;
269       case TYPE_U32:
270         read_u32(data);
271         break;
272       case TYPE_ATTR_STRING:
273       case TYPE_STR:
274         while (read_u8(data) != 0)
275           ;
276         break;
277       case TYPE_IDARRAY:
278       case TYPE_REL_IDARRAY:
279       case TYPE_ATTR_INTLIST:
280         while ((read_u8(data) & 0xc0) != 0)
281           ;
282         break;
283       case TYPE_DIRNUMNUMARRAY:
284         for (;;)
285           {
286             read_id(data, numid + data->dirpool.ndirs); /* just check Id */
287             read_id(data, 0);
288             if (!(read_id(data, 0) & 0x40))
289               break;
290           }
291         break;
292       case TYPE_DIRSTRARRAY:
293         for (;;)
294           {
295             Id id = read_id(data, 0);
296             while (read_u8(data) != 0)
297               ;
298             if (!(id & 0x40))
299               break;
300           }
301         break;
302       case TYPE_COUNT_NAMED:
303         {
304           unsigned count = read_id(data, 0);
305           while (count--)
306             {
307               read_id(data, numid);    /* Name */
308               unsigned t = read_id(data, TYPE_ATTR_TYPE_MAX + 1);
309               skip_item(data, t, numid, numrel);
310             }
311         }
312         break;
313       case TYPE_COUNTED:
314         {
315           unsigned count = read_id(data, 0);
316           unsigned t = read_id(data, TYPE_ATTR_TYPE_MAX + 1);
317           while (count--)
318             skip_item(data, t, numid, numrel);
319         }
320         break;
321       case TYPE_ATTR_CHUNK:
322         read_id(data, 0);
323         /* Fallthrough.  */
324       case TYPE_ATTR_INT:
325         read_id(data, 0);
326         break;
327       case TYPE_ATTR_LOCALIDS:
328         while (read_id(data, 0) != 0)
329           ;
330         break;
331       default:
332         pool_debug(mypool, SAT_ERROR, "unknown type %d\n", type);
333         data->error = SOLV_ERROR_CORRUPT;
334         break;
335     }
336 }
337
338 static int
339 key_cmp (const void *pa, const void *pb)
340 {
341   Repokey *a = (Repokey *)pa;
342   Repokey *b = (Repokey *)pb;
343   return a->name - b->name;
344 }
345
346 static void repodata_load_solv(Repodata *data);
347
348 static void
349 parse_repodata(Repodata *maindata, Id *keyp, Repokey *keys, Id *idmap, unsigned numid, unsigned numrel, Repo *repo)
350 {
351   Id key, id;
352   Id *ida, *ide;
353   Repodata *data;
354   int i, n;
355
356   repo->repodata = sat_realloc2(repo->repodata, repo->nrepodata + 1, sizeof (*data));
357   data = repo->repodata + repo->nrepodata++;
358   memset(data, 0, sizeof(*data));
359   data->repo = repo;
360   data->state = REPODATA_STUB;
361   data->loadcallback = repodata_load_solv;
362
363   while ((key = *keyp++) != 0)
364     {
365       id = keys[key].name;
366       switch (keys[key].type)
367         {
368         case TYPE_IDVALUEARRAY:
369           if (id != REPODATA_KEYS)
370             {
371               skip_item(maindata, TYPE_IDVALUEARRAY, numid, numrel);
372               break;
373             }
374           /* read_idarray writes a terminating 0, that's why the + 1 */
375           ida = sat_calloc(keys[key].size + 1, sizeof(Id));
376           ide = read_idarray(maindata, 0, 0, ida, ida + keys[key].size + 1, 0);
377           n = ide - ida - 1;
378           if (n & 1)
379             {
380               pool_debug (mypool, SAT_ERROR, "invalid attribute data\n");
381               data->error = SOLV_ERROR_CORRUPT;
382               return;
383             }
384           data->nkeys = 1 + (n >> 1);
385           data->keys = sat_malloc2(data->nkeys, sizeof(data->keys[0]));
386           memset(data->keys, 0, sizeof(Repokey));
387           for (i = 1, ide = ida; i < data->nkeys; i++)
388             {
389               if (*ide >= numid)
390                 {
391                   pool_debug (mypool, SAT_ERROR, "invalid attribute data\n");
392                   data->error = SOLV_ERROR_CORRUPT;
393                   return;
394                 }
395               data->keys[i].name = idmap ? idmap[*ide++] : *ide++;
396               data->keys[i].type = *ide++;
397               data->keys[i].size = 0;
398               data->keys[i].storage = 0;
399             }
400           sat_free(ida);
401           if (data->nkeys > 2)
402             qsort(data->keys + 1, data->nkeys - 1, sizeof(data->keys[0]), key_cmp);
403           break;
404         case TYPE_STR:
405           if (id != REPODATA_LOCATION)
406             skip_item(maindata, TYPE_STR, numid, numrel);
407           else
408             {
409               char buf[1024];
410               unsigned len = sizeof (buf);
411               char *filename = buf;
412               read_str(maindata, &filename, &len);
413               data->location = strdup(filename);
414               if (filename != buf)
415                 free(filename);
416             }
417           break;
418         default:
419           skip_item(maindata, keys[key].type, numid, numrel);
420           break;
421         }
422     }
423 }
424
425 /*-----------------------------------------------------------------*/
426
427
428 static void
429 skip_schema(Repodata *data, Id *keyp, Repokey *keys, unsigned int numid, unsigned int numrel)
430 {
431   Id key;
432   while ((key = *keyp++) != 0)
433     skip_item(data, keys[key].type, numid, numrel);
434 }
435
436 /*-----------------------------------------------------------------*/
437
438 static void
439 incore_add_id(Repodata *data, Id x)
440 {
441   unsigned char *dp;
442   /* make sure we have at least 5 bytes free */
443   if (data->incoredatafree < 5)
444     {
445       data->incoredata = sat_realloc(data->incoredata, data->incoredatalen + 1024);
446       data->incoredatafree = 1024;
447     }
448   dp = data->incoredata + data->incoredatalen;
449   if (x < 0)
450     abort();
451   if (x >= (1 << 14))
452     {
453       if (x >= (1 << 28))
454         *dp++ = (x >> 28) | 128;
455       if (x >= (1 << 21))
456         *dp++ = (x >> 21) | 128;
457       *dp++ = (x >> 14) | 128;
458     }
459   if (x >= (1 << 7))
460     *dp++ = (x >> 7) | 128;
461   *dp++ = x & 127;
462   data->incoredatafree -= dp - (data->incoredata + data->incoredatalen);
463   data->incoredatalen = dp - data->incoredata;
464 }
465
466 static void
467 incore_add_u32(Repodata *data, unsigned int x)
468 {
469   unsigned char *dp;
470   /* make sure we have at least 4 bytes free */
471   if (data->incoredatafree < 4)
472     {
473       data->incoredata = sat_realloc(data->incoredata, data->incoredatalen + 1024);
474       data->incoredatafree = 1024;
475     }
476   dp = data->incoredata + data->incoredatalen;
477   *dp++ = x >> 24;
478   *dp++ = x >> 16;
479   *dp++ = x >> 8;
480   *dp++ = x;
481   data->incoredatafree -= 4;
482   data->incoredatalen += 4;
483 }
484
485 static void
486 incore_add_u8(Repodata *data, unsigned int x)
487 {
488   unsigned char *dp;
489   /* make sure we have at least 1 byte free */
490   if (data->incoredatafree < 1)
491     {
492       data->incoredata = sat_realloc(data->incoredata, data->incoredatalen + 1024);
493       data->incoredatafree = 1024;
494     }
495   dp = data->incoredata + data->incoredatalen;
496   *dp++ = x;
497   data->incoredatafree--;
498   data->incoredatalen++;
499 }
500
501
502
503 // ----------------------------------------------
504
505
506 /*
507  * read repo from .solv file
508  *  and add it to pool
509  */
510
511 static int
512 repo_add_solv_parent(Repo *repo, FILE *fp, Repodata *parent)
513 {
514   Pool *pool = repo->pool;
515   int i, l;
516   unsigned int numid, numrel, numdir, numsolv;
517   unsigned int numkeys, numschemata, numinfo;
518 #if 0
519   Attrstore *embedded_store = 0;
520 #endif
521
522   Offset sizeid;
523   Offset *str;                         /* map Id -> Offset into string space */
524   char *strsp;                         /* repo string space */
525   char *sp;                            /* pointer into string space */
526   Id *idmap;                           /* map of repo Ids to pool Ids */
527   Id id;
528   unsigned int hashmask, h;
529   int hh;
530   Id *hashtbl;
531   Id name, evr, did;
532   int flags;
533   Reldep *ran;
534   unsigned int size_idarray;
535   Id *idarraydatap, *idarraydataend;
536   Offset ido;
537   Solvable *s;
538   unsigned int solvflags;
539   unsigned int solvversion;
540   Repokey *keys;
541   Id *schemadata, *schemadatap, *schemadataend;
542   Id *schemata, key;
543   int have_xdata;
544
545   struct _Stringpool *spool;
546
547   Repodata data;
548
549   memset(&data, 0, sizeof(data));
550   data.repo = repo;
551   data.fp = fp;
552
553   mypool = pool;
554
555   if (read_u32(&data) != ('S' << 24 | 'O' << 16 | 'L' << 8 | 'V'))
556     {
557       pool_debug(pool, SAT_ERROR, "not a SOLV file\n");
558       return SOLV_ERROR_NOT_SOLV;
559     }
560   solvversion = read_u32(&data);
561   switch (solvversion)
562     {
563       case SOLV_VERSION_1:
564       case SOLV_VERSION_2:
565       case SOLV_VERSION_3:
566       case SOLV_VERSION_4:
567       case SOLV_VERSION_5:
568       case SOLV_VERSION_6:
569         break;
570       default:
571         pool_debug(pool, SAT_ERROR, "unsupported SOLV version\n");
572         return SOLV_ERROR_UNSUPPORTED;
573     }
574
575   pool_freeidhashes(pool);
576
577   numid = read_u32(&data);
578   numrel = read_u32(&data);
579   if (solvversion >= SOLV_VERSION_4)
580     numdir = read_u32(&data);
581   else
582     numdir = 0;
583   numsolv = read_u32(&data);
584   numkeys = read_u32(&data);
585   numschemata = read_u32(&data);
586   numinfo = read_u32(&data);
587   solvflags = read_u32(&data);
588
589   if (solvversion < SOLV_VERSION_5)
590     numschemata++;
591
592   if (numdir && numdir < 2)
593     {
594       pool_debug(pool, SAT_ERROR, "bad number of dirs\n");
595       return SOLV_ERROR_CORRUPT;
596     }
597   if (numinfo && solvversion < SOLV_VERSION_3)
598     {
599       pool_debug(pool, SAT_ERROR, "unsupported SOLV format (has info)\n");
600       return SOLV_ERROR_UNSUPPORTED;
601     }
602
603   if (parent)
604     {
605       if (numrel)
606         {
607           pool_debug(pool, SAT_ERROR, "relations are forbidden in a store\n");
608           return SOLV_ERROR_CORRUPT;
609         }
610       if (parent->end - parent->start != numsolv)
611         {
612           pool_debug(pool, SAT_ERROR, "unequal number of solvables in a store\n");
613           return SOLV_ERROR_CORRUPT;
614         }
615       if (numinfo)
616         {
617           pool_debug(pool, SAT_ERROR, "info blocks are forbidden in a store\n");
618           return SOLV_ERROR_CORRUPT;
619         }
620     }
621
622   /*******  Part 1: string IDs  *****************************************/
623
624   sizeid = read_u32(&data);            /* size of string+Id space */
625
626   /*
627    * read strings and Ids
628    * 
629    */
630
631   
632   /*
633    * alloc buffers
634    */
635
636   if (!parent)
637     spool = &pool->ss;
638   else
639     {
640       data.localpool = 1;
641       spool = &data.spool;
642       spool->stringspace = sat_malloc(7);
643       strcpy(spool->stringspace, "<NULL>");
644       spool->sstrings = 7;
645       spool->nstrings = 0;
646     }
647
648   /* alloc string buffer */
649   spool->stringspace = sat_realloc(spool->stringspace, spool->sstrings + sizeid + 1);
650   /* alloc string offsets (Id -> Offset into string space) */
651   spool->strings = sat_realloc2(spool->strings, spool->nstrings + numid, sizeof(Offset));
652
653   strsp = spool->stringspace;
654   str = spool->strings;                /* array of offsets into strsp, indexed by Id */
655
656   /* point to _BEHIND_ already allocated string/Id space */
657   strsp += spool->sstrings;
658
659
660   /*
661    * read new repo at end of pool
662    */
663   
664   if ((solvflags & SOLV_FLAG_PREFIX_POOL) == 0)
665     {
666       if (sizeid && fread(strsp, sizeid, 1, fp) != 1)
667         {
668           pool_debug(pool, SAT_ERROR, "read error while reading strings\n");
669           return SOLV_ERROR_EOF;
670         }
671     }
672   else
673     {
674       unsigned int pfsize = read_u32(&data);
675       char *prefix = sat_malloc(pfsize);
676       char *pp = prefix;
677       char *old_str = 0;
678       char *dest = strsp;
679       if (pfsize && fread(prefix, pfsize, 1, fp) != 1)
680         {
681           pool_debug(pool, SAT_ERROR, "read error while reading strings\n");
682           sat_free(prefix);
683           return SOLV_ERROR_EOF;
684         }
685       for (i = 1; i < numid; i++)
686         {
687           int same = (unsigned char)*pp++;
688           size_t len = strlen (pp) + 1;
689           if (same)
690             memcpy(dest, old_str, same);
691           memcpy(dest + same, pp, len);
692           pp += len;
693           old_str = dest;
694           dest += same + len;
695         }
696       sat_free(prefix);
697     }
698   strsp[sizeid] = 0;                   /* make string space \0 terminated */
699   sp = strsp;
700
701   /* make sure first entry is "" for a store */
702   if (parent)
703     {
704       /* no shared pool, thus no idmap and no unification */
705       idmap = 0;
706       if (0 && *sp)
707         {
708           pool_debug(pool, SAT_ERROR, "store strings don't start with ''\n");
709           return SOLV_ERROR_CORRUPT;
710         }
711       spool->nstrings = numid;
712       str[0] = 0;
713       for (i = 1; i < spool->nstrings; i++)
714         {
715           if (sp >= strsp + sizeid)
716             {
717               pool_debug(pool, SAT_ERROR, "not enough strings\n");
718               return SOLV_ERROR_OVERFLOW;
719             }
720           str[i] = sp - spool->stringspace;
721           sp += strlen(sp) + 1;
722         }
723       spool->sstrings = sp - spool->stringspace;
724     }
725   else
726     {
727
728       /* alloc id map for name and rel Ids. this maps ids in the solv files
729        * to the ids in our pool */
730       idmap = sat_calloc(numid + numrel, sizeof(Id));
731
732       /*
733        * build hashes for all read strings
734        * 
735        */
736       
737       hashmask = mkmask(spool->nstrings + numid);
738
739 #if 0
740       POOL_DEBUG(SAT_DEBUG_STATS, "read %d strings\n", numid);
741       POOL_DEBUG(SAT_DEBUG_STATS, "string hash buckets: %d\n", hashmask + 1);
742 #endif
743
744       /*
745        * create hashtable with strings already in pool
746        */
747
748       hashtbl = sat_calloc(hashmask + 1, sizeof(Id));
749       for (i = 1; i < spool->nstrings; i++)  /* leave out our dummy zero id */
750         {
751           h = strhash(spool->stringspace + spool->strings[i]) & hashmask;
752           hh = HASHCHAIN_START;
753           while (hashtbl[h])
754             h = HASHCHAIN_NEXT(h, hh, hashmask);
755           hashtbl[h] = i;
756         }
757
758       /*
759        * run over string space, calculate offsets
760        * 
761        * build id map (maps solv Id -> pool Id)
762        */
763       
764       for (i = 1; i < numid; i++)
765         {
766           if (sp >= strsp + sizeid)
767             {
768               sat_free(hashtbl);
769               sat_free(idmap);
770               pool_debug(pool, SAT_ERROR, "not enough strings\n");
771               return SOLV_ERROR_OVERFLOW;
772             }
773           if (!*sp)                            /* empty string */
774             {
775               idmap[i] = ID_EMPTY;
776               sp++;
777               continue;
778             }
779
780           /* find hash slot */
781           h = strhash(sp) & hashmask;
782           hh = HASHCHAIN_START;
783           for (;;)
784             {
785               id = hashtbl[h];
786               if (id == 0)
787                 break;
788               if (!strcmp(spool->stringspace + spool->strings[id], sp))
789                 break;                 /* existing string */
790               h = HASHCHAIN_NEXT(h, hh, hashmask);
791             }
792
793           /* length == offset to next string */
794           l = strlen(sp) + 1;
795           if (id == ID_NULL)           /* end of hash chain -> new string */
796             {
797               id = spool->nstrings++;
798               hashtbl[h] = id;
799               str[id] = spool->sstrings;    /* save Offset */
800               if (sp != spool->stringspace + spool->sstrings)   /* not at end-of-buffer */
801                 memmove(spool->stringspace + spool->sstrings, sp, l);   /* append to pool buffer */
802               spool->sstrings += l;
803             }
804           idmap[i] = id;                       /* repo relative -> pool relative */
805           sp += l;                             /* next string */
806         }
807       sat_free(hashtbl);
808     }
809   pool_shrink_strings(pool);           /* vacuum */
810
811   
812   /*******  Part 2: Relation IDs  ***************************************/
813
814   /*
815    * read RelDeps
816    * 
817    */
818   
819   if (numrel)
820     {
821       /* extend rels */
822       pool->rels = sat_realloc2(pool->rels, pool->nrels + numrel, sizeof(Reldep));
823       ran = pool->rels;
824
825       hashmask = mkmask(pool->nrels + numrel);
826 #if 0
827       POOL_DEBUG(SAT_DEBUG_STATS, "read %d rels\n", numrel);
828       POOL_DEBUG(SAT_DEBUG_STATS, "rel hash buckets: %d\n", hashmask + 1);
829 #endif
830       /*
831        * prep hash table with already existing RelDeps
832        */
833       
834       hashtbl = sat_calloc(hashmask + 1, sizeof(Id));
835       for (i = 1; i < pool->nrels; i++)
836         {
837           h = relhash(ran[i].name, ran[i].evr, ran[i].flags) & hashmask;
838           hh = HASHCHAIN_START;
839           while (hashtbl[h])
840             h = HASHCHAIN_NEXT(h, hh, hashmask);
841           hashtbl[h] = i;
842         }
843
844       /*
845        * read RelDeps from repo
846        */
847       
848       for (i = 0; i < numrel; i++)
849         {
850           name = read_id(&data, i + numid);     /* read (repo relative) Ids */
851           evr = read_id(&data, i + numid);
852           flags = read_u8(&data);
853           name = idmap[name];           /* map to (pool relative) Ids */
854           evr = idmap[evr];
855           h = relhash(name, evr, flags) & hashmask;
856           hh = HASHCHAIN_START;
857           for (;;)
858             {
859               id = hashtbl[h];
860               if (id == ID_NULL)        /* end of hash chain */
861                 break;
862               if (ran[id].name == name && ran[id].evr == evr && ran[id].flags == flags)
863                 break;
864               h = HASHCHAIN_NEXT(h, hh, hashmask);
865             }
866           if (id == ID_NULL)            /* new RelDep */
867             {
868               id = pool->nrels++;
869               hashtbl[h] = id;
870               ran[id].name = name;
871               ran[id].evr = evr;
872               ran[id].flags = flags;
873             }
874           idmap[i + numid] = MAKERELDEP(id);   /* fill Id map */
875         }
876       sat_free(hashtbl);
877       pool_shrink_rels(pool);           /* vacuum */
878     }
879
880
881   /*******  Part 3: Dirs  ***********************************************/
882   if (numdir)
883     {
884       data.dirpool.dirs = sat_malloc2(numdir, sizeof(Id));
885       data.dirpool.ndirs = numdir;
886       data.dirpool.dirs[0] = 0;         /* dir 0: virtual root */
887       data.dirpool.dirs[1] = 1;         /* dir 1: / */
888       for (i = 2; i < numdir; i++)
889         {
890           id = read_id(&data, i + numid);
891           if (id >= numid)
892             data.dirpool.dirs[i] = -(id - numid);
893           else if (idmap)
894             data.dirpool.dirs[i] = idmap[id];
895           else
896             data.dirpool.dirs[i] = id;
897         }
898     }
899
900   /*******  Part 4: Keys  ***********************************************/
901
902   keys = sat_calloc(numkeys, sizeof(*keys));
903   /* keys start at 1 */
904   for (i = 1; i < numkeys; i++)
905     {
906       id = read_id(&data, numid);
907       if (idmap)
908         id = idmap[id];
909       else if (parent)
910         id = str2id(pool, stringpool_id2str(spool, id), 1);
911       keys[i].name = id;
912       keys[i].type = read_id(&data, 0);
913       keys[i].size = read_id(&data, 0);
914 #if 0
915       fprintf (stderr, "key %d %s %d %d\n", i, id2str(pool,id), keys[i].type,
916                keys[i].size);
917 #endif
918       if (solvversion >= SOLV_VERSION_5)
919         {
920           keys[i].storage = read_id(&data, 0);
921           continue;
922         }
923       keys[i].storage = KEY_STORAGE_DROPPED;
924       if (parent)
925         {
926           keys[i].storage = KEY_STORAGE_INCORE;
927           continue;
928         }
929       switch (keys[i].type)
930         {
931         case TYPE_VOID:
932         case TYPE_CONSTANT:
933         case TYPE_STR:
934         case TYPE_NUM:
935         case TYPE_DIRNUMNUMARRAY:
936           keys[i].storage = KEY_STORAGE_INCORE;
937           break;
938         case TYPE_ID:
939           switch(id)
940             {
941             case SOLVABLE_NAME:
942             case SOLVABLE_ARCH:
943             case SOLVABLE_EVR:
944             case SOLVABLE_VENDOR:
945               keys[i].storage = KEY_STORAGE_SOLVABLE;
946               break;
947             default:
948               keys[i].storage = KEY_STORAGE_INCORE;
949               break;
950             }
951           break;
952         case TYPE_IDARRAY:
953         case TYPE_REL_IDARRAY:
954           if (id >= INTERESTED_START && id <= INTERESTED_END)
955             keys[i].storage = KEY_STORAGE_SOLVABLE;
956           else
957             keys[i].storage = KEY_STORAGE_INCORE;
958           break;
959         case TYPE_U32:
960           if (id == RPM_RPMDBID)
961             keys[i].storage = KEY_STORAGE_SOLVABLE;
962           else
963             keys[i].storage = KEY_STORAGE_INCORE;
964           break;
965         default:
966           break;
967         }
968     }
969
970   have_xdata = parent ? 1 : 0;
971   for (i = 1; i < numkeys; i++)
972     if (keys[i].storage == KEY_STORAGE_INCORE || keys[i].storage == KEY_STORAGE_VERTICAL_OFFSET)
973       have_xdata = 1;
974
975   data.keys = keys;
976   data.nkeys = numkeys;
977
978   /*******  Part 5: Schemata ********************************************/
979   
980   id = read_id(&data, 0);
981   schemadata = sat_calloc(id + 1, sizeof(Id));
982   schemadatap = schemadata + 1;
983   schemadataend = schemadatap + id;
984   schemata = sat_calloc(numschemata, sizeof(Id));
985   for (i = 1; i < numschemata; i++)
986     {
987       schemata[i] = schemadatap - schemadata;
988       schemadatap = read_idarray(&data, numid, 0, schemadatap, schemadataend, 0);
989 #if 0
990       Id *sp = schemadata + schemata[i];
991       fprintf (stderr, "schema %d:", i);
992       for (; *sp; sp++)
993         fprintf (stderr, " %d", *sp);
994       fprintf (stderr, "\n");
995 #endif
996     }
997   data.schemata = schemata;
998   data.nschemata = numschemata;
999   data.schemadata = schemadata;
1000   data.schemadatalen = schemadataend - data.schemadata;
1001
1002
1003   /*******  Part 6: Info  ***********************************************/
1004   for (i = 0; i < numinfo; i++)
1005     {
1006       /* for now we're just interested in data that starts with
1007        * the repodata_external id
1008        */
1009       Id *keyp;
1010       id = read_id(&data, numschemata);
1011       if (solvversion < SOLV_VERSION_5)
1012         id++;
1013       keyp = schemadata + schemata[id];
1014       key = *keyp;
1015       if (keys[key].name == REPODATA_EXTERNAL && keys[key].type == TYPE_VOID)
1016         {
1017           /* external data for some ids */
1018           parse_repodata(&data, keyp, keys, idmap, numid, numrel, repo);
1019         }
1020       else
1021         skip_schema(&data, keyp, keys, numid, numrel);
1022     }
1023
1024
1025   /*******  Part 7: packed sizes (optional)  ****************************/
1026   char *exists = 0;
1027   if ((solvflags & SOLV_FLAG_PACKEDSIZES) != 0)
1028     {
1029       exists = sat_malloc (numsolv);
1030       for (i = 0; i < numsolv; i++)
1031         exists[i] = read_id(&data, 0) != 0;
1032     }
1033
1034
1035   /*******  Part 8: item data *******************************************/
1036
1037   /* calculate idarray size */
1038   size_idarray = 0;
1039   for (i = 1; i < numkeys; i++)
1040     {
1041       id = keys[i].name;
1042       if ((keys[i].type == TYPE_IDARRAY || keys[i].type == TYPE_REL_IDARRAY)
1043           && id >= INTERESTED_START && id <= INTERESTED_END)
1044         size_idarray += keys[i].size;
1045     }
1046
1047   /* allocate needed space in repo */
1048   if (size_idarray)
1049     {
1050       repo_reserve_ids(repo, 0, size_idarray);
1051       idarraydatap = repo->idarraydata + repo->idarraysize;
1052       repo->idarraysize += size_idarray;
1053       idarraydataend = idarraydatap + size_idarray;
1054       repo->lastoff = 0;
1055     }
1056   else
1057     {
1058       idarraydatap = 0;
1059       idarraydataend = 0;
1060     }
1061
1062   /* read solvables */
1063   if (parent)
1064     {
1065       data.start = parent->start;
1066       data.end = parent->end;
1067       s = pool_id2solvable(pool, data.start);
1068     }
1069   else if (numsolv)
1070     {
1071       s = pool_id2solvable(pool, repo_add_solvable_block(repo, numsolv));
1072       /* store start and end of our id block */
1073       data.start = s - pool->solvables;
1074       data.end = data.start + numsolv;
1075       /* In case we have subfiles, make them refer to our part of the 
1076          repository now.  */
1077       for (i = 0; i < repo->nrepodata; i++)
1078         {
1079           repo->repodata[i].start = data.start;
1080           repo->repodata[i].end = data.end;
1081         }
1082     }
1083   else
1084     s = 0;
1085
1086   if (have_xdata)
1087     data.incoreoffset = sat_calloc(numsolv, sizeof(Id));
1088   for (i = 0; i < numsolv; i++, s++)
1089     {
1090       Id *keyp;
1091       if (data.error)
1092         break;
1093       if (exists && !exists[i])
1094         continue;
1095       id = read_id(&data, numschemata);
1096       if (solvversion < SOLV_VERSION_5)
1097         id++;
1098       if (have_xdata)
1099         {
1100           data.incoreoffset[i] = data.incoredatalen;
1101           incore_add_id(&data, id);
1102         }
1103       keyp = schemadata + schemata[id];
1104       while ((key = *keyp++) != 0)
1105         {
1106           id = keys[key].name;
1107 #if 0
1108 fprintf(stderr, "solv %d name %d type %d class %d\n", i, id, keys[key].type, keys[key].storage);
1109 #endif
1110           if (keys[key].storage == KEY_STORAGE_VERTICAL_OFFSET)
1111             {
1112               /* copy offset/length into incore */
1113               did = read_id(&data, 0);
1114               incore_add_id(&data, did);
1115               did = read_id(&data, 0);
1116               incore_add_id(&data, did);
1117               continue;
1118             }
1119           switch (keys[key].type)
1120             {
1121             case TYPE_VOID:
1122             case TYPE_CONSTANT:
1123               break;
1124             case TYPE_ID:
1125               did = read_id(&data, numid + numrel);
1126               if (idmap)
1127                 did = idmap[did];
1128               if (id == SOLVABLE_NAME) {
1129                 s->name = did;
1130                 if (s->name) {
1131                   /* Yeah, thats ugly. Better store kind as u8 in .solv files */
1132                   const char *name = id2str(pool, s->name);
1133                   const char *colon = strchr(name, ':');
1134                   if (colon)
1135                     s->kind = colon - name + 1;
1136                 }
1137               }
1138               else if (id == SOLVABLE_ARCH)
1139                 s->arch = did;
1140               else if (id == SOLVABLE_EVR)
1141                 s->evr = did;
1142               else if (id == SOLVABLE_VENDOR)
1143                 s->vendor = did;
1144               else if (keys[key].storage == KEY_STORAGE_INCORE)
1145                 incore_add_id(&data, did);
1146 #if 0
1147               POOL_DEBUG(SAT_DEBUG_STATS, "%s -> %s\n", id2str(pool, id), id2str(pool, did));
1148 #endif
1149               break;
1150             case TYPE_NUM:
1151               did = read_id(&data, 0);
1152               if (keys[key].storage == KEY_STORAGE_INCORE)
1153                 incore_add_id(&data, did);
1154 #if 0
1155               POOL_DEBUG(SAT_DEBUG_STATS, "%s -> %d\n", id2str(pool, id), did);
1156 #endif
1157               break;
1158             case TYPE_U32:
1159               h = read_u32(&data);
1160 #if 0
1161               POOL_DEBUG(SAT_DEBUG_STATS, "%s -> %u\n", id2str(pool, id), h);
1162 #endif
1163               if (id == RPM_RPMDBID)
1164                 {
1165                   if (!repo->rpmdbid)
1166                     repo->rpmdbid = sat_calloc(numsolv, sizeof(Id));
1167                   repo->rpmdbid[i] = h;
1168                 }
1169               else if (keys[key].storage == KEY_STORAGE_INCORE)
1170                 incore_add_u32(&data, h);
1171               break;
1172             case TYPE_STR:
1173               if (keys[key].storage == KEY_STORAGE_INCORE)
1174                 {
1175                   while ((h = read_u8(&data)) != 0)
1176                     incore_add_u8(&data, h);
1177                   incore_add_u8(&data, 0);
1178                 }
1179               else
1180                 {
1181                   while (read_u8(&data) != 0)
1182                     ;
1183                 }
1184               break;
1185             case TYPE_IDARRAY:
1186             case TYPE_REL_IDARRAY:
1187               if (id < INTERESTED_START || id > INTERESTED_END)
1188                 {
1189                   if (keys[key].storage == KEY_STORAGE_INCORE)
1190                     {
1191                       if (idmap)
1192                         {
1193                           Id old = 0, rel = keys[key].type == TYPE_REL_IDARRAY ? SOLVABLE_PREREQMARKER : 0;
1194                           do
1195                             {
1196                               did = read_id(&data, 0);
1197                               h = did & 0x40;
1198                               did = (did & 0x3f) | ((did >> 1) & ~0x3f);
1199                               if (rel)
1200                                 {
1201                                   if (did == 0)
1202                                     {
1203                                       did = rel;
1204                                       old = 0;
1205                                     }
1206                                   else
1207                                     {
1208                                       did += old;
1209                                       old = did;
1210                                     }
1211                                 }
1212                               if (did >= numid + numrel)
1213                                 abort();
1214                               did = idmap[did];
1215                               did = ((did & ~0x3f) << 1) | h;
1216                               incore_add_id(&data, did);
1217                             }
1218                           while (h);
1219                         }
1220                       else
1221                         {
1222                           while (((h = read_u8(&data)) & 0xc0) != 0)
1223                             incore_add_u8(&data, h);
1224                           break;
1225                         }
1226                     }
1227                   else
1228                     {
1229                       while ((read_u8(&data) & 0xc0) != 0)
1230                         ;
1231                       break;
1232                     }
1233                   break;
1234                 }
1235               ido = idarraydatap - repo->idarraydata;
1236               idarraydatap = read_idarray(&data, numid + numrel, idmap, idarraydatap, idarraydataend, keys[key].type == TYPE_REL_IDARRAY);
1237               if (id == SOLVABLE_PROVIDES)
1238                 s->provides = ido;
1239               else if (id == SOLVABLE_OBSOLETES)
1240                 s->obsoletes = ido;
1241               else if (id == SOLVABLE_CONFLICTS)
1242                 s->conflicts = ido;
1243               else if (id == SOLVABLE_REQUIRES)
1244                 s->requires = ido;
1245               else if (id == SOLVABLE_RECOMMENDS)
1246                 s->recommends= ido;
1247               else if (id == SOLVABLE_SUPPLEMENTS)
1248                 s->supplements = ido;
1249               else if (id == SOLVABLE_SUGGESTS)
1250                 s->suggests = ido;
1251               else if (id == SOLVABLE_ENHANCES)
1252                 s->enhances = ido;
1253               else if (id == SOLVABLE_FRESHENS)
1254                 s->freshens = ido;
1255 #if 0
1256               POOL_DEBUG(SAT_DEBUG_STATS, "%s ->\n", id2str(pool, id));
1257               for (; repo->idarraydata[ido]; ido++)
1258                 POOL_DEBUG(SAT_DEBUG_STATS,"  %s\n", dep2str(pool, repo->idarraydata[ido]));
1259 #endif
1260               break;
1261 #if 0
1262             case TYPE_VOID:
1263
1264             case TYPE_ATTR_INT:
1265             case TYPE_ATTR_CHUNK:
1266             case TYPE_ATTR_STRING:
1267             case TYPE_ATTR_INTLIST:
1268             case TYPE_ATTR_LOCALIDS:
1269               if (!embedded_store)
1270                 embedded_store = new_store (pool);
1271               add_attr_from_file (embedded_store, i, id, keys[key].type, idmap, numid, &data, keys[key].size);
1272               break;
1273 #endif
1274             case TYPE_DIRNUMNUMARRAY:
1275               for (;;)
1276                 {
1277                   Id num, num2;
1278                   did = read_id(&data, numdir);
1279                   num = read_id(&data, 0);
1280                   num2 = read_id(&data, 0);
1281                   if (keys[key].storage == KEY_STORAGE_INCORE)
1282                     {
1283 #if 0
1284                       POOL_DEBUG(SAT_DEBUG_STATS, "%s -> %d %d %d\n", id2str(pool, id), did, num, num2);
1285 #endif
1286                       incore_add_id(&data, did);
1287                       incore_add_id(&data, num);
1288                       incore_add_id(&data, num2);
1289                     }
1290                   if (!(num2 & 0x40))
1291                     break;
1292                 }
1293               break;
1294         
1295             default:
1296               skip_item(&data, keys[key].type, numid, numrel);
1297             }
1298         }
1299     }
1300
1301   if (data.error)
1302     {
1303       /* free solvables */
1304       repo_free_solvable_block(repo, data.start, data.end - data.start, 1);
1305       /* free id array */
1306       repo->idarraysize -= size_idarray;
1307       /* free incore data */
1308       data.incoredata = sat_free(data.incoredata);
1309       data.incoredatalen = data.incoredatafree = 0;
1310     }
1311
1312   if (data.incoredatafree)
1313     {
1314       /* shrink excess size */
1315       data.incoredata = sat_realloc(data.incoredata, data.incoredatalen);
1316       data.incoredatafree = 0;
1317     }
1318
1319   for (i = 1; i < numkeys; i++)
1320     if (keys[i].storage == KEY_STORAGE_VERTICAL_OFFSET)
1321       break;
1322   if (i < numkeys && !data.error)
1323     {
1324       Id fileoffset = 0;
1325       unsigned int pagesize;
1326       
1327       /* we have vertical data, make it available */
1328       data.verticaloffset = sat_calloc(numkeys, sizeof(Id));
1329       for (i = 1; i < numkeys; i++)
1330         if (keys[i].storage == KEY_STORAGE_VERTICAL_OFFSET)
1331           {
1332             data.verticaloffset[i] = fileoffset;
1333             fileoffset += keys[i].size;
1334           }
1335       data.lastverticaloffset = fileoffset;
1336       pagesize = read_u32(&data);
1337       repodata_read_or_setup_pages(&data, pagesize, fileoffset);
1338     }
1339   else
1340     {
1341       /* no longer needed */
1342       data.fp = 0;
1343     }
1344
1345   if (parent)
1346     {
1347       /* we're a store */
1348       sat_free(parent->schemata);
1349       sat_free(parent->schemadata);
1350       sat_free(parent->keys);
1351       *parent = data;
1352     }
1353   else if (data.incoredatalen || data.fp)
1354     {
1355       /* we got some data, make it available */
1356       repo->repodata = sat_realloc2(repo->repodata, repo->nrepodata + 1, sizeof(data));
1357       repo->repodata[repo->nrepodata++] = data;
1358     }
1359   else
1360     {
1361       /* discard data */
1362       sat_free(data.dirpool.dirs);
1363       sat_free(data.incoreoffset);
1364       sat_free(schemata);
1365       sat_free(schemadata);
1366       sat_free(keys);
1367     }
1368
1369   sat_free(exists);
1370 #if 0
1371   if (embedded_store)
1372     {
1373       attr_store_pack (embedded_store);
1374       /* If we have any attributes we also have pages.  */
1375       read_or_setup_pages (fp, embedded_store);
1376       /* The NULL name here means embedded attributes.  */
1377       repo_add_attrstore (repo, embedded_store, NULL);
1378     }
1379 #endif
1380   sat_free(idmap);
1381   mypool = 0;
1382   return data.error;
1383 }
1384
1385 int
1386 repo_add_solv(Repo *repo, FILE *fp)
1387 {
1388   return repo_add_solv_parent(repo, fp, 0);
1389 }
1390
1391 static void
1392 repodata_load_solv(Repodata *data)
1393 {
1394   FILE *fp;
1395 #if 1
1396   Pool *pool = data->repo->pool;
1397   if (!pool->loadcallback)
1398     {   
1399       data->state = REPODATA_ERROR;
1400       return;
1401     }   
1402   fp = pool->loadcallback(pool, data, pool->loadcallbackdata);
1403 #else
1404   fp = 0;
1405 #endif
1406
1407   if (!fp)
1408     {   
1409       data->state = REPODATA_ERROR;
1410       return;
1411     }   
1412   if (repo_add_solv_parent(data->repo, fp, data))
1413     data->state = REPODATA_ERROR;
1414   else
1415     data->state = REPODATA_AVAILABLE;
1416 }