make sure we have at least id 0 and 1 in a local pool, also call the correct shrink...
[platform/upstream/libsolv.git] / src / repo_solv.c
1 /*
2  * Copyright (c) 2007, Novell Inc.
3  *
4  * This program is licensed under the BSD license, read LICENSE.BSD
5  * for further information
6  */
7
8 /*
9  * repo_solv.c
10  * 
11  * Add a repo in solv format
12  * 
13  */
14
15
16
17 #include <stdio.h>
18 #include <stdlib.h>
19 #include <unistd.h>
20 #include <string.h>
21
22 #include "repo_solv.h"
23 #include "util.h"
24
25 #include "repopack.h"
26 #include "repopage.h"
27
28 #include "poolid_private.h"     /* WHATPROVIDES_BLOCK */
29
30 #define INTERESTED_START        SOLVABLE_NAME
31 #define INTERESTED_END          SOLVABLE_ENHANCES
32
33 #define SOLV_ERROR_NOT_SOLV     1
34 #define SOLV_ERROR_UNSUPPORTED  2
35 #define SOLV_ERROR_EOF          3
36 #define SOLV_ERROR_ID_RANGE     4
37 #define SOLV_ERROR_OVERFLOW     5
38 #define SOLV_ERROR_CORRUPT      6
39
40
41
42 /*******************************************************************************
43  * functions to extract data from a file handle
44  */
45
46 /*
47  * read u32
48  */
49
50 static unsigned int
51 read_u32(Repodata *data)
52 {
53   int c, i;
54   unsigned int x = 0;
55
56   if (data->error)
57     return 0;
58   for (i = 0; i < 4; i++)
59     {
60       c = getc(data->fp);
61       if (c == EOF)
62         {
63           data->error = pool_error(data->repo->pool, SOLV_ERROR_EOF, "unexpected EOF");
64           return 0;
65         }
66       x = (x << 8) | c;
67     }
68   return x;
69 }
70
71
72 /*
73  * read u8
74  */
75
76 static unsigned int
77 read_u8(Repodata *data)
78 {
79   int c;
80
81   if (data->error)
82     return 0;
83   c = getc(data->fp);
84   if (c == EOF)
85     {
86       data->error = pool_error(data->repo->pool, SOLV_ERROR_EOF, "unexpected EOF");
87       return 0;
88     }
89   return c;
90 }
91
92
93 /*
94  * read Id
95  */
96
97 static Id
98 read_id(Repodata *data, Id max)
99 {
100   unsigned int x = 0;
101   int c, i;
102
103   if (data->error)
104     return 0;
105   for (i = 0; i < 5; i++)
106     {
107       c = getc(data->fp);
108       if (c == EOF)
109         {
110           data->error = pool_error(data->repo->pool, SOLV_ERROR_EOF, "unexpected EOF");
111           return 0;
112         }
113       if (!(c & 128))
114         {
115           x = (x << 7) | c;
116           if (max && x >= max)
117             {
118               data->error = pool_error(data->repo->pool, SOLV_ERROR_ID_RANGE, "read_id: id too large (%u/%u)", x, max);
119               return 0;
120             }
121           return x;
122         }
123       x = (x << 7) ^ c ^ 128;
124     }
125   data->error = pool_error(data->repo->pool, SOLV_ERROR_CORRUPT, "read_id: id too long");
126   return 0;
127 }
128
129
130 static Id *
131 read_idarray(Repodata *data, Id max, Id *map, Id *store, Id *end)
132 {
133   unsigned int x = 0;
134   int c;
135
136   if (data->error)
137     return 0;
138   for (;;)
139     {
140       c = getc(data->fp);
141       if (c == EOF)
142         {
143           data->error = pool_error(data->repo->pool, SOLV_ERROR_EOF, "unexpected EOF");
144           return 0;
145         }
146       if ((c & 128) != 0)
147         {
148           x = (x << 7) ^ c ^ 128;
149           continue;
150         }
151       x = (x << 6) | (c & 63);
152       if (max && x >= max)
153         {
154           data->error = pool_error(data->repo->pool, SOLV_ERROR_ID_RANGE, "read_idarray: id too large (%u/%u)", x, max);
155           return 0;
156         }
157       if (map)
158         x = map[x];
159       if (store == end)
160         {
161           data->error = pool_error(data->repo->pool, SOLV_ERROR_OVERFLOW, "read_idarray: array overflow");
162           return 0;
163         }
164       *store++ = x;
165       if ((c & 64) == 0)
166         {
167           if (x == 0)   /* already have trailing zero? */
168             return store;
169           if (store == end)
170             {
171               data->error = pool_error(data->repo->pool, SOLV_ERROR_OVERFLOW, "read_idarray: array overflow");
172               return 0;
173             }
174           *store++ = 0;
175           return store;
176         }
177       x = 0;
178     }
179 }
180
181
182 /*******************************************************************************
183  * functions to extract data from memory
184  */
185
186 /*
187  * read array of Ids
188  */
189
190 static inline unsigned char *
191 data_read_id_max(unsigned char *dp, Id *ret, Id *map, int max, Repodata *data)
192 {
193   Id x;
194   dp = data_read_id(dp, &x);
195   if (x < 0 || (max && x >= max))
196     {
197       data->error = pool_error(data->repo->pool, SOLV_ERROR_ID_RANGE, "data_read_id_max: id too large (%u/%u)", x, max);
198       x = 0;
199     }
200   *ret = map ? map[x] : x;
201   return dp;
202 }
203
204 static unsigned char *
205 data_read_idarray(unsigned char *dp, Id **storep, Id *map, int max, Repodata *data)
206 {
207   Id *store = *storep;
208   unsigned int x = 0;
209   int c;
210
211   for (;;)
212     {
213       c = *dp++;
214       if ((c & 128) != 0)
215         {
216           x = (x << 7) ^ c ^ 128;
217           continue;
218         }
219       x = (x << 6) | (c & 63);
220       if (max && x >= max)
221         {
222           data->error = pool_error(data->repo->pool, SOLV_ERROR_ID_RANGE, "data_read_idarray: id too large (%u/%u)", x, max);
223           data->error = SOLV_ERROR_ID_RANGE;
224           break;
225         }
226       *store++ = x;
227       if ((c & 64) == 0)
228         break;
229       x = 0;
230     }
231   *store++ = 0;
232   *storep = store;
233   return dp;
234 }
235
236 static unsigned char *
237 data_read_rel_idarray(unsigned char *dp, Id **storep, Id *map, int max, Repodata *data, Id marker)
238 {
239   Id *store = *storep;
240   Id old = 0;
241   unsigned int x = 0;
242   int c;
243
244   for (;;)
245     {
246       c = *dp++;
247       if ((c & 128) != 0)
248         {
249           x = (x << 7) ^ c ^ 128;
250           continue;
251         }
252       x = (x << 6) | (c & 63);
253       if (x == 0)
254         {
255           if (!(c & 64))
256             break;
257           if (marker)
258             *store++ = marker;
259           old = 0;
260           continue;
261         }
262       x = old + (x - 1);
263       old = x;
264       if (max && x >= max)
265         {
266           data->error = pool_error(data->repo->pool, SOLV_ERROR_ID_RANGE, "data_read_rel_idarray: id too large (%u/%u)", x, max);
267           break;
268         }
269       *store++ = map ? map[x] : x;
270       if (!(c & 64))
271         break;
272       x = 0;
273     }
274   *store++ = 0;
275   *storep = store;
276   return dp;
277 }
278
279
280
281
282 /*******************************************************************************
283  * functions to add data to our incore memory space
284  */
285
286 #define INCORE_ADD_CHUNK 8192
287 #define DATA_READ_CHUNK 8192
288
289 static void
290 incore_add_id(Repodata *data, Id sx)
291 {
292   unsigned int x = (unsigned int)sx;
293   unsigned char *dp;
294   /* make sure we have at least 5 bytes free */
295   if (data->incoredatafree < 5)
296     {
297       data->incoredata = solv_realloc(data->incoredata, data->incoredatalen + INCORE_ADD_CHUNK);
298       data->incoredatafree = INCORE_ADD_CHUNK;
299     }
300   dp = data->incoredata + data->incoredatalen;
301   if (x >= (1 << 14))
302     {
303       if (x >= (1 << 28))
304         *dp++ = (x >> 28) | 128;
305       if (x >= (1 << 21))
306         *dp++ = (x >> 21) | 128;
307       *dp++ = (x >> 14) | 128;
308     }
309   if (x >= (1 << 7))
310     *dp++ = (x >> 7) | 128;
311   *dp++ = x & 127;
312   data->incoredatafree -= dp - (data->incoredata + data->incoredatalen);
313   data->incoredatalen = dp - data->incoredata;
314 }
315
316 static void
317 incore_add_sizek(Repodata *data, unsigned int sx)
318 {
319   if (sx < (1 << 22))
320     incore_add_id(data, (Id)(sx << 10));
321   else
322     {
323       if ((sx >> 25) != 0)
324         {
325           incore_add_id(data, (Id)(sx >> 25));
326           data->incoredata[data->incoredatalen - 1] |= 128;
327         }
328       incore_add_id(data, (Id)((sx << 10) | 0x80000000));
329       data->incoredata[data->incoredatalen - 5] = (sx >> 18) | 128;
330     }
331 }
332
333 static void
334 incore_add_ideof(Repodata *data, Id sx, int eof)
335 {
336   unsigned int x = (unsigned int)sx;
337   unsigned char *dp;
338   /* make sure we have at least 5 bytes free */
339   if (data->incoredatafree < 5)
340     {
341       data->incoredata = solv_realloc(data->incoredata, data->incoredatalen + INCORE_ADD_CHUNK);
342       data->incoredatafree = INCORE_ADD_CHUNK;
343     }
344   dp = data->incoredata + data->incoredatalen;
345   if (x >= (1 << 13))
346     {
347       if (x >= (1 << 27))
348         *dp++ = (x >> 27) | 128;
349       if (x >= (1 << 20))
350         *dp++ = (x >> 20) | 128;
351       *dp++ = (x >> 13) | 128;
352     }
353   if (x >= (1 << 6))
354     *dp++ = (x >> 6) | 128;
355   *dp++ = eof ? (x & 63) : (x & 63) | 64;
356   data->incoredatafree -= dp - (data->incoredata + data->incoredatalen);
357   data->incoredatalen = dp - data->incoredata;
358 }
359
360 static void
361 incore_add_blob(Repodata *data, unsigned char *buf, int len)
362 {
363   if (data->incoredatafree < len)
364     {
365       data->incoredata = solv_realloc(data->incoredata, data->incoredatalen + INCORE_ADD_CHUNK + len);
366       data->incoredatafree = INCORE_ADD_CHUNK + len;
367     }
368   memcpy(data->incoredata + data->incoredatalen, buf, len);
369   data->incoredatafree -= len;
370   data->incoredatalen += len;
371 }
372
373 static void
374 incore_map_idarray(Repodata *data, unsigned char *dp, Id *map, Id max)
375 {
376   /* We have to map the IDs, which might also change
377      the necessary number of bytes, so we can't just copy
378      over the blob and adjust it.  */
379   for (;;)
380     {
381       Id id;
382       int eof;
383       dp = data_read_ideof(dp, &id, &eof);
384       if (id < 0 || (max && id >= max))
385         {
386           data->error = pool_error(data->repo->pool, SOLV_ERROR_ID_RANGE, "incore_map_idarray: id too large (%u/%u)", id, max);
387           break;
388         }
389       id = map[id];
390       incore_add_ideof(data, id, eof);
391       if (eof)
392         break;
393     }
394 }
395
396 #if 0
397 static void
398 incore_add_u32(Repodata *data, unsigned int x)
399 {
400   unsigned char *dp;
401   /* make sure we have at least 4 bytes free */
402   if (data->incoredatafree < 4)
403     {
404       data->incoredata = solv_realloc(data->incoredata, data->incoredatalen + INCORE_ADD_CHUNK);
405       data->incoredatafree = INCORE_ADD_CHUNK;
406     }
407   dp = data->incoredata + data->incoredatalen;
408   *dp++ = x >> 24;
409   *dp++ = x >> 16;
410   *dp++ = x >> 8;
411   *dp++ = x;
412   data->incoredatafree -= 4;
413   data->incoredatalen += 4;
414 }
415
416 static void
417 incore_add_u8(Repodata *data, unsigned int x)
418 {
419   unsigned char *dp;
420   /* make sure we have at least 1 byte free */
421   if (data->incoredatafree < 1)
422     {
423       data->incoredata = solv_realloc(data->incoredata, data->incoredatalen + 1024);
424       data->incoredatafree = 1024;
425     }
426   dp = data->incoredata + data->incoredatalen;
427   *dp++ = x;
428   data->incoredatafree--;
429   data->incoredatalen++;
430 }
431 #endif
432
433
434 /*******************************************************************************
435  * our main function
436  */
437
438 /*
439  * read repo from .solv file and add it to pool
440  */
441
442 int
443 repo_add_solv(Repo *repo, FILE *fp, int flags)
444 {
445   Pool *pool = repo->pool;
446   int i, l;
447   unsigned int numid, numrel, numdir, numsolv;
448   unsigned int numkeys, numschemata;
449
450   Offset sizeid;
451   Offset *str;                         /* map Id -> Offset into string space */
452   char *strsp;                         /* repo string space */
453   char *sp;                            /* pointer into string space */
454   Id *idmap;                           /* map of repo Ids to pool Ids */
455   Id id, type;
456   unsigned int hashmask, h;
457   int hh;
458   Id *hashtbl;
459   Id name, evr, did;
460   int relflags;
461   Reldep *ran;
462   unsigned int size_idarray;
463   Id *idarraydatap, *idarraydataend;
464   Offset ido;
465   Solvable *s;
466   unsigned int solvflags;
467   unsigned int solvversion;
468   Repokey *keys;
469   Id *schemadata, *schemadatap, *schemadataend;
470   Id *schemata, key, *keyp;
471   int nentries;
472   int have_incoredata;
473   int maxsize, allsize;
474   unsigned char *buf, *bufend, *dp, *dps;
475   Id stack[3 * 5];
476   int keydepth;
477   int needchunk;        /* need a new chunk of data */
478   unsigned int now;
479   int oldnstrings = pool->ss.nstrings;
480   int oldnrels = pool->nrels;
481
482   struct _Stringpool *spool;
483
484   Repodata *parent = 0;
485   Repodata data;
486
487   int extendstart = 0, extendend = 0;   /* set in case we're extending */
488
489   now = solv_timems(0);
490
491   if ((flags & REPO_USE_LOADING) != 0)
492     {
493       /* this is a stub replace operation */
494       flags |= REPO_EXTEND_SOLVABLES;
495       /* use REPO_REUSE_REPODATA hack so that the old repodata is kept */
496       parent = repo_add_repodata(repo, flags | REPO_REUSE_REPODATA);
497       extendstart = parent->start;
498       extendend = parent->end;
499     }
500   else if (flags & REPO_EXTEND_SOLVABLES)
501     {
502       /* extend all solvables of this repo */
503       extendstart = repo->start;
504       extendend = repo->end;
505     }
506     
507   memset(&data, 0, sizeof(data));
508   data.repo = repo;
509   data.fp = fp;
510   repopagestore_init(&data.store);
511
512   if (read_u32(&data) != ('S' << 24 | 'O' << 16 | 'L' << 8 | 'V'))
513      return pool_error(pool, SOLV_ERROR_NOT_SOLV, "not a SOLV file");
514   solvversion = read_u32(&data);
515   switch (solvversion)
516     {
517       case SOLV_VERSION_8:
518         break;
519       default:
520         return pool_error(pool, SOLV_ERROR_UNSUPPORTED, "unsupported SOLV version");
521     }
522
523   numid = read_u32(&data);
524   numrel = read_u32(&data);
525   numdir = read_u32(&data);
526   numsolv = read_u32(&data);
527   numkeys = read_u32(&data);
528   numschemata = read_u32(&data);
529   solvflags = read_u32(&data);
530
531   if (numdir && numdir < 2)
532     return pool_error(pool, SOLV_ERROR_CORRUPT, "bad number of dirs");
533
534   if (numrel && (flags & REPO_LOCALPOOL) != 0)
535     return pool_error(pool, SOLV_ERROR_CORRUPT, "relations are forbidden in a local pool");
536   if ((flags & REPO_EXTEND_SOLVABLES) && numsolv)
537     {
538       /* make sure that we exactly replace the stub repodata */
539       if (extendend - extendstart != numsolv)
540         return pool_error(pool, SOLV_ERROR_CORRUPT, "sub-repository solvable number does not match main repository (%d - %d)", extendend - extendstart, numsolv);
541       for (i = 0; i < numsolv; i++)
542         if (pool->solvables[extendstart + i].repo != repo)
543           return pool_error(pool, SOLV_ERROR_CORRUPT, "main repository contains holes, cannot extend");
544     }
545
546   /*******  Part 1: string IDs  *****************************************/
547
548   sizeid = read_u32(&data);            /* size of string+Id space */
549
550   /*
551    * read strings and Ids
552    * 
553    */
554
555   
556   /*
557    * alloc buffers
558    */
559
560   if (!(flags & REPO_LOCALPOOL))
561     spool = &pool->ss;
562   else
563     {
564       data.localpool = 1;
565       spool = &data.spool;
566       spool->stringspace = solv_malloc(7);
567       strcpy(spool->stringspace, "<NULL>");
568       spool->sstrings = 7;
569       spool->nstrings = numid < 2 ? 2 - numid : 0;      /* make sure we have at least id 0 and 1 */
570     }
571
572   /* alloc string buffer */
573   spool->stringspace = solv_realloc(spool->stringspace, spool->sstrings + sizeid + 1);
574   /* alloc string offsets (Id -> Offset into string space) */
575   spool->strings = solv_realloc2(spool->strings, spool->nstrings + numid, sizeof(Offset));
576
577   strsp = spool->stringspace;
578   str = spool->strings;                /* array of offsets into strsp, indexed by Id */
579
580   /* point to _BEHIND_ already allocated string/Id space */
581   strsp += spool->sstrings;
582
583
584   /*
585    * read new repo at end of pool
586    */
587   
588   if ((solvflags & SOLV_FLAG_PREFIX_POOL) == 0)
589     {
590       if (sizeid && fread(strsp, sizeid, 1, fp) != 1)
591         return pool_error(pool, SOLV_ERROR_EOF, "read error while reading strings");
592     }
593   else
594     {
595       unsigned int pfsize = read_u32(&data);
596       char *prefix = solv_malloc(pfsize);
597       char *pp = prefix;
598       char *old_str = 0;
599       char *dest = strsp;
600       int freesp = sizeid;
601
602       if (pfsize && fread(prefix, pfsize, 1, fp) != 1)
603         {
604           solv_free(prefix);
605           return pool_error(pool, SOLV_ERROR_EOF, "read error while reading strings");
606         }
607       for (i = 1; i < numid; i++)
608         {
609           int same = (unsigned char)*pp++;
610           size_t len = strlen(pp) + 1;
611           freesp -= same + len;
612           if (freesp < 0)
613             {
614               solv_free(prefix);
615               return pool_error(pool, SOLV_ERROR_OVERFLOW, "overflow while expanding strings");
616             }
617           if (same)
618             memcpy(dest, old_str, same);
619           memcpy(dest + same, pp, len);
620           pp += len;
621           old_str = dest;
622           dest += same + len;
623         }
624       solv_free(prefix);
625       if (freesp != 0)
626         return pool_error(pool, SOLV_ERROR_CORRUPT, "expanding strings size mismatch");
627     }
628   strsp[sizeid] = 0;                   /* make string space \0 terminated */
629   sp = strsp;
630
631   if ((flags & REPO_LOCALPOOL) != 0)
632     {
633       /* no shared pool, thus no idmap and no unification */
634       idmap = 0;
635       spool->nstrings = numid >= 2 ? numid : 2; /* make sure we have at least id 0 and 1 */
636       str[0] = 0;       /* <NULL> */
637       if (*sp)
638         {
639           /* we need the '' for directories */
640           return pool_error(pool, SOLV_ERROR_CORRUPT, "store strings don't start with an empty string");
641         }
642       for (i = 1; i < spool->nstrings; i++)
643         {
644           if (sp >= strsp + sizeid && numid >= 2)
645             return pool_error(pool, SOLV_ERROR_OVERFLOW, "not enough strings");
646           str[i] = sp - spool->stringspace;
647           sp += strlen(sp) + 1;
648         }
649       spool->sstrings = sp - spool->stringspace;
650     }
651   else
652     {
653       /* alloc id map for name and rel Ids. this maps ids in the solv files
654        * to the ids in our pool */
655       idmap = solv_calloc(numid + numrel, sizeof(Id));
656
657       /* grow hash if needed, otherwise reuse */
658       hashmask = mkmask(spool->nstrings + numid);
659 #if 0
660       POOL_DEBUG(SOLV_DEBUG_STATS, "read %d strings\n", numid);
661       POOL_DEBUG(SOLV_DEBUG_STATS, "string hash buckets: %d, old %d\n", hashmask + 1, spool->stringhashmask + 1);
662 #endif
663       if (hashmask > spool->stringhashmask)
664         {
665           spool->stringhashtbl = solv_free(spool->stringhashtbl);
666           spool->stringhashmask = hashmask;
667           spool->stringhashtbl = hashtbl = solv_calloc(hashmask + 1, sizeof(Id));
668           for (i = 1; i < spool->nstrings; i++)
669             {
670               h = strhash(spool->stringspace + spool->strings[i]) & hashmask;
671               hh = HASHCHAIN_START;
672               while (hashtbl[h])
673                 h = HASHCHAIN_NEXT(h, hh, hashmask);
674               hashtbl[h] = i;
675             }
676         }
677       else
678         {
679           hashtbl = spool->stringhashtbl;
680           hashmask = spool->stringhashmask;
681         }
682
683       /*
684        * run over strings and merge with pool.
685        * also populate id map (maps solv Id -> pool Id)
686        */
687       for (i = 1; i < numid; i++)
688         {
689           if (sp >= strsp + sizeid)
690             {
691               solv_free(hashtbl);
692               solv_free(idmap);
693               return pool_error(pool, SOLV_ERROR_OVERFLOW, "not enough strings %d %d", i, numid);
694             }
695           if (!*sp)                            /* empty string */
696             {
697               idmap[i] = ID_EMPTY;
698               sp++;
699               continue;
700             }
701
702           /* find hash slot */
703           h = strhash(sp) & hashmask;
704           hh = HASHCHAIN_START;
705           for (;;)
706             {
707               id = hashtbl[h];
708               if (!id)
709                 break;
710               if (!strcmp(spool->stringspace + spool->strings[id], sp))
711                 break;          /* already in pool */
712               h = HASHCHAIN_NEXT(h, hh, hashmask);
713             }
714
715           /* length == offset to next string */
716           l = strlen(sp) + 1;
717           if (!id)             /* end of hash chain -> new string */
718             {
719               id = spool->nstrings++;
720               hashtbl[h] = id;
721               str[id] = spool->sstrings;        /* save offset */
722               if (sp != spool->stringspace + spool->sstrings)
723                 memmove(spool->stringspace + spool->sstrings, sp, l);
724               spool->sstrings += l;
725             }
726           idmap[i] = id;       /* repo relative -> pool relative */
727           sp += l;             /* next string */
728         }
729       if (hashmask > mkmask(spool->nstrings + 8192))
730         {
731           spool->stringhashtbl = solv_free(spool->stringhashtbl);
732           spool->stringhashmask = 0;
733         }
734     }
735   stringpool_shrink(spool);             /* vacuum */
736
737   
738   /*******  Part 2: Relation IDs  ***************************************/
739
740   /*
741    * read RelDeps
742    * 
743    */
744   
745   if (numrel)
746     {
747       /* extend rels */
748       pool->rels = solv_realloc2(pool->rels, pool->nrels + numrel, sizeof(Reldep));
749       ran = pool->rels;
750
751       /* grow hash if needed, otherwise reuse */
752       hashmask = mkmask(pool->nrels + numrel);
753 #if 0
754       POOL_DEBUG(SOLV_DEBUG_STATS, "read %d rels\n", numrel);
755       POOL_DEBUG(SOLV_DEBUG_STATS, "rel hash buckets: %d, old %d\n", hashmask + 1, pool->relhashmask + 1);
756 #endif
757       if (hashmask > pool->relhashmask)
758         {
759           pool->relhashtbl = solv_free(pool->relhashtbl);
760           pool->relhashmask = hashmask;
761           pool->relhashtbl = hashtbl = solv_calloc(hashmask + 1, sizeof(Id));
762           for (i = 1; i < pool->nrels; i++)
763             {
764               h = relhash(ran[i].name, ran[i].evr, ran[i].flags) & hashmask;
765               hh = HASHCHAIN_START;
766               while (hashtbl[h])
767                 h = HASHCHAIN_NEXT(h, hh, hashmask);
768               hashtbl[h] = i;
769             }
770         }
771       else
772         {
773           hashtbl = pool->relhashtbl;
774           hashmask = pool->relhashmask;
775         }
776
777       /*
778        * read RelDeps from repo
779        */
780       for (i = 0; i < numrel; i++)
781         {
782           name = read_id(&data, i + numid);     /* read (repo relative) Ids */
783           evr = read_id(&data, i + numid);
784           relflags = read_u8(&data);
785           name = idmap[name];           /* map to (pool relative) Ids */
786           evr = idmap[evr];
787           h = relhash(name, evr, relflags) & hashmask;
788           hh = HASHCHAIN_START;
789           for (;;)
790             {
791               id = hashtbl[h];
792               if (!id)          /* end of hash chain reached */
793                 break;
794               if (ran[id].name == name && ran[id].evr == evr && ran[id].flags == relflags)
795                 break;
796               h = HASHCHAIN_NEXT(h, hh, hashmask);
797             }
798           if (!id)              /* new RelDep */
799             {
800               id = pool->nrels++;
801               hashtbl[h] = id;
802               ran[id].name = name;
803               ran[id].evr = evr;
804               ran[id].flags = relflags;
805             }
806           idmap[i + numid] = MAKERELDEP(id);   /* fill Id map */
807         }
808       if (hashmask > mkmask(pool->nrels + 4096))
809         {
810           pool->relhashtbl = solv_free(pool->relhashtbl);
811           pool->relhashmask = 0;
812         }
813       pool_shrink_rels(pool);           /* vacuum */
814     }
815
816   /* if we added ids/rels, make room in our whatprovide arrays */
817   if (!(flags & REPO_LOCALPOOL))
818     {
819       if (pool->whatprovides && oldnstrings != pool->ss.nstrings)
820         {
821           int newlen = (pool->ss.nstrings + WHATPROVIDES_BLOCK) & ~WHATPROVIDES_BLOCK;
822           pool->whatprovides = solv_realloc2(pool->whatprovides, newlen, sizeof(Offset));
823           memset(pool->whatprovides + oldnstrings, 0, (newlen - oldnstrings) * sizeof(Offset));
824         }
825       if (pool->whatprovides_rel && oldnrels != pool->nrels)
826         {
827           int newlen = (pool->nrels + WHATPROVIDES_BLOCK) & ~WHATPROVIDES_BLOCK;
828           pool->whatprovides_rel = solv_realloc2(pool->whatprovides_rel, newlen, sizeof(Offset));
829           memset(pool->whatprovides_rel + oldnrels, 0, (newlen - oldnrels) * sizeof(Offset));
830         }
831     }
832
833   /*******  Part 3: Dirs  ***********************************************/
834   if (numdir)
835     {
836       data.dirpool.dirs = solv_malloc2(numdir, sizeof(Id));
837       data.dirpool.ndirs = numdir;
838       data.dirpool.dirs[0] = 0;         /* dir 0: virtual root */
839       data.dirpool.dirs[1] = 1;         /* dir 1: / */
840       for (i = 2; i < numdir; i++)
841         {
842           id = read_id(&data, i + numid);
843           if (id >= numid)
844             data.dirpool.dirs[i] = -(id - numid);
845           else if (idmap)
846             data.dirpool.dirs[i] = idmap[id];
847           else
848             data.dirpool.dirs[i] = id;
849         }
850     }
851
852   /*******  Part 4: Keys  ***********************************************/
853
854   keys = solv_calloc(numkeys, sizeof(*keys));
855   /* keys start at 1 */
856   for (i = 1; i < numkeys; i++)
857     {
858       id = read_id(&data, numid);
859       if (idmap)
860         id = idmap[id];
861       else if ((flags & REPO_LOCALPOOL) != 0)
862         id = pool_str2id(pool, stringpool_id2str(spool, id), 1);
863       type = read_id(&data, numid);
864       if (idmap)
865         type = idmap[type];
866       else if ((flags & REPO_LOCALPOOL) != 0)
867         type = pool_str2id(pool, stringpool_id2str(spool, type), 1);
868       if (type < REPOKEY_TYPE_VOID || type > REPOKEY_TYPE_FLEXARRAY)
869         {
870           data.error = pool_error(pool, SOLV_ERROR_UNSUPPORTED, "unsupported data type '%s'", pool_id2str(pool, type));
871           type = REPOKEY_TYPE_VOID;
872         }
873       keys[i].name = id;
874       keys[i].type = type;
875       keys[i].size = read_id(&data, keys[i].type == REPOKEY_TYPE_CONSTANTID ? numid + numrel : 0);
876       keys[i].storage = read_id(&data, 0);
877       /* old versions used SOLVABLE for main solvable data */
878       if (keys[i].storage == KEY_STORAGE_SOLVABLE)
879         keys[i].storage = KEY_STORAGE_INCORE;
880       if (keys[i].storage != KEY_STORAGE_INCORE && keys[i].storage != KEY_STORAGE_VERTICAL_OFFSET)
881         data.error = pool_error(pool, SOLV_ERROR_UNSUPPORTED, "unsupported storage type %d", keys[i].storage);
882       if (id >= SOLVABLE_NAME && id <= RPM_RPMDBID)
883         {
884           if (keys[i].storage != KEY_STORAGE_INCORE)
885             data.error = pool_error(pool, SOLV_ERROR_UNSUPPORTED, "main solvable data must use incore storage %d", keys[i].storage);
886           keys[i].storage = KEY_STORAGE_SOLVABLE;
887         }
888       /* cannot handle rel idarrays in incore/vertical */
889       if (type == REPOKEY_TYPE_REL_IDARRAY && keys[i].storage != KEY_STORAGE_SOLVABLE)
890         data.error = pool_error(pool, SOLV_ERROR_UNSUPPORTED, "type REL_IDARRAY is only supported for STORAGE_SOLVABLE");
891       /* cannot handle mapped ids in vertical */
892       if (!(flags & REPO_LOCALPOOL) && keys[i].storage == KEY_STORAGE_VERTICAL_OFFSET && (type == REPOKEY_TYPE_ID || type == REPOKEY_TYPE_IDARRAY))
893         data.error = pool_error(pool, SOLV_ERROR_UNSUPPORTED, "mapped ids are not supported for STORAGE_VERTICAL_OFFSET");
894  
895       if (keys[i].type == REPOKEY_TYPE_CONSTANTID && idmap)
896         keys[i].size = idmap[keys[i].size];
897 #if 0
898       fprintf(stderr, "key %d %s %s %d %d\n", i, pool_id2str(pool,id), pool_id2str(pool, keys[i].type),
899                keys[i].size, keys[i].storage);
900 #endif
901     }
902
903   have_incoredata = 0;
904   for (i = 1; i < numkeys; i++)
905     if (keys[i].storage == KEY_STORAGE_INCORE || keys[i].storage == KEY_STORAGE_VERTICAL_OFFSET)
906       have_incoredata = 1;
907
908   data.keys = keys;
909   data.nkeys = numkeys;
910   for (i = 1; i < numkeys; i++)
911     {
912       id = keys[i].name;
913       data.keybits[(id >> 3) & (sizeof(data.keybits) - 1)] |= 1 << (id & 7);
914     }
915
916   /*******  Part 5: Schemata ********************************************/
917   
918   id = read_id(&data, 0);
919   schemadata = solv_calloc(id + 1, sizeof(Id));
920   schemadatap = schemadata + 1;
921   schemadataend = schemadatap + id;
922   schemata = solv_calloc(numschemata, sizeof(Id));
923   for (i = 1; i < numschemata; i++)
924     {
925       schemata[i] = schemadatap - schemadata;
926       schemadatap = read_idarray(&data, numid, 0, schemadatap, schemadataend);
927 #if 0
928       Id *sp = schemadata + schemata[i];
929       fprintf(stderr, "schema %d:", i);
930       for (; *sp; sp++)
931         fprintf(stderr, " %d", *sp);
932       fprintf(stderr, "\n");
933 #endif
934     }
935   data.schemata = schemata;
936   data.nschemata = numschemata;
937   data.schemadata = schemadata;
938   data.schemadatalen = schemadataend - data.schemadata;
939
940   /*******  Part 6: Data ********************************************/
941
942   idarraydatap = idarraydataend = 0;
943   size_idarray = 0;
944
945   maxsize = read_id(&data, 0);
946   allsize = read_id(&data, 0);
947   maxsize += 5; /* so we can read the next schema of an array */
948   if (maxsize > allsize)
949     maxsize = allsize;
950
951   buf = solv_calloc(maxsize + DATA_READ_CHUNK + 4, 1);  /* 4 extra bytes to detect overflows */
952   bufend = buf;
953   dp = buf;
954
955   l = maxsize;
956   if (l < DATA_READ_CHUNK)
957     l = DATA_READ_CHUNK;
958   if (l > allsize)
959     l = allsize;
960   if (!l || fread(buf, l, 1, data.fp) != 1)
961     {
962       data.error = pool_error(pool, SOLV_ERROR_EOF, "unexpected EOF");
963       id = 0;
964     }
965   else
966     {
967       bufend = buf + l;
968       allsize -= l;
969       dp = data_read_id_max(dp, &id, 0, numschemata, &data);
970     }
971
972   incore_add_id(&data, 0);      /* so that incoreoffset 0 means schema 0 */
973   incore_add_id(&data, id);     /* main schema id */
974   keyp = schemadata + schemata[id];
975   data.mainschema = id;
976   for (i = 0; keyp[i]; i++)
977     ;
978   if (i)
979     data.mainschemaoffsets = solv_calloc(i, sizeof(Id));
980
981   nentries = 0;
982   keydepth = 0;
983   s = 0;
984   needchunk = 1;
985   for(;;)
986     {
987       /* make sure we have enough room */
988       if (keydepth == 0 || needchunk)
989         {
990           int left = bufend - dp;
991           /* read data chunk to dp */
992           if (data.error)
993             break;
994           if (left < 0)
995             {
996               data.error = pool_error(pool, SOLV_ERROR_EOF, "buffer overrun");
997               break;
998             }
999           if (left < maxsize)
1000             {
1001               if (left)
1002                 memmove(buf, dp, left);
1003               l = maxsize - left;
1004               if (l < DATA_READ_CHUNK)
1005                 l = DATA_READ_CHUNK;
1006               if (l > allsize)
1007                 l = allsize;
1008               if (l && fread(buf + left, l, 1, data.fp) != 1)
1009                 {
1010                   data.error = pool_error(pool, SOLV_ERROR_EOF, "unexpected EOF");
1011                   break;
1012                 }
1013               allsize -= l;
1014               left += l;
1015               bufend = buf + left;
1016               if (allsize + left < maxsize)
1017                 maxsize = allsize + left;
1018               dp = buf;
1019             }
1020           needchunk = 0;
1021         }
1022
1023       key = *keyp++;
1024 #if 0
1025 printf("key %d at %d\n", key, (int)(keyp - 1 - schemadata));
1026 #endif
1027       if (!key)
1028         {
1029           if (keydepth <= 3)
1030             needchunk = 1;
1031           if (nentries)
1032             {
1033               if (s && keydepth == 3)
1034                 {
1035                   s++;  /* next solvable */
1036                   if (have_incoredata)
1037                     data.incoreoffset[(s - pool->solvables) - data.start] = data.incoredatalen;
1038                 }
1039               id = stack[keydepth - 1];
1040               if (!id)
1041                 {
1042                   dp = data_read_id_max(dp, &id, 0, numschemata, &data);
1043                   incore_add_id(&data, id);
1044                 }
1045               keyp = schemadata + schemata[id];
1046               nentries--;
1047               continue;
1048             }
1049           if (!keydepth)
1050             break;
1051           --keydepth;
1052           keyp = schemadata + stack[--keydepth];
1053           nentries = stack[--keydepth];
1054 #if 0
1055 printf("pop flexarray %d %d\n", keydepth, nentries);
1056 #endif
1057           if (!keydepth && s)
1058             s = 0;      /* back from solvables */
1059           continue;
1060         }
1061
1062       if (keydepth == 0)
1063         data.mainschemaoffsets[keyp - 1 - (schemadata + schemata[data.mainschema])] = data.incoredatalen;
1064
1065 #if 0
1066 printf("=> %s %s %p\n", pool_id2str(pool, keys[key].name), pool_id2str(pool, keys[key].type), s);
1067 #endif
1068       id = keys[key].name;
1069       if (keys[key].storage == KEY_STORAGE_VERTICAL_OFFSET)
1070         {
1071           dps = dp;
1072           dp = data_skip(dp, REPOKEY_TYPE_ID);
1073           dp = data_skip(dp, REPOKEY_TYPE_ID);
1074           incore_add_blob(&data, dps, dp - dps);        /* just record offset/size */
1075           continue;
1076         }
1077       switch (keys[key].type)
1078         {
1079         case REPOKEY_TYPE_ID:
1080           dp = data_read_id_max(dp, &did, idmap, numid + numrel, &data);
1081           if (s && id == SOLVABLE_NAME)
1082             s->name = did; 
1083           else if (s && id == SOLVABLE_ARCH)
1084             s->arch = did; 
1085           else if (s && id == SOLVABLE_EVR)
1086             s->evr = did; 
1087           else if (s && id == SOLVABLE_VENDOR)
1088             s->vendor = did; 
1089           else if (keys[key].storage == KEY_STORAGE_INCORE)
1090             incore_add_id(&data, did);
1091 #if 0
1092           POOL_DEBUG(SOLV_DEBUG_STATS, "%s -> %s\n", pool_id2str(pool, id), pool_id2str(pool, did));
1093 #endif
1094           break;
1095         case REPOKEY_TYPE_IDARRAY:
1096         case REPOKEY_TYPE_REL_IDARRAY:
1097           if (!s || id < INTERESTED_START || id > INTERESTED_END)
1098             {
1099               dps = dp;
1100               dp = data_skip(dp, REPOKEY_TYPE_IDARRAY);
1101               if (keys[key].storage != KEY_STORAGE_INCORE)
1102                 break;
1103               if (idmap)
1104                 incore_map_idarray(&data, dps, idmap, numid + numrel);
1105               else
1106                 incore_add_blob(&data, dps, dp - dps);
1107               break;
1108             }
1109           ido = idarraydatap - repo->idarraydata;
1110           if (keys[key].type == REPOKEY_TYPE_IDARRAY)
1111             dp = data_read_idarray(dp, &idarraydatap, idmap, numid + numrel, &data);
1112           else if (id == SOLVABLE_REQUIRES)
1113             dp = data_read_rel_idarray(dp, &idarraydatap, idmap, numid + numrel, &data, SOLVABLE_PREREQMARKER);
1114           else if (id == SOLVABLE_PROVIDES)
1115             dp = data_read_rel_idarray(dp, &idarraydatap, idmap, numid + numrel, &data, SOLVABLE_FILEMARKER);
1116           else
1117             dp = data_read_rel_idarray(dp, &idarraydatap, idmap, numid + numrel, &data, 0);
1118           if (idarraydatap > idarraydataend)
1119             {
1120               data.error = pool_error(pool, SOLV_ERROR_OVERFLOW, "idarray overflow");
1121               break;
1122             }
1123           if (id == SOLVABLE_PROVIDES)
1124             s->provides = ido;
1125           else if (id == SOLVABLE_OBSOLETES)
1126             s->obsoletes = ido;
1127           else if (id == SOLVABLE_CONFLICTS)
1128             s->conflicts = ido;
1129           else if (id == SOLVABLE_REQUIRES)
1130             s->requires = ido;
1131           else if (id == SOLVABLE_RECOMMENDS)
1132             s->recommends= ido;
1133           else if (id == SOLVABLE_SUPPLEMENTS)
1134             s->supplements = ido;
1135           else if (id == SOLVABLE_SUGGESTS)
1136             s->suggests = ido;
1137           else if (id == SOLVABLE_ENHANCES)
1138             s->enhances = ido;
1139 #if 0
1140           POOL_DEBUG(SOLV_DEBUG_STATS, "%s ->\n", pool_id2str(pool, id));
1141           for (; repo->idarraydata[ido]; ido++)
1142             POOL_DEBUG(SOLV_DEBUG_STATS,"  %s\n", pool_dep2str(pool, repo->idarraydata[ido]));
1143 #endif
1144           break;
1145         case REPOKEY_TYPE_FIXARRAY:
1146         case REPOKEY_TYPE_FLEXARRAY:
1147           if (!keydepth)
1148             needchunk = 1;
1149           if (keydepth == sizeof(stack)/sizeof(*stack))
1150             {
1151               data.error = pool_error(pool, SOLV_ERROR_OVERFLOW, "array stack overflow");
1152               break;
1153             }
1154           stack[keydepth++] = nentries;
1155           stack[keydepth++] = keyp - schemadata;
1156           stack[keydepth++] = 0;
1157           dp = data_read_id_max(dp, &nentries, 0, 0, &data);
1158           incore_add_id(&data, nentries);
1159           if (!nentries)
1160             {
1161               /* zero size array? */
1162               keydepth -= 2;
1163               nentries = stack[--keydepth];
1164               break;
1165             }
1166           if (keydepth == 3 && id == REPOSITORY_SOLVABLES)
1167             {
1168               /* horray! here come the solvables */
1169               if (nentries != numsolv)
1170                 {
1171                   data.error = pool_error(pool, SOLV_ERROR_CORRUPT, "inconsistent number of solvables: %d %d", nentries, numsolv);
1172                   break;
1173                 }
1174               if (idarraydatap)
1175                 {
1176                   data.error = pool_error(pool, SOLV_ERROR_CORRUPT, "more than one solvable block");
1177                   break;
1178                 }
1179               if ((flags & REPO_EXTEND_SOLVABLES) != 0)
1180                 s = pool_id2solvable(pool, extendstart);
1181               else
1182                 s = pool_id2solvable(pool, repo_add_solvable_block(repo, numsolv));
1183               data.start = s - pool->solvables;
1184               data.end = data.start + numsolv;
1185               repodata_extend_block(&data, data.start, numsolv);
1186               for (i = 1; i < numkeys; i++)
1187                 {
1188                   id = keys[i].name;
1189                   if ((keys[i].type == REPOKEY_TYPE_IDARRAY || keys[i].type == REPOKEY_TYPE_REL_IDARRAY)
1190                       && id >= INTERESTED_START && id <= INTERESTED_END)
1191                     size_idarray += keys[i].size;
1192                 }
1193               /* allocate needed space in repo */
1194               /* we add maxsize because it is an upper limit for all idarrays, thus we can't overflow */
1195               repo_reserve_ids(repo, 0, size_idarray + maxsize + 1);
1196               idarraydatap = repo->idarraydata + repo->idarraysize;
1197               repo->idarraysize += size_idarray;
1198               idarraydataend = idarraydatap + size_idarray;
1199               repo->lastoff = 0;
1200               if (have_incoredata)
1201                 data.incoreoffset[(s - pool->solvables) - data.start] = data.incoredatalen;
1202             }
1203           nentries--;
1204           dp = data_read_id_max(dp, &id, 0, numschemata, &data);
1205           incore_add_id(&data, id);
1206           if (keys[key].type == REPOKEY_TYPE_FIXARRAY)
1207             {
1208               if (!id)
1209                 data.error = pool_error(pool, SOLV_ERROR_CORRUPT, "illegal fixarray");
1210               stack[keydepth - 1] = id;
1211             }
1212           keyp = schemadata + schemata[id];
1213           break;
1214         case REPOKEY_TYPE_NUM:
1215           if (!(solvflags & SOLV_FLAG_SIZE_BYTES) && keys[key].storage == KEY_STORAGE_INCORE &&
1216                 (id == SOLVABLE_INSTALLSIZE || id == SOLVABLE_DOWNLOADSIZE || id == DELTA_DOWNLOADSIZE))
1217             {
1218               /* old solv file with sizes in kilos. transcode. */
1219               dp = data_read_id(dp, &id);
1220               incore_add_sizek(&data, (unsigned int)id);
1221               break;
1222             }
1223           /* FALLTHROUGH */
1224         default:
1225           if (id == RPM_RPMDBID && s && (keys[key].type == REPOKEY_TYPE_U32 || keys[key].type == REPOKEY_TYPE_NUM))
1226             {
1227               if (keys[key].type == REPOKEY_TYPE_U32)
1228                 dp = data_read_u32(dp, (unsigned int *)&id);
1229               else
1230                 dp = data_read_id_max(dp, &id, 0, 0, &data);
1231               if (!repo->rpmdbid)
1232                 repo->rpmdbid = repo_sidedata_create(repo, sizeof(Id));
1233               repo->rpmdbid[(s - pool->solvables) - repo->start] = id;
1234               break;
1235             }
1236           dps = dp;
1237           dp = data_skip(dp, keys[key].type);
1238           if (keys[key].storage == KEY_STORAGE_INCORE)
1239             incore_add_blob(&data, dps, dp - dps);
1240           break;
1241         }
1242     }
1243   /* should shrink idarraydata again */
1244
1245   if (keydepth)
1246     data.error = pool_error(pool, SOLV_ERROR_EOF, "unexpected EOF, depth = %d", keydepth);
1247   if (!data.error)
1248     {
1249       if (dp > bufend)
1250         data.error = pool_error(pool, SOLV_ERROR_EOF, "buffer overrun");
1251     }
1252   solv_free(buf);
1253
1254   if (data.error)
1255     {
1256       /* free solvables */
1257       repo_free_solvable_block(repo, data.start, data.end - data.start, 1);
1258       /* free id array */
1259       repo->idarraysize -= size_idarray;
1260       /* free incore data */
1261       data.incoredata = solv_free(data.incoredata);
1262       data.incoredatalen = data.incoredatafree = 0;
1263     }
1264
1265   if (data.incoredatafree)
1266     {
1267       /* shrink excess size */
1268       data.incoredata = solv_realloc(data.incoredata, data.incoredatalen);
1269       data.incoredatafree = 0;
1270     }
1271
1272   for (i = 1; i < numkeys; i++)
1273     if (keys[i].storage == KEY_STORAGE_VERTICAL_OFFSET)
1274       break;
1275   if (i < numkeys && !data.error)
1276     {
1277       Id fileoffset = 0;
1278       unsigned int pagesize;
1279       
1280       /* we have vertical data, make it available */
1281       data.verticaloffset = solv_calloc(numkeys, sizeof(Id));
1282       for (i = 1; i < numkeys; i++)
1283         if (keys[i].storage == KEY_STORAGE_VERTICAL_OFFSET)
1284           {
1285             data.verticaloffset[i] = fileoffset;
1286             fileoffset += keys[i].size;
1287           }
1288       data.lastverticaloffset = fileoffset;
1289       pagesize = read_u32(&data);
1290       data.error = repopagestore_read_or_setup_pages(&data.store, data.fp, pagesize, fileoffset);
1291       if (data.error == SOLV_ERROR_EOF)
1292         pool_error(pool, data.error, "repopagestore setup: unexpected EOF");
1293       else if (data.error)
1294         pool_error(pool, data.error, "repopagestore setup failed");
1295     }
1296   else
1297     {
1298       /* no longer needed */
1299       data.fp = 0;
1300     }
1301   solv_free(idmap);
1302
1303   if (data.error)
1304     {
1305       /* XXX: free repodata? */
1306       return data.error;
1307     }
1308
1309   if (parent)
1310     {
1311       /* overwrite stub repodata */
1312       repodata_freedata(parent);
1313       data.repodataid = parent->repodataid;
1314       *parent = data;
1315     }
1316   else
1317     {
1318       /* make it available as new repodata */
1319       if (!repo->nrepodata)
1320         {
1321           repo->nrepodata = 1;
1322           repo->repodata = solv_calloc(2, sizeof(data));
1323         }
1324       else
1325         repo->repodata = solv_realloc2(repo->repodata, repo->nrepodata + 1, sizeof(data));
1326       data.repodataid = repo->nrepodata;
1327       repo->repodata[repo->nrepodata++] = data;
1328     }
1329
1330   /* create stub repodata entries for all external */
1331   if (!(flags & SOLV_ADD_NO_STUBS) && !parent)
1332     {
1333       for (key = 1 ; key < data.nkeys; key++)
1334         if (data.keys[key].name == REPOSITORY_EXTERNAL && data.keys[key].type == REPOKEY_TYPE_FLEXARRAY)
1335           break;
1336       if (key < data.nkeys)
1337         repodata_create_stubs(repo->repodata + (repo->nrepodata - 1));
1338     }
1339
1340   POOL_DEBUG(SOLV_DEBUG_STATS, "repo_add_solv took %d ms\n", solv_timems(now));
1341   POOL_DEBUG(SOLV_DEBUG_STATS, "repo size: %d solvables\n", repo->nsolvables);
1342   POOL_DEBUG(SOLV_DEBUG_STATS, "repo memory used: %d K incore, %d K idarray\n", data.incoredatalen/1024, repo->idarraysize / (int)(1024/sizeof(Id)));
1343   return 0;
1344 }
1345