- use repo_free_solvable instead of repo_free_solvable_block when freeing a single...
[platform/upstream/libsolv.git] / ext / repo_mdk.c
1 /*
2  * Copyright (c) 2012, Novell Inc.
3  *
4  * This program is licensed under the BSD license, read LICENSE.BSD
5  * for further information
6  */
7
8 #include <sys/types.h>
9 #include <sys/stat.h>
10 #include <stdio.h>
11 #include <stdlib.h>
12 #include <string.h>
13 #include <unistd.h>
14 #include <expat.h>
15
16 #include "pool.h"
17 #include "repo.h"
18 #include "util.h"
19 #include "chksum.h"
20 #include "repo_mdk.h"
21
22 static Offset
23 parse_deps(Solvable *s, char *bp, Id marker)
24 {
25   Pool *pool = s->repo->pool;
26   Offset deps = 0;
27   char *nbp, *ebp;
28   for (; bp; bp = nbp)
29     {
30       int ispre = 0;
31       Id id, evr = 0;
32       int flags = 0;
33
34       nbp = strchr(bp, '@');
35       if (!nbp)
36         ebp = bp + strlen(bp);
37       else
38         {
39           ebp = nbp;
40           *nbp++ = 0;
41         }
42       if (ebp[-1] == ']')
43         {
44           char *sbp = ebp - 1;
45           while (sbp >= bp && *sbp != '[')
46             sbp--;
47           if (sbp >= bp && sbp[1] != '*')
48             {
49               char *fbp;
50               for (fbp = sbp + 1;; fbp++)
51                 {
52                   if (*fbp == '>')
53                     flags |= REL_GT;
54                   else if (*fbp == '=')
55                     flags |= REL_EQ;
56                   else if (*fbp == '<')
57                     flags |= REL_LT;
58                   else
59                     break;
60                 }
61               if (*fbp == ' ')
62                 fbp++;
63               evr = pool_strn2id(pool, fbp, ebp - 1 - fbp, 1);
64               ebp = sbp;
65             }
66         }
67       if (ebp[-1] == ']' && ebp >= bp + 3 && !strncmp(ebp - 3, "[*]", 3))
68         {
69           ispre = 1;
70           ebp -= 3;
71         }
72       id = pool_strn2id(pool, bp, ebp - bp, 1);
73       if (evr)
74         id = pool_rel2id(pool, id, evr, flags, 1);
75       deps = repo_addid_dep(s->repo, deps, id, ispre ? marker : 0);
76       bp = nbp;
77     }
78   return deps;
79 }
80
81 int
82 repo_add_mdk(Repo *repo, FILE *fp, int flags)
83 {
84   Pool *pool = repo->pool;
85   Repodata *data;
86   Solvable *s;
87   char *buf;
88   int bufa, bufl;
89
90   data = repo_add_repodata(repo, flags);
91   bufa = 4096;
92   buf = solv_malloc(bufa);
93   bufl = 0;
94   s = 0;
95   while (fgets(buf + bufl, bufa - bufl, fp) > 0)
96     {
97       bufl += strlen(buf + bufl);
98       if (bufl && buf[bufl - 1] != '\n')
99         {
100           if (bufa - bufl < 256)
101             {
102               bufa += 4096;
103               buf = solv_realloc(buf, bufa);
104             }
105           continue;
106         }
107       buf[--bufl] = 0;
108       bufl = 0;
109       if (buf[0] != '@')
110         {
111           pool_debug(pool, SOLV_ERROR, "bad line <%s>\n", buf);
112           continue;
113         }
114       if (!s)
115         s = pool_id2solvable(pool, repo_add_solvable(repo));
116       if (!strncmp(buf + 1, "filesize@", 9))
117         repodata_set_num(data, s - pool->solvables, SOLVABLE_DOWNLOADSIZE, strtoull(buf + 10, 0, 10));
118       else if (!strncmp(buf + 1, "summary@", 8))
119         repodata_set_str(data, s - pool->solvables, SOLVABLE_SUMMARY, buf + 9);
120       else if (!strncmp(buf + 1, "provides@", 9))
121         s->provides = parse_deps(s, buf + 10, 0);
122       else if (!strncmp(buf + 1, "requires@", 9))
123         s->requires = parse_deps(s, buf + 10, SOLVABLE_PREREQMARKER);
124       else if (!strncmp(buf + 1, "suggests@", 9))
125         s->suggests = parse_deps(s, buf + 10, 0);
126       else if (!strncmp(buf + 1, "obsoletes@", 10))
127         s->obsoletes = parse_deps(s, buf + 11, 0);
128       else if (!strncmp(buf + 1, "conflicts@", 10))
129         s->conflicts = parse_deps(s, buf + 11, 0);
130       else if (!strncmp(buf + 1, "info@", 5))
131         {
132           char *nvra = buf + 6;
133           char *epochstr;
134           char *arch;
135           char *version;
136           char *filename;
137           if ((epochstr = strchr(nvra, '@')) != 0)
138             {
139               char *sizestr;
140               *epochstr++ = 0;
141               if ((sizestr = strchr(epochstr, '@')) != 0)
142                 {
143                   char *groupstr;
144                   *sizestr++ = 0;
145                   if ((groupstr = strchr(sizestr, '@')) != 0)
146                     {
147                       char *n;
148                       *groupstr++ = 0;
149                       if ((n = strchr(groupstr, '@')) != 0)
150                         *n = 0;
151                       if (*groupstr)
152                         repodata_set_poolstr(data, s - pool->solvables, SOLVABLE_GROUP, groupstr);
153                     }
154                   repodata_set_num(data, s - pool->solvables, SOLVABLE_INSTALLSIZE, strtoull(sizestr, 0, 10));
155                 }
156             }
157           filename = pool_tmpjoin(pool, nvra, ".rpm", 0);
158           arch = strrchr(nvra, '.');
159           if (arch)
160             {
161               *arch++ = 0;
162               s->arch = pool_str2id(pool, arch, 1);
163             }
164           /* argh, do we have a distepoch or not, check self-provides */
165           if (s->provides)
166             {
167               Id id, lastid, *idp = s->repo->idarraydata + s->provides;
168               lastid = 0;
169               for (idp = s->repo->idarraydata + s->provides; (id = *idp) != 0; idp++)
170                 {
171                   const char *evr, *name;
172                   int namel;
173                   Reldep *rd;
174                   if (!ISRELDEP(id))
175                     continue;
176                   rd = GETRELDEP(pool, id);
177                   if (rd->flags != REL_EQ)
178                     continue;
179                   name = pool_id2str(pool, rd->name);
180                   namel = strlen(name);
181                   if (strncmp(name, nvra, namel) != 0 || nvra[namel] != '-')
182                     continue;
183                   evr = pool_id2str(pool, rd->evr);
184                   evr = strrchr(evr, '-');
185                   if (evr && strchr(evr, ':') != 0)
186                     lastid = id;
187                 }
188               if (lastid)
189                 {
190                   /* self provides found, and it contains a distepoch */
191                   /* replace with self-provides distepoch to get rid of the disttag */
192                   char *nvradistepoch = strrchr(nvra, '-');
193                   if (nvradistepoch)
194                     {
195                       Reldep *rd = GETRELDEP(pool, lastid);
196                       const char *evr = pool_id2str(pool, rd->evr);
197                       evr = strrchr(evr, '-');
198                       if (evr && (evr = strchr(evr, ':')) != 0)
199                         {
200                           if (strlen(evr) < strlen(nvradistepoch))
201                             strcpy(nvradistepoch, evr);
202                         }
203                     }
204                 }
205             }
206           version = strrchr(nvra, '-');
207           if (version)
208             {
209               char *release = version;
210               *release = 0;
211               version = strrchr(nvra, '-');
212               *release = '-';
213               if (!version)
214                 version = release;
215               *version++ = 0;
216             }
217           else
218             version = "";
219           s->name = pool_str2id(pool, nvra, 1);
220           if (epochstr && *epochstr && strcmp(epochstr, "0") != 0)
221             {
222               char *evr = pool_tmpjoin(pool, epochstr, ":", version);
223               s->evr = pool_str2id(pool, evr, 1);
224             }
225           else
226             s->evr = pool_str2id(pool, version, 1);
227           repodata_set_location(data, s - pool->solvables, 0, 0, filename);
228           if (s->name && s->arch != ARCH_SRC && s->arch != ARCH_NOSRC)
229             s->provides = repo_addid_dep(s->repo, s->provides, pool_rel2id(pool, s->name, s->evr, REL_EQ, 1), 0);
230           s = 0;
231         }
232       else
233         {
234           char *tagend = strchr(buf + 1, '@');
235           if (tagend)
236             *tagend = 0;
237           pool_debug(pool, SOLV_ERROR, "unknown tag <%s>\n", buf + 1);
238           continue;
239         }
240     }
241   if (s)
242     {
243       pool_debug(pool, SOLV_ERROR, "unclosed package at EOF\n");
244       repo_free_solvable(s->repo, s - pool->solvables, 1);
245     }
246   solv_free(buf);
247   if (!(flags & REPO_NO_INTERNALIZE))
248     repodata_internalize(data);
249   return 0;
250 }
251
252 enum state {
253   STATE_START,
254   STATE_MEDIA_INFO,
255   STATE_INFO,
256   STATE_FILES,
257   NUMSTATES
258 };
259
260 struct stateswitch {
261   enum state from;
262   char *ename;
263   enum state to;
264   int docontent;
265 };
266
267 /* must be sorted by first column */
268 static struct stateswitch stateswitches[] = {
269   { STATE_START, "media_info", STATE_MEDIA_INFO, 0 },
270   { STATE_MEDIA_INFO, "info", STATE_INFO, 1 },
271   { STATE_MEDIA_INFO, "files", STATE_FILES, 1 },
272   { NUMSTATES }
273 };
274
275 struct parsedata {
276   Pool *pool;
277   Repo *repo;
278   Repodata *data;
279   int depth;
280   enum state state;
281   int statedepth;
282   char *content;
283   int lcontent;
284   int acontent;
285   int docontent;
286   struct stateswitch *swtab[NUMSTATES];
287   enum state sbtab[NUMSTATES];
288   Solvable *solvable;
289   Hashtable joinhash;
290   Hashmask joinhashmask;
291 };
292
293 static inline const char *
294 find_attr(const char *txt, const char **atts)
295 {
296   for (; *atts; atts += 2)
297     {
298       if (!strcmp(*atts, txt))
299         return atts[1];
300     }
301   return 0;
302 }
303
304 static Hashtable
305 joinhash_init(Repo *repo, Hashmask *hmp)
306 {
307   Hashmask hm = mkmask(repo->nsolvables);
308   Hashtable ht = solv_calloc(hm + 1, sizeof(*ht));
309   Hashval h, hh;
310   Solvable *s;
311   int i;
312
313   FOR_REPO_SOLVABLES(repo, i, s)
314     {
315       hh = HASHCHAIN_START;
316       h = s->name & hm;
317       while (ht[h])
318         h = HASHCHAIN_NEXT(h, hh, hm);
319       ht[h] = i;
320     }
321   *hmp = hm;
322   return ht;
323 }
324
325 static Solvable *
326 joinhash_lookup(Repo *repo, Hashtable ht, Hashmask hm, const char *fn, const char *distepoch)
327 {
328   Hashval h, hh;
329   const char *p, *vrstart, *vrend;
330   Id name, arch;
331
332   if (!fn || !*fn)
333     return 0;
334   if (distepoch && !*distepoch)
335     distepoch = 0;
336   p = fn + strlen(fn);
337   while (--p > fn)
338     if (*p == '.')
339       break;
340   if (p == fn)
341     return 0;
342   arch = pool_str2id(repo->pool, p + 1, 0);
343   if (!arch)
344     return 0;
345   if (distepoch)
346     {
347       while (--p > fn)
348         if (*p == '-')
349           break;
350       if (p == fn)
351         return 0;
352     }
353   vrend = p;
354   while (--p > fn)
355     if (*p == '-')
356       break;
357   if (p == fn)
358     return 0;
359   while (--p > fn)
360     if (*p == '-')
361       break;
362   if (p == fn)
363     return 0;
364   vrstart = p + 1;
365   name = pool_strn2id(repo->pool, fn, p - fn, 0);
366   if (!name)
367     return 0;
368   hh = HASHCHAIN_START;
369   h = name & hm;
370   while (ht[h])
371     {
372       Solvable *s = repo->pool->solvables + ht[h];
373       if (s->name == name && s->arch == arch)
374         {
375           /* too bad we don't know the epoch... */
376           const char *evr = pool_id2str(repo->pool, s->evr);
377           for (p = evr; *p >= '0' && *p <= '9'; p++)
378             ;
379           if (p > evr && *p == ':')
380             evr = p + 1;
381           if (distepoch)
382             {
383               if (!strncmp(evr, vrstart, vrend - vrstart) && evr[vrend - vrstart] == ':' && !strcmp(distepoch, evr + (vrend - vrstart + 1)))
384                 return s;
385             }
386           else if (!strncmp(evr, vrstart, vrend - vrstart) && evr[vrend - vrstart] == 0)
387             return s;
388         }
389       h = HASHCHAIN_NEXT(h, hh, hm);
390     }
391   return 0;
392 }
393
394 static void
395 set_sourcerpm(Repodata *data, Solvable *s, Id handle, const char *sourcerpm)
396 {
397   const char *p, *sevr, *sarch, *name, *evr;
398   Pool *pool;
399
400   p = strrchr(sourcerpm, '.');
401   if (!p || strcmp(p, ".rpm") != 0)
402     return;
403   p--;
404   while (p > sourcerpm && *p != '.')
405     p--;
406   if (*p != '.' || p == sourcerpm)
407     return;
408   sarch = p-- + 1;
409   while (p > sourcerpm && *p != '-')
410     p--;
411   if (*p != '-' || p == sourcerpm)
412     return;
413   p--;
414   while (p > sourcerpm && *p != '-')
415     p--;
416   if (*p != '-' || p == sourcerpm)
417     return;
418   sevr = p + 1;
419   pool = s->repo->pool;
420   if (!strcmp(sarch, "src.rpm"))
421     repodata_set_constantid(data, handle, SOLVABLE_SOURCEARCH, ARCH_SRC);
422   else if (!strcmp(sarch, "nosrc.rpm"))
423     repodata_set_constantid(data, handle, SOLVABLE_SOURCEARCH, ARCH_NOSRC);
424   else
425     repodata_set_constantid(data, handle, SOLVABLE_SOURCEARCH, pool_strn2id(pool, sarch, strlen(sarch) - 4, 1));
426   evr = pool_id2str(pool, s->evr);
427   if (evr && !strncmp(sevr, evr, sarch - sevr - 1) && evr[sarch - sevr - 1] == 0)
428     repodata_set_void(data, handle, SOLVABLE_SOURCEEVR);
429   else
430     repodata_set_id(data, handle, SOLVABLE_SOURCEEVR, pool_strn2id(pool, sevr, sarch - sevr - 1, 1));
431   name = pool_id2str(pool, s->name);
432   if (name && !strncmp(sourcerpm, name, sevr - sourcerpm - 1) && name[sevr - sourcerpm - 1] == 0)
433     repodata_set_void(data, handle, SOLVABLE_SOURCENAME);
434   else
435     repodata_set_id(data, handle, SOLVABLE_SOURCENAME, pool_strn2id(pool, sourcerpm, sevr - sourcerpm - 1, 1));
436 }
437
438
439 static void XMLCALL
440 startElement(void *userData, const char *name, const char **atts)
441 {
442   struct parsedata *pd = userData;
443   Pool *pool = pd->pool;
444   struct stateswitch *sw;
445
446   if (pd->depth != pd->statedepth)
447     {
448       pd->depth++;
449       return;
450     }
451   pd->depth++;
452   if (!pd->swtab[pd->state])
453     return;
454   for (sw = pd->swtab[pd->state]; sw->from == pd->state; sw++)
455     if (!strcmp(sw->ename, name))
456       break;
457   if (sw->from != pd->state)
458     return;
459   pd->state = sw->to;
460   pd->docontent = sw->docontent;
461   pd->statedepth = pd->depth;
462   pd->lcontent = 0;
463   *pd->content = 0;
464   switch (pd->state)
465     {
466     case STATE_INFO:
467       {
468         const char *fn = find_attr("fn", atts);
469         const char *distepoch = find_attr("distepoch", atts);
470         const char *str;
471         pd->solvable = joinhash_lookup(pd->repo, pd->joinhash, pd->joinhashmask, fn, distepoch);
472         if (!pd->solvable)
473           break;
474         str = find_attr("url", atts);
475         if (str && *str)
476           repodata_set_str(pd->data, pd->solvable - pool->solvables, SOLVABLE_URL, str);
477         str = find_attr("license", atts);
478         if (str && *str)
479           repodata_set_poolstr(pd->data, pd->solvable - pool->solvables, SOLVABLE_LICENSE, str);
480         str = find_attr("sourcerpm", atts);
481         if (str && *str)
482           set_sourcerpm(pd->data, pd->solvable, pd->solvable - pool->solvables, str);
483         break;
484       }
485     case STATE_FILES:
486       {
487         const char *fn = find_attr("fn", atts);
488         const char *distepoch = find_attr("distepoch", atts);
489         pd->solvable = joinhash_lookup(pd->repo, pd->joinhash, pd->joinhashmask, fn, distepoch);
490         break;
491       }
492     default:
493       break;
494     }
495 }
496
497 static void XMLCALL
498 endElement(void *userData, const char *name)
499 {
500   struct parsedata *pd = userData;
501   Solvable *s = pd->solvable;
502   if (pd->depth != pd->statedepth)
503     {
504       pd->depth--;
505       return;
506     }
507   pd->depth--;
508   pd->statedepth--;
509   switch (pd->state)
510     {
511     case STATE_INFO:
512       if (s && *pd->content)
513         repodata_set_str(pd->data, s - pd->pool->solvables, SOLVABLE_DESCRIPTION, pd->content);
514       break;
515     case STATE_FILES:
516       if (s && *pd->content)
517         {
518           char *np, *p, *sl;
519           for (p = pd->content; p && *p; p = np)
520             {
521               Id id;
522               np = strchr(p, '\n');
523               if (np)
524                 *np++ = 0;
525               if (!*p)
526                 continue;
527               sl = strrchr(p, '/');
528               if (sl)
529                 {
530                   *sl++ = 0;
531                   id = repodata_str2dir(pd->data, p, 1);
532                 }
533               else
534                 {
535                   sl = p;
536                   id = 0;
537                 }
538               if (!id)
539                 id = repodata_str2dir(pd->data, "/", 1);
540               repodata_add_dirstr(pd->data, s - pd->pool->solvables, SOLVABLE_FILELIST, id, sl);
541             }
542         }
543       break;
544     default:
545       break;
546     }
547   pd->state = pd->sbtab[pd->state];
548   pd->docontent = 0;
549 }
550
551 static void XMLCALL
552 characterData(void *userData, const XML_Char *s, int len)
553 {
554   struct parsedata *pd = userData;
555   int l;
556   char *c;
557   if (!pd->docontent)
558     return;
559   l = pd->lcontent + len + 1;
560   if (l > pd->acontent)
561     {
562       pd->content = solv_realloc(pd->content, l + 256);
563       pd->acontent = l + 256;
564     }
565   c = pd->content + pd->lcontent;
566   pd->lcontent += len;
567   while (len-- > 0)
568     *c++ = *s++;
569   *c = 0;
570 }
571
572 #define BUFF_SIZE 8192
573
574 int
575 repo_add_mdk_info(Repo *repo, FILE *fp, int flags)
576 {
577   Repodata *data;
578   struct parsedata pd;
579   char buf[BUFF_SIZE];
580   int i, l;
581   struct stateswitch *sw;
582   XML_Parser parser;
583
584   if (!(flags & REPO_EXTEND_SOLVABLES))
585     {
586       pool_debug(repo->pool, SOLV_ERROR, "repo_add_mdk_info: can only extend existing solvables\n");
587       return -1;
588     }
589
590   data = repo_add_repodata(repo, flags);
591
592   memset(&pd, 0, sizeof(pd));
593   pd.repo = repo;
594   pd.pool = repo->pool;
595   pd.data = data;
596
597   pd.content = solv_malloc(256);
598   pd.acontent = 256;
599
600   pd.joinhash = joinhash_init(repo, &pd.joinhashmask);
601
602   for (i = 0, sw = stateswitches; sw->from != NUMSTATES; i++, sw++)
603     {
604       if (!pd.swtab[sw->from])
605         pd.swtab[sw->from] = sw;
606       pd.sbtab[sw->to] = sw->from;
607     }
608
609   parser = XML_ParserCreate(NULL);
610   XML_SetUserData(parser, &pd);
611   XML_SetElementHandler(parser, startElement, endElement);
612   XML_SetCharacterDataHandler(parser, characterData);
613   for (;;)
614     {
615       l = fread(buf, 1, sizeof(buf), fp);
616       if (XML_Parse(parser, buf, l, l == 0) == XML_STATUS_ERROR)
617         {
618           pool_debug(pd.pool, SOLV_ERROR, "%s at line %u:%u\n", XML_ErrorString(XML_GetErrorCode(parser)), (unsigned int)XML_GetCurrentLineNumber(parser), (unsigned int)XML_GetCurrentColumnNumber(parser));
619           break;
620         }
621       if (l == 0)
622         break;
623     }
624   XML_ParserFree(parser);
625   solv_free(pd.content);
626   solv_free(pd.joinhash);
627   if (!(flags & REPO_NO_INTERNALIZE))
628     repodata_internalize(data);
629   return 0;
630 }