345d416721ccea8bc8ebffe1b9de6a4d2db45fdc
[platform/upstream/libsolv.git] / ext / repo_mdk.c
1 /*
2  * Copyright (c) 2012, Novell Inc.
3  *
4  * This program is licensed under the BSD license, read LICENSE.BSD
5  * for further information
6  */
7
8 #include <sys/types.h>
9 #include <sys/stat.h>
10 #include <stdio.h>
11 #include <stdlib.h>
12 #include <string.h>
13 #include <unistd.h>
14 #include <expat.h>
15
16 #include "pool.h"
17 #include "repo.h"
18 #include "util.h"
19 #include "chksum.h"
20 #include "repo_mdk.h"
21
22 static Offset
23 parse_deps(Solvable *s, char *bp, Id marker)
24 {
25   Pool *pool = s->repo->pool;
26   Offset deps = 0;
27   char *nbp, *ebp;
28   for (; bp; bp = nbp)
29     {
30       int ispre = 0;
31       Id id, evr = 0;
32       int flags = 0;
33
34       nbp = strchr(bp, '@');
35       if (!nbp)
36         ebp = bp + strlen(bp);
37       else
38         {
39           ebp = nbp;
40           *nbp++ = 0;
41         }
42       if (ebp[-1] == ']')
43         {
44           char *sbp = ebp - 1;
45           while (sbp >= bp && *sbp != '[')
46             sbp--;
47           if (sbp >= bp && sbp[1] != '*')
48             {
49               char *fbp;
50               for (fbp = sbp + 1;; fbp++)
51                 {
52                   if (*fbp == '>')
53                     flags |= REL_GT;
54                   else if (*fbp == '=')
55                     flags |= REL_EQ;
56                   else if (*fbp == '<')
57                     flags |= REL_LT;
58                   else
59                     break;
60                 }
61               if (*fbp == ' ')
62                 fbp++;
63               evr = pool_strn2id(pool, fbp, ebp - 1 - fbp, 1);
64               ebp = sbp;
65             }
66         }
67       if (ebp[-1] == ']' && ebp >= bp + 3 && !strncmp(ebp - 3, "[*]", 3))
68         {
69           ispre = 1;
70           ebp -= 3;
71         }
72       id = pool_strn2id(pool, bp, ebp - bp, 1);
73       if (evr)
74         id = pool_rel2id(pool, id, evr, flags, 1);
75       deps = repo_addid_dep(s->repo, deps, id, ispre ? marker : 0);
76       bp = nbp;
77     }
78   return deps;
79 }
80
81 int
82 repo_add_mdk(Repo *repo, FILE *fp, int flags)
83 {
84   Pool *pool = repo->pool;
85   Repodata *data;
86   Solvable *s;
87   char *buf;
88   int bufa, bufl;
89
90   data = repo_add_repodata(repo, flags);
91   bufa = 4096;
92   buf = solv_malloc(bufa);
93   bufl = 0;
94   s = 0;
95   while (fgets(buf + bufl, bufa - bufl, fp) > 0)
96     {
97       bufl += strlen(buf + bufl);
98       if (!bufl)
99         continue;
100       if (buf[bufl - 1] != '\n')
101         {
102           if (bufa - bufl < 256)
103             {
104               bufa += 4096;
105               buf = solv_realloc(buf, bufa);
106             }
107           continue;
108         }
109       buf[bufl - 1] = 0;
110       bufl = 0;
111       if (buf[0] != '@')
112         {
113           pool_debug(pool, SOLV_ERROR, "bad line <%s>\n", buf);
114           continue;
115         }
116       if (!s)
117         s = pool_id2solvable(pool, repo_add_solvable(repo));
118       if (!strncmp(buf + 1, "filesize@", 9))
119         repodata_set_num(data, s - pool->solvables, SOLVABLE_DOWNLOADSIZE, strtoull(buf + 10, 0, 10));
120       else if (!strncmp(buf + 1, "summary@", 8))
121         repodata_set_str(data, s - pool->solvables, SOLVABLE_SUMMARY, buf + 9);
122       else if (!strncmp(buf + 1, "provides@", 9))
123         s->provides = parse_deps(s, buf + 10, 0);
124       else if (!strncmp(buf + 1, "requires@", 9))
125         s->requires = parse_deps(s, buf + 10, SOLVABLE_PREREQMARKER);
126       else if (!strncmp(buf + 1, "recommends@", 11))
127         s->recommends = parse_deps(s, buf + 10, 0);
128       else if (!strncmp(buf + 1, "suggests@", 9))
129         s->suggests = parse_deps(s, buf + 10, 0);
130       else if (!strncmp(buf + 1, "obsoletes@", 10))
131         s->obsoletes = parse_deps(s, buf + 11, 0);
132       else if (!strncmp(buf + 1, "conflicts@", 10))
133         s->conflicts = parse_deps(s, buf + 11, 0);
134       else if (!strncmp(buf + 1, "info@", 5))
135         {
136           char *nvra = buf + 6;
137           char *epochstr;
138           char *arch;
139           char *version;
140           char *filename;
141           char *disttag = 0;
142           char *distepoch = 0;
143           if ((epochstr = strchr(nvra, '@')) != 0)
144             {
145               char *sizestr;
146               *epochstr++ = 0;
147               if ((sizestr = strchr(epochstr, '@')) != 0)
148                 {
149                   char *groupstr;
150                   *sizestr++ = 0;
151                   if ((groupstr = strchr(sizestr, '@')) != 0)
152                     {
153                       *groupstr++ = 0;
154                       if ((disttag = strchr(groupstr, '@')) != 0)
155                         {
156                           *disttag++ = 0;
157                           if ((distepoch = strchr(disttag, '@')) != 0)
158                             {
159                               char *n;
160                               *distepoch++ = 0;
161                               if ((n = strchr(distepoch, '@')) != 0)
162                                 *n = 0;
163                             }
164                         }
165                       if (*groupstr)
166                         repodata_set_poolstr(data, s - pool->solvables, SOLVABLE_GROUP, groupstr);
167                     }
168                   if (*sizestr)
169                     repodata_set_num(data, s - pool->solvables, SOLVABLE_INSTALLSIZE, strtoull(sizestr, 0, 10));
170                 }
171             }
172           filename = pool_tmpjoin(pool, nvra, ".rpm", 0);
173           arch = strrchr(nvra, '.');
174           if (arch)
175             {
176               *arch++ = 0;
177               s->arch = pool_str2id(pool, arch, 1);
178             }
179           if (disttag && *disttag)
180             {
181               /* strip disttag from release */
182               char *n = strrchr(nvra, '-');
183               if (n && !strncmp(n + 1, disttag, strlen(disttag)))
184                 *n = 0;
185             }
186           if (distepoch && *distepoch)
187             {
188               /* add distepoch */
189               int le = strlen(distepoch);
190               int ln = strlen(nvra);
191               nvra[ln++] = ':';
192               memmove(nvra + ln, distepoch, le);        /* may overlap */
193               nvra[le + ln] = 0;
194             }
195           version = strrchr(nvra, '-');
196           if (version)
197             {
198               char *release = version;
199               *release = 0;
200               version = strrchr(nvra, '-');
201               *release = '-';
202               if (!version)
203                 version = release;
204               *version++ = 0;
205             }
206           else
207             version = "";
208           s->name = pool_str2id(pool, nvra, 1);
209           if (epochstr && *epochstr && strcmp(epochstr, "0") != 0)
210             {
211               char *evr = pool_tmpjoin(pool, epochstr, ":", version);
212               s->evr = pool_str2id(pool, evr, 1);
213             }
214           else
215             s->evr = pool_str2id(pool, version, 1);
216           repodata_set_location(data, s - pool->solvables, 0, 0, filename);
217           if (s->name && s->arch != ARCH_SRC && s->arch != ARCH_NOSRC)
218             s->provides = repo_addid_dep(s->repo, s->provides, pool_rel2id(pool, s->name, s->evr, REL_EQ, 1), 0);
219           s = 0;
220         }
221       else
222         {
223           char *tagend = strchr(buf + 1, '@');
224           if (tagend)
225             *tagend = 0;
226           pool_debug(pool, SOLV_ERROR, "unknown tag <%s>\n", buf + 1);
227           continue;
228         }
229     }
230   if (s)
231     {
232       pool_debug(pool, SOLV_ERROR, "unclosed package at EOF\n");
233       repo_free_solvable(s->repo, s - pool->solvables, 1);
234     }
235   solv_free(buf);
236   if (!(flags & REPO_NO_INTERNALIZE))
237     repodata_internalize(data);
238   return 0;
239 }
240
241 enum state {
242   STATE_START,
243   STATE_MEDIA_INFO,
244   STATE_INFO,
245   STATE_FILES,
246   NUMSTATES
247 };
248
249 struct stateswitch {
250   enum state from;
251   char *ename;
252   enum state to;
253   int docontent;
254 };
255
256 /* must be sorted by first column */
257 static struct stateswitch stateswitches[] = {
258   { STATE_START, "media_info", STATE_MEDIA_INFO, 0 },
259   { STATE_MEDIA_INFO, "info", STATE_INFO, 1 },
260   { STATE_MEDIA_INFO, "files", STATE_FILES, 1 },
261   { NUMSTATES }
262 };
263
264 struct parsedata {
265   Pool *pool;
266   Repo *repo;
267   Repodata *data;
268   int depth;
269   enum state state;
270   int statedepth;
271   char *content;
272   int lcontent;
273   int acontent;
274   int docontent;
275   struct stateswitch *swtab[NUMSTATES];
276   enum state sbtab[NUMSTATES];
277   Solvable *solvable;
278   Hashtable joinhash;
279   Hashval joinhashmask;
280 };
281
282 static inline const char *
283 find_attr(const char *txt, const char **atts)
284 {
285   for (; *atts; atts += 2)
286     {
287       if (!strcmp(*atts, txt))
288         return atts[1];
289     }
290   return 0;
291 }
292
293 static Hashtable
294 joinhash_init(Repo *repo, Hashval *hmp)
295 {
296   Hashval hm = mkmask(repo->nsolvables);
297   Hashtable ht = solv_calloc(hm + 1, sizeof(*ht));
298   Hashval h, hh;
299   Solvable *s;
300   int i;
301
302   FOR_REPO_SOLVABLES(repo, i, s)
303     {
304       hh = HASHCHAIN_START;
305       h = s->name & hm;
306       while (ht[h])
307         h = HASHCHAIN_NEXT(h, hh, hm);
308       ht[h] = i;
309     }
310   *hmp = hm;
311   return ht;
312 }
313
314 static Solvable *
315 joinhash_lookup(Repo *repo, Hashtable ht, Hashval hm, const char *fn, const char *distepoch)
316 {
317   Hashval h, hh;
318   const char *p, *vrstart, *vrend;
319   Id name, arch;
320
321   if (!fn || !*fn)
322     return 0;
323   if (distepoch && !*distepoch)
324     distepoch = 0;
325   p = fn + strlen(fn);
326   while (--p > fn)
327     if (*p == '.')
328       break;
329   if (p == fn)
330     return 0;
331   arch = pool_str2id(repo->pool, p + 1, 0);
332   if (!arch)
333     return 0;
334   if (distepoch)
335     {
336       while (--p > fn)
337         if (*p == '-')
338           break;
339       if (p == fn)
340         return 0;
341     }
342   vrend = p;
343   while (--p > fn)
344     if (*p == '-')
345       break;
346   if (p == fn)
347     return 0;
348   while (--p > fn)
349     if (*p == '-')
350       break;
351   if (p == fn)
352     return 0;
353   vrstart = p + 1;
354   name = pool_strn2id(repo->pool, fn, p - fn, 0);
355   if (!name)
356     return 0;
357   hh = HASHCHAIN_START;
358   h = name & hm;
359   while (ht[h])
360     {
361       Solvable *s = repo->pool->solvables + ht[h];
362       if (s->name == name && s->arch == arch)
363         {
364           /* too bad we don't know the epoch... */
365           const char *evr = pool_id2str(repo->pool, s->evr);
366           for (p = evr; *p >= '0' && *p <= '9'; p++)
367             ;
368           if (p > evr && *p == ':')
369             evr = p + 1;
370           if (distepoch)
371             {
372               if (!strncmp(evr, vrstart, vrend - vrstart) && evr[vrend - vrstart] == ':' && !strcmp(distepoch, evr + (vrend - vrstart + 1)))
373                 return s;
374             }
375           else if (!strncmp(evr, vrstart, vrend - vrstart) && evr[vrend - vrstart] == 0)
376             return s;
377         }
378       h = HASHCHAIN_NEXT(h, hh, hm);
379     }
380   return 0;
381 }
382
383 static void XMLCALL
384 startElement(void *userData, const char *name, const char **atts)
385 {
386   struct parsedata *pd = userData;
387   Pool *pool = pd->pool;
388   struct stateswitch *sw;
389
390   if (pd->depth != pd->statedepth)
391     {
392       pd->depth++;
393       return;
394     }
395   pd->depth++;
396   if (!pd->swtab[pd->state])
397     return;
398   for (sw = pd->swtab[pd->state]; sw->from == pd->state; sw++)
399     if (!strcmp(sw->ename, name))
400       break;
401   if (sw->from != pd->state)
402     return;
403   pd->state = sw->to;
404   pd->docontent = sw->docontent;
405   pd->statedepth = pd->depth;
406   pd->lcontent = 0;
407   *pd->content = 0;
408   switch (pd->state)
409     {
410     case STATE_INFO:
411       {
412         const char *fn = find_attr("fn", atts);
413         const char *distepoch = find_attr("distepoch", atts);
414         const char *str;
415         pd->solvable = joinhash_lookup(pd->repo, pd->joinhash, pd->joinhashmask, fn, distepoch);
416         if (!pd->solvable)
417           break;
418         str = find_attr("url", atts);
419         if (str && *str)
420           repodata_set_str(pd->data, pd->solvable - pool->solvables, SOLVABLE_URL, str);
421         str = find_attr("license", atts);
422         if (str && *str)
423           repodata_set_poolstr(pd->data, pd->solvable - pool->solvables, SOLVABLE_LICENSE, str);
424         str = find_attr("sourcerpm", atts);
425         if (str && *str)
426           repodata_set_sourcepkg(pd->data, pd->solvable - pool->solvables, str);
427         break;
428       }
429     case STATE_FILES:
430       {
431         const char *fn = find_attr("fn", atts);
432         const char *distepoch = find_attr("distepoch", atts);
433         pd->solvable = joinhash_lookup(pd->repo, pd->joinhash, pd->joinhashmask, fn, distepoch);
434         break;
435       }
436     default:
437       break;
438     }
439 }
440
441 static void XMLCALL
442 endElement(void *userData, const char *name)
443 {
444   struct parsedata *pd = userData;
445   Solvable *s = pd->solvable;
446   if (pd->depth != pd->statedepth)
447     {
448       pd->depth--;
449       return;
450     }
451   pd->depth--;
452   pd->statedepth--;
453   switch (pd->state)
454     {
455     case STATE_INFO:
456       if (s && *pd->content)
457         repodata_set_str(pd->data, s - pd->pool->solvables, SOLVABLE_DESCRIPTION, pd->content);
458       break;
459     case STATE_FILES:
460       if (s && *pd->content)
461         {
462           char *np, *p, *sl;
463           for (p = pd->content; p && *p; p = np)
464             {
465               Id id;
466               np = strchr(p, '\n');
467               if (np)
468                 *np++ = 0;
469               if (!*p)
470                 continue;
471               sl = strrchr(p, '/');
472               if (sl)
473                 {
474                   *sl++ = 0;
475                   id = repodata_str2dir(pd->data, p, 1);
476                 }
477               else
478                 {
479                   sl = p;
480                   id = 0;
481                 }
482               if (!id)
483                 id = repodata_str2dir(pd->data, "/", 1);
484               repodata_add_dirstr(pd->data, s - pd->pool->solvables, SOLVABLE_FILELIST, id, sl);
485             }
486         }
487       break;
488     default:
489       break;
490     }
491   pd->state = pd->sbtab[pd->state];
492   pd->docontent = 0;
493 }
494
495 static void XMLCALL
496 characterData(void *userData, const XML_Char *s, int len)
497 {
498   struct parsedata *pd = userData;
499   int l;
500   char *c;
501   if (!pd->docontent)
502     return;
503   l = pd->lcontent + len + 1;
504   if (l > pd->acontent)
505     {
506       pd->content = solv_realloc(pd->content, l + 256);
507       pd->acontent = l + 256;
508     }
509   c = pd->content + pd->lcontent;
510   pd->lcontent += len;
511   while (len-- > 0)
512     *c++ = *s++;
513   *c = 0;
514 }
515
516 #define BUFF_SIZE 8192
517
518 int
519 repo_add_mdk_info(Repo *repo, FILE *fp, int flags)
520 {
521   Repodata *data;
522   struct parsedata pd;
523   char buf[BUFF_SIZE];
524   int i, l;
525   struct stateswitch *sw;
526   XML_Parser parser;
527
528   if (!(flags & REPO_EXTEND_SOLVABLES))
529     {
530       pool_debug(repo->pool, SOLV_ERROR, "repo_add_mdk_info: can only extend existing solvables\n");
531       return -1;
532     }
533
534   data = repo_add_repodata(repo, flags);
535
536   memset(&pd, 0, sizeof(pd));
537   pd.repo = repo;
538   pd.pool = repo->pool;
539   pd.data = data;
540
541   pd.content = solv_malloc(256);
542   pd.acontent = 256;
543
544   pd.joinhash = joinhash_init(repo, &pd.joinhashmask);
545
546   for (i = 0, sw = stateswitches; sw->from != NUMSTATES; i++, sw++)
547     {
548       if (!pd.swtab[sw->from])
549         pd.swtab[sw->from] = sw;
550       pd.sbtab[sw->to] = sw->from;
551     }
552
553   parser = XML_ParserCreate(NULL);
554   XML_SetUserData(parser, &pd);
555   XML_SetElementHandler(parser, startElement, endElement);
556   XML_SetCharacterDataHandler(parser, characterData);
557   for (;;)
558     {
559       l = fread(buf, 1, sizeof(buf), fp);
560       if (XML_Parse(parser, buf, l, l == 0) == XML_STATUS_ERROR)
561         {
562           pool_debug(pd.pool, SOLV_ERROR, "%s at line %u:%u\n", XML_ErrorString(XML_GetErrorCode(parser)), (unsigned int)XML_GetCurrentLineNumber(parser), (unsigned int)XML_GetCurrentColumnNumber(parser));
563           break;
564         }
565       if (l == 0)
566         break;
567     }
568   XML_ParserFree(parser);
569   solv_free(pd.content);
570   solv_free(pd.joinhash);
571   if (!(flags & REPO_NO_INTERNALIZE))
572     repodata_internalize(data);
573   return 0;
574 }