Also split sequence_info of deltarpms.
[platform/upstream/libsolv.git] / tools / repo_patchxml.c
1 /*
2  * Copyright (c) 2007, Novell Inc.
3  *
4  * This program is licensed under the BSD license, read LICENSE.BSD
5  * for further information
6  */
7
8 #include <sys/types.h>
9 #include <limits.h>
10 #include <fcntl.h>
11 #include <stdio.h>
12 #include <stdlib.h>
13 #include <string.h>
14 #include <expat.h>
15
16 #include "pool.h"
17 #include "repo.h"
18 #include "repo_patchxml.h"
19 #include "repo_rpmmd.h"
20
21 //#define TESTMM
22
23 enum state {
24   STATE_START,
25   STATE_PATCH,
26   STATE_ATOM,
27   STATE_NAME,
28   STATE_ARCH,
29   STATE_VERSION,
30   STATE_PKGFILES,
31   STATE_DELTARPM,
32   STATE_DLOCATION,
33   STATE_DCHECKSUM,
34   STATE_DTIME,
35   STATE_DSIZE,
36   STATE_DBASEVERSION,
37   STATE_REQUIRES,
38   STATE_REQUIRESENTRY,
39   STATE_PROVIDES,
40   STATE_PROVIDESENTRY,
41   STATE_OBSOLETES,
42   STATE_OBSOLETESENTRY,
43   STATE_CONFLICTS,
44   STATE_CONFLICTSENTRY,
45   STATE_RECOMMENDS,
46   STATE_RECOMMENDSENTRY,
47   STATE_SUPPLEMENTS,
48   STATE_SUPPLEMENTSENTRY,
49   STATE_SUGGESTS,
50   STATE_SUGGESTSENTRY,
51   STATE_ENHANCES,
52   STATE_ENHANCESENTRY,
53   STATE_FRESHENS,
54   STATE_FRESHENSENTRY,
55   NUMSTATES
56 };
57
58
59 struct stateswitch {
60   enum state from;
61   char *ename;
62   enum state to;
63   int docontent;
64 };
65
66 static struct stateswitch stateswitches[] = {
67   { STATE_START,       "patch",           STATE_PATCH, 0 },
68   { STATE_START,       "package",         STATE_ATOM, 0 },
69   { STATE_START,       "patches",         STATE_START, 0},
70   { STATE_PATCH,       "yum:name",        STATE_NAME, 1 },
71   { STATE_PATCH,       "yum:arch",        STATE_ARCH, 1 },
72   { STATE_PATCH,       "yum:version",     STATE_VERSION, 0 },
73   { STATE_PATCH,       "name",            STATE_NAME, 1 },
74   { STATE_PATCH,       "arch",            STATE_ARCH, 1 },
75   { STATE_PATCH,       "version",         STATE_VERSION, 0 },
76   { STATE_PATCH,       "rpm:requires",    STATE_REQUIRES, 0 },
77   { STATE_PATCH,       "rpm:provides",    STATE_PROVIDES, 0 },
78   { STATE_PATCH,       "rpm:requires",    STATE_REQUIRES, 0 },
79   { STATE_PATCH,       "rpm:obsoletes",   STATE_OBSOLETES , 0 },
80   { STATE_PATCH,       "rpm:conflicts",   STATE_CONFLICTS , 0 },
81   { STATE_PATCH,       "rpm:recommends" , STATE_RECOMMENDS , 0 },
82   { STATE_PATCH,       "rpm:supplements", STATE_SUPPLEMENTS, 0 },
83   { STATE_PATCH,       "rpm:suggests",    STATE_SUGGESTS, 0 },
84   { STATE_PATCH,       "rpm:enhances",    STATE_ENHANCES, 0 },
85   { STATE_PATCH,       "rpm:freshens",    STATE_FRESHENS, 0 },
86   { STATE_PATCH,       "suse:freshens",   STATE_FRESHENS, 0 },
87   { STATE_PATCH,       "atoms",           STATE_START, 0 },
88   { STATE_PATCH,       "pkgfiles",        STATE_PKGFILES, 0 },
89   { STATE_PKGFILES,    "deltarpm",        STATE_DELTARPM, 0 },
90   { STATE_PKGFILES,    "patchrpm",        STATE_DELTARPM, 0 },
91   { STATE_DELTARPM,    "location",        STATE_DLOCATION, 0 },
92   { STATE_DELTARPM,    "checksum",        STATE_DCHECKSUM, 1 },
93   { STATE_DELTARPM,    "time",            STATE_DTIME, 0 },
94   { STATE_DELTARPM,    "size",            STATE_DSIZE, 0 },
95   { STATE_DELTARPM,    "base-version",    STATE_DBASEVERSION, 0 },
96   { STATE_PROVIDES,    "rpm:entry",       STATE_PROVIDESENTRY, 0 },
97   { STATE_REQUIRES,    "rpm:entry",       STATE_REQUIRESENTRY, 0 },
98   { STATE_OBSOLETES,   "rpm:entry",       STATE_OBSOLETESENTRY, 0 },
99   { STATE_CONFLICTS,   "rpm:entry",       STATE_CONFLICTSENTRY, 0 },
100   { STATE_RECOMMENDS,  "rpm:entry",       STATE_RECOMMENDSENTRY, 0 },
101   { STATE_SUPPLEMENTS, "rpm:entry",       STATE_SUPPLEMENTSENTRY, 0 },
102   { STATE_SUGGESTS,    "rpm:entry",       STATE_SUGGESTSENTRY, 0 },
103   { STATE_ENHANCES,    "rpm:entry",       STATE_ENHANCESENTRY, 0 },
104   { STATE_FRESHENS,    "rpm:entry",       STATE_FRESHENSENTRY, 0 },
105   { STATE_FRESHENS,    "suse:entry",      STATE_FRESHENSENTRY, 0 },
106   { NUMSTATES}
107 };
108
109 /* Cumulated info about the current deltarpm or patchrpm */
110 struct deltarpm {
111   Id locdir;
112   Id locname;
113   Id locevr;
114   Id locsuffix;
115   unsigned buildtime;
116   unsigned downloadsize, archivesize;
117   char *filechecksum;
118   /* Baseversions.  deltarpm only has one, patchrpm may have more.  */
119   Id *bevr;
120   unsigned nbevr;
121   /* If deltarpm, then this is filled.  */
122   Id seqname;
123   Id seqevr;
124   char *seqnum;
125 };
126
127 struct parsedata {
128   int depth;
129   enum state state;
130   int statedepth;
131   char *content;
132   int lcontent;
133   int acontent;
134   int docontent;
135   Pool *pool;
136   Repo *repo;
137   Solvable *solvable;
138   char *kind;
139
140   struct stateswitch *swtab[NUMSTATES];
141   enum state sbtab[NUMSTATES];
142   char *tempstr;
143   int ltemp;
144   int atemp;
145   struct deltarpm delta;
146 };
147
148 static void
149 append_str(struct parsedata *pd, const char *s)
150 {
151   if (!s)
152     return;
153   int l = pd->ltemp + strlen(s) + 1;
154   if (l > pd->atemp)
155     {
156       pd->tempstr = realloc(pd->tempstr, l + 256);
157       pd->atemp = l + 256;
158     }
159   strcpy(pd->tempstr + pd->ltemp, s);
160   pd->ltemp += strlen(s);
161 }
162
163 static Id
164 makeevr_atts(Pool *pool, struct parsedata *pd, const char **atts)
165 {
166   const char *e, *v, *r, *v2;
167   char *c;
168   int l;
169
170   e = v = r = 0;
171   for (; *atts; atts += 2)
172     {
173       if (!strcmp(*atts, "epoch"))
174         e = atts[1];
175       else if (!strcmp(*atts, "ver"))
176         v = atts[1];
177       else if (!strcmp(*atts, "rel"))
178         r = atts[1];
179     }
180   if (e && !strcmp(e, "0"))
181     e = 0;
182   if (v && !e)
183     {
184       for (v2 = v; *v2 >= '0' && *v2 <= '9'; v2++)
185         ;
186       if (v2 > v && *v2 == ':')
187         e = "0";
188     }
189   l = 1;
190   if (e)
191     l += strlen(e) + 1;
192   if (v)
193     l += strlen(v);
194   if (r)
195     l += strlen(r) + 1;
196   if (l > pd->acontent)
197     {
198       pd->content = realloc(pd->content, l + 256);
199       pd->acontent = l + 256;
200     }
201   c = pd->content;
202   if (e)
203     {
204       strcpy(c, e);
205       c += strlen(c);
206       *c++ = ':';
207     }
208   if (v)
209     {
210       strcpy(c, v);
211       c += strlen(c);
212     }
213   if (r)
214     {
215       *c++ = '-';
216       strcpy(c, r);
217       c += strlen(c);
218     }
219   *c = 0;
220   if (!*pd->content)
221     return 0;
222 #if 0
223   fprintf(stderr, "evr: %s\n", pd->content);
224 #endif
225   return str2id(pool, pd->content, 1);
226 }
227
228 static const char *
229 find_attr(const char *txt, const char **atts)
230 {
231   for (; *atts; atts += 2)
232     {
233       if (!strcmp(*atts, txt))
234         return atts[1];
235     }
236   return 0;
237 }
238
239 static char *flagtab[] = {
240   "GT",
241   "EQ",
242   "GE",
243   "LT",
244   "NE",
245   "LE"
246 };
247
248 static unsigned int
249 adddep(Pool *pool, struct parsedata *pd, unsigned int olddeps, const char **atts, int isreq)
250 {
251   Id id, name, marker;
252   const char *n, *f, *k;
253   const char **a;
254
255   n = f = k = 0;
256   marker = isreq ? -SOLVABLE_PREREQMARKER : 0;
257   for (a = atts; *a; a += 2)
258     {
259       if (!strcmp(*a, "name"))
260         n = a[1];
261       else if (!strcmp(*a, "flags"))
262         f = a[1];
263       else if (!strcmp(*a, "kind"))
264         k = a[1];
265       else if (isreq && !strcmp(*a, "pre") && a[1][0] == '1')
266         marker = SOLVABLE_PREREQMARKER;
267     }
268   if (!n)
269     return olddeps;
270   if (k && !strcmp(k, "package"))
271     k = 0;
272   if (k)
273     {
274       int l = strlen(k) + 1 + strlen(n) + 1;
275       if (l > pd->acontent)
276         {
277           pd->content = realloc(pd->content, l + 256);
278           pd->acontent = l + 256;
279         }
280       sprintf(pd->content, "%s:%s", k, n); 
281       name = str2id(pool, pd->content, 1); 
282     }
283   else
284     name = str2id(pool, (char *)n, 1);
285   if (f)
286     {
287       Id evr = makeevr_atts(pool, pd, atts);
288       int flags;
289       for (flags = 0; flags < 6; flags++)
290         if (!strcmp(f, flagtab[flags]))
291           break;
292       flags = flags < 6 ? flags + 1 : 0;
293       id = rel2id(pool, name, evr, flags, 1);
294     }
295   else
296     id = name;
297 #if 0
298   fprintf(stderr, "new dep %s%s%s\n", id2str(pool, d), id2rel(pool, d), id2evr(pool, d));
299 #endif
300   return repo_addid_dep(pd->repo, olddeps, id, marker);
301 }
302
303
304 static void XMLCALL
305 startElement(void *userData, const char *name, const char **atts)
306 {
307   struct parsedata *pd = userData;
308   Pool *pool = pd->pool;
309   Solvable *s = pd->solvable;
310   struct stateswitch *sw;
311   const char *str;
312
313   if (pd->depth != pd->statedepth)
314     {
315       pd->depth++;
316       return;
317     }
318
319   if (pd->state == STATE_PATCH && !strcmp(name, "format"))
320     return;
321
322   pd->depth++;
323   for (sw = pd->swtab[pd->state]; sw->from == pd->state; sw++)
324     if (!strcmp(sw->ename, name))
325       break;
326   if (sw->from != pd->state)
327     {
328 #if 0
329       fprintf(stderr, "into unknown: %s\n", name);
330 #endif
331       return;
332     }
333   pd->state = sw->to;
334   pd->docontent = sw->docontent;
335   pd->statedepth = pd->depth;
336   pd->lcontent = 0;
337   *pd->content = 0;
338   switch(pd->state)
339     {
340     case STATE_NAME:
341       if (pd->kind)
342         {
343           strcpy(pd->content, pd->kind);
344           pd->lcontent = strlen(pd->content);
345           pd->content[pd->lcontent++] = ':';
346           pd->content[pd->lcontent] = 0;
347         }
348       break;
349     case STATE_PATCH:
350     case STATE_ATOM:
351       if (pd->state == STATE_ATOM)
352         {
353           /* HACK: close patch */
354           if (pd->kind && !strcmp(pd->kind, "patch"))
355             {
356               if (!s->arch)
357                 s->arch = ARCH_NOARCH;
358               s->provides = repo_addid_dep(pd->repo, s->provides, rel2id(pool, s->name, s->evr, REL_EQ, 1), 0);
359             }
360           pd->kind = "atom";
361           pd->state = STATE_PATCH;
362         }
363       else
364         pd->kind = "patch";
365       
366       pd->solvable = pool_id2solvable(pool, repo_add_solvable(pd->repo));
367 #if 0
368       fprintf(stderr, "package #%d\n", pd->solvable - pool->solvables);
369 #endif
370       break;
371     case STATE_DELTARPM:
372       memset(&pd->delta, 0, sizeof (pd->delta));
373       *pd->tempstr = 0;
374       pd->ltemp = 0;
375       break;
376     case STATE_DLOCATION:
377       if ((str = find_attr("href", atts)))
378         {
379           /* Separate the filename into its different parts.
380              rpm/x86_64/alsa-1.0.14-31_31.2.x86_64.delta.rpm
381              --> dir = rpm/x86_64
382                  name = alsa
383                  evr = 1.0.14-31_31.2
384                  suffix = x86_64.delta.rpm.  */
385           char *real_str = strdup(str);
386           char *s = real_str;
387           char *s1, *s2;
388           s1 = strrchr (s, '/');
389           if (s1)
390             {
391               pd->delta.locdir = strn2id(pool, s, s1 - s, 1);
392               s = s1 + 1;
393             }
394           /* Guess suffix.  */
395           s1 = strrchr (s, '.');
396           if (s1)
397             {
398               for (s2 = s1 - 1; s2 > s; s2--)
399                 if (*s2 == '.')
400                   break;
401               if (!strcmp (s2, ".delta.rpm") || !strcmp (s2, ".patch.rpm"))
402                 {
403                   s1 = s2;
404                   /* We accept one more item as suffix.  */
405                   for (s2 = s1 - 1; s2 > s; s2--)
406                     if (*s2 == '.')
407                       break;
408                   s1 = s2;
409                 }
410               if (*s1 == '.')
411                 *s1++ = 0;
412               pd->delta.locsuffix = str2id(pool, s1, 1); 
413             }
414           /* Last '-'.  */
415           s1 = strrchr (s, '-');
416           if (s1)
417             {
418               /* Second to last '-'.  */
419               for (s2 = s1 - 1; s2 > s; s2--)
420                 if (*s2 == '-')
421                   break;
422             }
423           else
424             s2 = 0;
425           if (s2 > s && *s2 == '-')
426             {
427               *s2++ = 0;
428               pd->delta.locevr = str2id(pool, s2, 1);
429             }
430           pd->delta.locname = str2id(pool, s, 1);
431           free(real_str);
432         }
433       break;
434     case STATE_DTIME:
435       str = find_attr("build", atts);
436       if (str)
437         pd->delta.buildtime = atoi(str);
438       break;
439     case STATE_DSIZE:
440       if ((str = find_attr("package", atts)))
441         pd->delta.downloadsize = atoi(str);
442       if ((str = find_attr("archive", atts)))
443         pd->delta.archivesize = atoi(str);
444       break;
445     case STATE_DBASEVERSION:
446       if ((str = find_attr("sequence_info", atts)))
447         {
448           const char *s1, *s2;
449           s1 = strrchr(str, '-');
450           if (s1)
451             {
452               for (s2 = s1 - 1; s2 > str; s2--)
453                 if (*s2 == '-')
454                   break;
455               if (*s2 == '-')
456                 {
457                   for (s2 = s2 - 1; s2 > str; s2--)
458                     if (*s2 == '-')
459                       break;
460                   if (*s2 == '-')
461                     {
462                       pd->delta.seqevr = strn2id(pool, s2 + 1, s1 - s2 - 1, 1);
463                       pd->delta.seqname = strn2id(pool, str, s2 - str, 1);
464                       str = s1 + 1;
465                     }
466                 }
467             }
468           pd->delta.seqnum = strdup(str);
469         }
470       pd->delta.nbevr++;
471       pd->delta.bevr = sat_realloc (pd->delta.bevr, pd->delta.nbevr * sizeof(Id));
472       pd->delta.bevr[pd->delta.nbevr - 1] = makeevr_atts(pool, pd, atts);
473       break;
474     case STATE_VERSION:
475       s->evr = makeevr_atts(pool, pd, atts);
476       break;
477     case STATE_PROVIDES:
478       s->provides = 0;
479       break;
480     case STATE_PROVIDESENTRY:
481       s->provides = adddep(pool, pd, s->provides, atts, 0);
482       break;
483     case STATE_REQUIRES:
484       s->requires = 0;
485       break;
486     case STATE_REQUIRESENTRY:
487       s->requires = adddep(pool, pd, s->requires, atts, 1);
488       break;
489     case STATE_OBSOLETES:
490       s->obsoletes = 0;
491       break;
492     case STATE_OBSOLETESENTRY:
493       s->obsoletes = adddep(pool, pd, s->obsoletes, atts, 0);
494       break;
495     case STATE_CONFLICTS:
496       s->conflicts = 0;
497       break;
498     case STATE_CONFLICTSENTRY:
499       s->conflicts = adddep(pool, pd, s->conflicts, atts, 0);
500       break;
501     case STATE_RECOMMENDS:
502       s->recommends = 0;
503       break;
504     case STATE_RECOMMENDSENTRY:
505       s->recommends = adddep(pool, pd, s->recommends, atts, 0);
506       break;
507     case STATE_SUPPLEMENTS:
508       s->supplements= 0;
509       break;
510     case STATE_SUPPLEMENTSENTRY:
511       s->supplements = adddep(pool, pd, s->supplements, atts, 0);
512       break;
513     case STATE_SUGGESTS:
514       s->suggests = 0;
515       break;
516     case STATE_SUGGESTSENTRY:
517       s->suggests = adddep(pool, pd, s->suggests, atts, 0);
518       break;
519     case STATE_ENHANCES:
520       s->enhances = 0;
521       break;
522     case STATE_ENHANCESENTRY:
523       s->enhances = adddep(pool, pd, s->enhances, atts, 0);
524       break;
525     case STATE_FRESHENS:
526       s->freshens = 0;
527       break;
528     case STATE_FRESHENSENTRY:
529       s->freshens = adddep(pool, pd, s->freshens, atts, 0);
530       break;
531     default:
532       break;
533     }
534 }
535
536 static void XMLCALL
537 endElement(void *userData, const char *name)
538 {
539   struct parsedata *pd = userData;
540   Pool *pool = pd->pool;
541   Solvable *s = pd->solvable;
542
543   if (pd->depth != pd->statedepth)
544     {
545       pd->depth--;
546       // printf("back from unknown %d %d %d\n", pd->state, pd->depth, pd->statedepth);
547       return;
548     }
549
550   if (pd->state == STATE_PATCH && !strcmp(name, "format"))
551     return;
552
553   pd->depth--;
554   pd->statedepth--;
555   switch (pd->state)
556     {
557     case STATE_PATCH:
558       if (!strcmp(name, "patch") && strcmp(pd->kind, "patch"))
559         break;  /* already closed */
560       if (!s->arch)
561         s->arch = ARCH_NOARCH;
562       if (s->arch != ARCH_SRC && s->arch != ARCH_NOSRC)
563         s->provides = repo_addid_dep(pd->repo, s->provides, rel2id(pool, s->name, s->evr, REL_EQ, 1), 0);
564       s->supplements = repo_fix_legacy(pd->repo, s->provides, s->supplements);
565       break;
566     case STATE_NAME:
567       s->name = str2id(pool, pd->content, 1);
568       break;
569     case STATE_ARCH:
570       s->arch = str2id(pool, pd->content, 1);
571       break;
572     case STATE_DELTARPM:
573 #ifdef TESTMM
574       {
575         int i;
576         struct deltarpm *d = &pd->delta;
577         fprintf (stderr, "found deltarpm for %s:\n", id2str(pool, s->name));
578         fprintf (stderr, "   loc: %s %s %s %s\n", id2str(pool, d->locdir),
579                  id2str(pool, d->locname), id2str(pool, d->locevr),
580                  id2str(pool, d->locsuffix));
581         fprintf (stderr, "  time: %u\n", d->buildtime);
582         fprintf (stderr, "  size: %d down, %d archive\n", d->downloadsize,
583                  d->archivesize);
584         fprintf (stderr, "  chek: %s\n", d->filechecksum);
585         if (d->seqnum)
586           {
587             fprintf (stderr, "  base: %s, seq: %s %s %s\n",
588                      id2str(pool, d->bevr[0]), id2str(pool, d->seqname),
589                      id2str(pool, d->seqevr), d->seqnum);
590             if (d->seqevr != d->bevr[0])
591               fprintf (stderr, "XXXXX evr\n");
592             /* Name of package ("atom:xxxx") should match the sequence info
593                name.  */
594             if (strcmp(id2str(pool, d->seqname), id2str(pool, s->name) + 5))
595               fprintf (stderr, "XXXXX name\n");
596           }
597         else
598           {
599             fprintf (stderr, "  base:");
600             for (i = 0; i < d->nbevr; i++)
601               fprintf (stderr, " %s", id2str(pool, d->bevr[i]));
602             fprintf (stderr, "\n");
603           }
604       }
605 #endif
606       free(pd->delta.filechecksum);
607       free(pd->delta.bevr);
608       free(pd->delta.seqnum);
609       break;
610     case STATE_DCHECKSUM:
611       pd->delta.filechecksum = strdup(pd->content);
612       break;
613     default:
614       break;
615     }
616   pd->state = pd->sbtab[pd->state];
617   pd->docontent = 0;
618   // printf("back from known %d %d %d\n", pd->state, pd->depth, pd->statedepth);
619 }
620
621 static void XMLCALL
622 characterData(void *userData, const XML_Char *s, int len)
623 {
624   struct parsedata *pd = userData;
625   int l;
626   char *c;
627
628   if (!pd->docontent)
629     return;
630   l = pd->lcontent + len + 1;
631   if (l > pd->acontent)
632     {
633       pd->content = realloc(pd->content, l + 256);
634       pd->acontent = l + 256;
635     }
636   c = pd->content + pd->lcontent;
637   pd->lcontent += len;
638   while (len-- > 0)
639     *c++ = *s++;
640   *c = 0;
641 }
642
643
644 #define BUFF_SIZE 8192
645
646 void
647 repo_add_patchxml(Repo *repo, FILE *fp, int flags)
648 {
649   Pool *pool = repo->pool;
650   struct parsedata pd;
651   char buf[BUFF_SIZE];
652   int i, l;
653   struct stateswitch *sw;
654
655   memset(&pd, 0, sizeof(pd));
656   for (i = 0, sw = stateswitches; sw->from != NUMSTATES; i++, sw++)
657     {
658       if (!pd.swtab[sw->from])
659         pd.swtab[sw->from] = sw;
660       pd.sbtab[sw->to] = sw->from;
661     }
662   pd.pool = pool;
663   pd.repo = repo;
664   pd.content = malloc(256);
665   pd.acontent = 256;
666   pd.lcontent = 0;
667   pd.tempstr = malloc(256);
668   pd.atemp = 256;
669   pd.ltemp = 0;
670   XML_Parser parser = XML_ParserCreate(NULL);
671   XML_SetUserData(parser, &pd);
672   XML_SetElementHandler(parser, startElement, endElement);
673   XML_SetCharacterDataHandler(parser, characterData);
674   for (;;)
675     {
676       l = fread(buf, 1, sizeof(buf), fp);
677       if (XML_Parse(parser, buf, l, l == 0) == XML_STATUS_ERROR)
678         {
679           fprintf(stderr, "repo_patchxml: %s at line %u\n", XML_ErrorString(XML_GetErrorCode(parser)), (unsigned int)XML_GetCurrentLineNumber(parser));
680           exit(1);
681         }
682       if (l == 0)
683         break;
684     }
685   XML_ParserFree(parser);
686
687   free(pd.content);
688 }