add repodata_set_deltalocation and use it in the parsers
[platform/upstream/libsolv.git] / ext / repo_deltainfoxml.c
1 /*
2  * Copyright (c) 2007, Novell Inc.
3  *
4  * This program is licensed under the BSD license, read LICENSE.BSD
5  * for further information
6  */
7
8 #define DO_ARRAY 1
9
10 #define _GNU_SOURCE
11 #include <sys/types.h>
12 #include <limits.h>
13 #include <fcntl.h>
14 #include <stdio.h>
15 #include <stdlib.h>
16 #include <string.h>
17 #include <expat.h>
18
19 #include "pool.h"
20 #include "repo.h"
21 #include "chksum.h"
22 #include "repo_deltainfoxml.h"
23
24 /*
25  * <deltainfo>
26  *   <newpackage name="libtool" epoch="0" version="1.5.24" release="6.fc9" arch="i386">
27  *     <delta oldepoch="0" oldversion="1.5.24" oldrelease="3.fc8">
28  *       <filename>DRPMS/libtool-1.5.24-3.fc8_1.5.24-6.fc9.i386.drpm</filename>
29  *       <sequence>libtool-1.5.24-3.fc8-d3571f98b048b1a870e40241bb46c67ab4</sequence>
30  *       <size>22452</size>
31  *       <checksum type="sha">8f05394695dee9399c204614e21e5f6848990ab7</checksum>
32  *     </delta>
33  *     <delta oldepoch="0" oldversion="1.5.22" oldrelease="11.fc7">
34  *       <filename>DRPMS/libtool-1.5.22-11.fc7_1.5.24-6.fc9.i386.drpm</filename>
35  *        <sequence>libtool-1.5.22-11.fc7-e82691677eee1e83b4812572c5c9ce8eb</sequence>
36  *        <size>110362</size>
37  *        <checksum type="sha">326658fee45c0baec1e70231046dbaf560f941ce</checksum>
38  *      </delta>
39  *    </newpackage>
40  *  </deltainfo>
41  */
42
43 enum state {
44   STATE_START,
45   STATE_NEWPACKAGE,     /* 1 */
46   STATE_DELTA,          /* 2 */
47   STATE_FILENAME,       /* 3 */
48   STATE_SEQUENCE,       /* 4 */
49   STATE_SIZE,           /* 5 */
50   STATE_CHECKSUM,       /* 6 */
51   STATE_LOCATION,       /* 7 */
52   NUMSTATES
53 };
54
55 struct stateswitch {
56   enum state from;
57   char *ename;
58   enum state to;
59   int docontent;
60 };
61
62 /* !! must be sorted by first column !! */
63 static struct stateswitch stateswitches[] = {
64   /* compatibility with old yum-presto */
65   { STATE_START,       "prestodelta",     STATE_START, 0 },
66   { STATE_START,       "deltainfo",       STATE_START, 0 },
67   { STATE_START,       "newpackage",      STATE_NEWPACKAGE,  0 },
68   { STATE_NEWPACKAGE,  "delta",           STATE_DELTA,       0 },
69   /* compatibility with yum-presto */
70   { STATE_DELTA,       "filename",        STATE_FILENAME,    1 },
71   { STATE_DELTA,       "location",        STATE_LOCATION,    0 },
72   { STATE_DELTA,       "sequence",        STATE_SEQUENCE,    1 },
73   { STATE_DELTA,       "size",            STATE_SIZE,        1 },
74   { STATE_DELTA,       "checksum",        STATE_CHECKSUM,    1 },
75   { NUMSTATES }
76 };
77
78 /* Cumulated info about the current deltarpm or patchrpm */
79 struct deltarpm {
80   char *location;
81   unsigned int buildtime;
82   unsigned long long downloadsize;
83   char *filechecksum;
84   int filechecksumtype;
85   /* Baseversion.  deltarpm only has one. */
86   Id *bevr;
87   unsigned nbevr;
88   Id seqname;
89   Id seqevr;
90   char *seqnum;
91 };
92
93 struct parsedata {
94   int ret;
95   int depth;
96   enum state state;
97   int statedepth;
98   char *content;
99   int lcontent;
100   int acontent;
101   int docontent;
102   Pool *pool;
103   Repo *repo;
104   Repodata *data;
105
106   struct stateswitch *swtab[NUMSTATES];
107   enum state sbtab[NUMSTATES];
108   struct deltarpm delta;
109   Id newpkgevr;
110   Id newpkgname;
111   Id newpkgarch;
112
113   Id *handles;
114   int nhandles;
115 };
116
117 /*
118  * find attribute
119  */
120
121 static const char *
122 find_attr(const char *txt, const char **atts)
123 {
124   for (; *atts; atts += 2)
125     {
126       if (!strcmp(*atts, txt))
127         return atts[1];
128     }
129   return 0;
130 }
131
132
133 /*
134  * create evr (as Id) from 'epoch', 'version' and 'release' attributes
135  */
136
137 static Id
138 makeevr_atts(Pool *pool, struct parsedata *pd, const char **atts)
139 {
140   const char *e, *v, *r, *v2;
141   char *c;
142   int l;
143
144   e = v = r = 0;
145   for (; *atts; atts += 2)
146     {
147       if (!strcmp(*atts, "oldepoch"))
148         e = atts[1];
149       else if (!strcmp(*atts, "epoch"))
150         e = atts[1];
151       else if (!strcmp(*atts, "version"))
152         v = atts[1];
153       else if (!strcmp(*atts, "oldversion"))
154         v = atts[1];
155       else if (!strcmp(*atts, "release"))
156         r = atts[1];
157       else if (!strcmp(*atts, "oldrelease"))
158         r = atts[1];
159     }
160   if (e && !strcmp(e, "0"))
161     e = 0;
162   if (v && !e)
163     {
164       for (v2 = v; *v2 >= '0' && *v2 <= '9'; v2++)
165         ;
166       if (v2 > v && *v2 == ':')
167         e = "0";
168     }
169   l = 1;
170   if (e)
171     l += strlen(e) + 1;
172   if (v)
173     l += strlen(v);
174   if (r)
175     l += strlen(r) + 1;
176   if (l > pd->acontent)
177     {
178       pd->content = solv_realloc(pd->content, l + 256);
179       pd->acontent = l + 256;
180     }
181   c = pd->content;
182   if (e)
183     {
184       strcpy(c, e);
185       c += strlen(c);
186       *c++ = ':';
187     }
188   if (v)
189     {
190       strcpy(c, v);
191       c += strlen(c);
192     }
193   if (r)
194     {
195       *c++ = '-';
196       strcpy(c, r);
197       c += strlen(c);
198     }
199   *c = 0;
200   if (!*pd->content)
201     return 0;
202 #if 0
203   fprintf(stderr, "evr: %s\n", pd->content);
204 #endif
205   return pool_str2id(pool, pd->content, 1);
206 }
207
208 static void XMLCALL
209 startElement(void *userData, const char *name, const char **atts)
210 {
211   struct parsedata *pd = userData;
212   Pool *pool = pd->pool;
213   struct stateswitch *sw;
214   const char *str;
215
216 #if 0
217   fprintf(stderr, "start: [%d]%s\n", pd->state, name);
218 #endif
219   if (pd->depth != pd->statedepth)
220     {
221       pd->depth++;
222       return;
223     }
224
225   pd->depth++;
226   if (!pd->swtab[pd->state])
227     return;
228   for (sw = pd->swtab[pd->state]; sw->from == pd->state; sw++)  /* find name in statetable */
229     if (!strcmp(sw->ename, name))
230       break;
231   if (sw->from != pd->state)
232     {
233 #if 0
234       fprintf(stderr, "into unknown: [%d]%s (from: %d)\n", sw->to, name, sw->from);
235 #endif
236       return;
237     }
238   pd->state = sw->to;
239   pd->docontent = sw->docontent;
240   pd->statedepth = pd->depth;
241   pd->lcontent = 0;
242   *pd->content = 0;
243
244   switch(pd->state)
245     {
246     case STATE_START:
247       break;
248     case STATE_NEWPACKAGE:
249       if ((str = find_attr("name", atts)) != 0)
250         pd->newpkgname = pool_str2id(pool, str, 1);
251       pd->newpkgevr = makeevr_atts(pool, pd, atts);
252       if ((str = find_attr("arch", atts)) != 0)
253         pd->newpkgarch = pool_str2id(pool, str, 1);
254       break;
255
256     case STATE_DELTA:
257       memset(&pd->delta, 0, sizeof(pd->delta));
258       pd->delta.bevr = solv_extend(pd->delta.bevr, pd->delta.nbevr, 1, sizeof(Id), 7);
259       pd->delta.bevr[pd->delta.nbevr++] = makeevr_atts(pool, pd, atts);
260       break;
261     case STATE_FILENAME:
262       break;
263     case STATE_LOCATION:
264       pd->delta.location = solv_strdup(find_attr("href", atts));
265       break;
266     case STATE_SIZE:
267       break;
268     case STATE_CHECKSUM:
269       pd->delta.filechecksum = 0;
270       pd->delta.filechecksumtype = REPOKEY_TYPE_SHA1;
271       if ((str = find_attr("type", atts)) != 0)
272         {
273           pd->delta.filechecksumtype = solv_chksum_str2type(str);
274           if (!pd->delta.filechecksumtype)
275             pool_debug(pool, SOLV_ERROR, "unknown checksum type: '%s'\n", str);
276         }
277       break;
278     case STATE_SEQUENCE:
279       break;
280     default:
281       break;
282     }
283 }
284
285
286 static void XMLCALL
287 endElement(void *userData, const char *name)
288 {
289   struct parsedata *pd = userData;
290   Pool *pool = pd->pool;
291   const char *str;
292
293 #if 0
294   fprintf(stderr, "end: %s\n", name);
295 #endif
296   if (pd->depth != pd->statedepth)
297     {
298       pd->depth--;
299 #if 0
300       fprintf(stderr, "back from unknown %d %d %d\n", pd->state, pd->depth, pd->statedepth);
301 #endif
302       return;
303     }
304
305   pd->depth--;
306   pd->statedepth--;
307   switch (pd->state)
308     {
309     case STATE_START:
310       break;
311     case STATE_NEWPACKAGE:
312       break;
313     case STATE_DELTA:
314       {
315         /* read all data for a deltarpm. commit into attributes */
316         Id handle;
317         struct deltarpm *d = &pd->delta;
318
319         handle = repodata_new_handle(pd->data);
320         /* we commit all handles later on in one go so that the
321          * repodata code doesn't need to realloc every time */
322         pd->handles = solv_extend(pd->handles, pd->nhandles, 1, sizeof(Id), 63);
323         pd->handles[pd->nhandles++] = handle;
324         repodata_set_id(pd->data, handle, DELTA_PACKAGE_NAME, pd->newpkgname);
325         repodata_set_id(pd->data, handle, DELTA_PACKAGE_EVR, pd->newpkgevr);
326         repodata_set_id(pd->data, handle, DELTA_PACKAGE_ARCH, pd->newpkgarch);
327         if (d->location)
328           repodata_set_deltalocation(pd->data, handle, 0, 0, d->location);
329         if (d->downloadsize)
330           repodata_set_num(pd->data, handle, DELTA_DOWNLOADSIZE, d->downloadsize);
331         if (d->filechecksum)
332           repodata_set_checksum(pd->data, handle, DELTA_CHECKSUM, d->filechecksumtype, d->filechecksum);
333         if (d->seqnum)
334           {
335             repodata_set_id(pd->data, handle, DELTA_BASE_EVR, d->bevr[0]);
336             repodata_set_id(pd->data, handle, DELTA_SEQ_NAME, d->seqname);
337             repodata_set_id(pd->data, handle, DELTA_SEQ_EVR, d->seqevr);
338             /* should store as binary blob! */
339             repodata_set_str(pd->data, handle, DELTA_SEQ_NUM, d->seqnum);
340           }
341       }
342       pd->delta.filechecksum = solv_free(pd->delta.filechecksum);
343       pd->delta.bevr = solv_free(pd->delta.bevr);
344       pd->delta.nbevr = 0;
345       pd->delta.seqnum = solv_free(pd->delta.seqnum);
346       pd->delta.location = solv_free(pd->delta.location);
347       break;
348     case STATE_FILENAME:
349       pd->delta.location = solv_strdup(pd->content);
350       break;
351     case STATE_CHECKSUM:
352       pd->delta.filechecksum = solv_strdup(pd->content);
353       break;
354     case STATE_SIZE:
355       pd->delta.downloadsize = strtoull(pd->content, 0, 10);
356       break;
357     case STATE_SEQUENCE:
358       if ((str = pd->content))
359         {
360           const char *s1, *s2;
361           s1 = strrchr(str, '-');
362           if (s1)
363             {
364               for (s2 = s1 - 1; s2 > str; s2--)
365                 if (*s2 == '-')
366                   break;
367               if (*s2 == '-')
368                 {
369                   for (s2 = s2 - 1; s2 > str; s2--)
370                     if (*s2 == '-')
371                       break;
372                   if (*s2 == '-')
373                     {
374                       pd->delta.seqevr = pool_strn2id(pool, s2 + 1, s1 - s2 - 1, 1);
375                       pd->delta.seqname = pool_strn2id(pool, str, s2 - str, 1);
376                       str = s1 + 1;
377                     }
378                 }
379             }
380           pd->delta.seqnum = solv_strdup(str);
381       }
382     default:
383       break;
384     }
385
386   pd->state = pd->sbtab[pd->state];
387   pd->docontent = 0;
388 }
389
390
391 static void XMLCALL
392 characterData(void *userData, const XML_Char *s, int len)
393 {
394   struct parsedata *pd = userData;
395   int l;
396   char *c;
397   if (!pd->docontent)
398     return;
399   l = pd->lcontent + len + 1;
400   if (l > pd->acontent)
401     {
402       pd->content = solv_realloc(pd->content, l + 256);
403       pd->acontent = l + 256;
404     }
405   c = pd->content + pd->lcontent;
406   pd->lcontent += len;
407   while (len-- > 0)
408     *c++ = *s++;
409   *c = 0;
410 }
411
412 #define BUFF_SIZE 8192
413
414 int
415 repo_add_deltainfoxml(Repo *repo, FILE *fp, int flags)
416 {
417   Pool *pool = repo->pool;
418   struct parsedata pd;
419   char buf[BUFF_SIZE];
420   int i, l;
421   struct stateswitch *sw;
422   Repodata *data;
423   XML_Parser parser;
424
425   data = repo_add_repodata(repo, flags);
426
427   memset(&pd, 0, sizeof(pd));
428   for (i = 0, sw = stateswitches; sw->from != NUMSTATES; i++, sw++)
429     {
430       if (!pd.swtab[sw->from])
431         pd.swtab[sw->from] = sw;
432       pd.sbtab[sw->to] = sw->from;
433     }
434   pd.pool = pool;
435   pd.repo = repo;
436   pd.data = data;
437
438   pd.content = solv_malloc(256);
439   pd.acontent = 256;
440   pd.lcontent = 0;
441
442   parser = XML_ParserCreate(NULL);
443   XML_SetUserData(parser, &pd);
444   XML_SetElementHandler(parser, startElement, endElement);
445   XML_SetCharacterDataHandler(parser, characterData);
446   for (;;)
447     {
448       l = fread(buf, 1, sizeof(buf), fp);
449       if (XML_Parse(parser, buf, l, l == 0) == XML_STATUS_ERROR)
450         {
451           pd.ret = pool_error(pool, -1, "repo_updateinfoxml: %s at line %u:%u", XML_ErrorString(XML_GetErrorCode(parser)), (unsigned int)XML_GetCurrentLineNumber(parser), (unsigned int)XML_GetCurrentColumnNumber(parser));
452           break;
453         }
454       if (l == 0)
455         break;
456     }
457   XML_ParserFree(parser);
458   solv_free(pd.content);
459
460   /* now commit all handles */
461   if (!pd.ret)
462     for (i = 0; i < pd.nhandles; i++)
463       repodata_add_flexarray(pd.data, SOLVID_META, REPOSITORY_DELTAINFO, pd.handles[i]);
464   solv_free(pd.handles);
465
466   if (!(flags & REPO_NO_INTERNALIZE))
467     repodata_internalize(data);
468   return pd.ret;
469 }
470
471 /* EOF */