- get rid of static variables used by join2
[platform/upstream/libsolv.git] / ext / repo_products.c
1 /*
2  * repo_products.c
3  *
4  * Parses all files below 'proddir'
5  * See http://en.opensuse.org/Product_Management/Code11
6  *
7  *
8  * Copyright (c) 2008, Novell Inc.
9  *
10  * This program is licensed under the BSD license, read LICENSE.BSD
11  * for further information
12  */
13
14 #include <sys/types.h>
15 #include <sys/stat.h>
16 #include <unistd.h>
17 #include <limits.h>
18 #include <fcntl.h>
19 #include <ctype.h>
20 #include <stdio.h>
21 #include <stdlib.h>
22 #include <string.h>
23 #include <assert.h>
24 #include <dirent.h>
25 #include <expat.h>
26
27 #include "pool.h"
28 #include "repo.h"
29 #include "util.h"
30 #define DISABLE_SPLIT
31 #include "tools_util.h"
32 #include "repo_content.h"
33 #include "repo_zyppdb.h"
34 #include "repo_releasefile_products.h"
35
36
37 //#define DUMPOUT 0
38
39 enum state {
40   STATE_START,           // 0
41   STATE_PRODUCT,         // 1
42   STATE_VENDOR,          // 2
43   STATE_NAME,            // 3
44   STATE_VERSION,         // 4
45   STATE_RELEASE,         // 5
46   STATE_ARCH,            // 6
47   STATE_SUMMARY,         // 7
48   STATE_SHORTSUMMARY,
49   STATE_DESCRIPTION,     // 8
50   STATE_UPDATEREPOKEY,   // 9 should go away
51   STATE_CPEID,         // 9
52   STATE_URLS,            // 10
53   STATE_URL,             // 11
54   STATE_RUNTIMECONFIG,   // 12
55   STATE_LINGUAS,         // 13
56   STATE_LANG,            // 14
57   STATE_REGISTER,        // 15
58   STATE_TARGET,          // 16
59   STATE_REGRELEASE,      // 18
60   STATE_PRODUCTLINE,     // 19
61   NUMSTATES              // 0
62 };
63
64 struct stateswitch {
65   enum state from;
66   char *ename;
67   enum state to;
68   int docontent;
69 };
70
71 /* !! must be sorted by first column !! */
72 static struct stateswitch stateswitches[] = {
73   { STATE_START,     "product",       STATE_PRODUCT,       0 },
74   { STATE_PRODUCT,   "vendor",        STATE_VENDOR,        1 },
75   { STATE_PRODUCT,   "name",          STATE_NAME,          1 },
76   { STATE_PRODUCT,   "version",       STATE_VERSION,       1 },
77   { STATE_PRODUCT,   "release",       STATE_RELEASE,       1 },
78   { STATE_PRODUCT,   "arch",          STATE_ARCH,          1 },
79   { STATE_PRODUCT,   "productline",   STATE_PRODUCTLINE,   1 },
80   { STATE_PRODUCT,   "summary",       STATE_SUMMARY,       1 },
81   { STATE_PRODUCT,   "shortsummary",  STATE_SHORTSUMMARY,  1 },
82   { STATE_PRODUCT,   "description",   STATE_DESCRIPTION,   1 },
83   { STATE_PRODUCT,   "register",      STATE_REGISTER,      0 },
84   { STATE_PRODUCT,   "urls",          STATE_URLS,          0 },
85   { STATE_PRODUCT,   "runtimeconfig", STATE_RUNTIMECONFIG, 0 },
86   { STATE_PRODUCT,   "linguas",       STATE_LINGUAS,       0 },
87   { STATE_PRODUCT,   "updaterepokey", STATE_UPDATEREPOKEY, 1 },
88   { STATE_PRODUCT,   "cpeid",         STATE_CPEID,         1 },
89   { STATE_URLS,      "url",           STATE_URL,           1 },
90   { STATE_LINGUAS,   "lang",          STATE_LANG,          0 },
91   { STATE_REGISTER,  "target",        STATE_TARGET,        1 },
92   { STATE_REGISTER,  "release",       STATE_REGRELEASE,    1 },
93   { NUMSTATES }
94 };
95
96 struct parsedata {
97   const char *filename;
98   const char *basename;
99   int depth;
100   enum state state;
101   int statedepth;
102   char *content;
103   int lcontent;
104   int acontent;
105   int docontent;
106   Pool *pool;
107   Repo *repo;
108   Repodata *data;
109
110   struct stateswitch *swtab[NUMSTATES];
111   enum state sbtab[NUMSTATES];
112   struct joindata jd;
113
114   const char *tmplang;
115
116   const char *tmpvers;
117   const char *tmprel;
118   const char *tmpurltype;
119
120   unsigned int ctime;
121
122   Solvable *solvable;
123   Id handle;
124
125   ino_t baseproduct;
126   ino_t currentproduct;
127   int productscheme;
128 };
129
130
131 /*
132  * find_attr
133  * find value for xml attribute
134  * I: txt, name of attribute
135  * I: atts, list of key/value attributes
136  * I: dup, strdup it
137  * O: pointer to value of matching key, or NULL
138  *
139  */
140
141 static inline const char *
142 find_attr(const char *txt, const char **atts, int dup)
143 {
144   for (; *atts; atts += 2)
145     {
146       if (!strcmp(*atts, txt))
147         return dup ? solv_strdup(atts[1]) : atts[1];
148     }
149   return 0;
150 }
151
152
153 /*
154  * XML callback: startElement
155  */
156
157 static void XMLCALL
158 startElement(void *userData, const char *name, const char **atts)
159 {
160   struct parsedata *pd = userData;
161   Pool *pool = pd->pool;
162   Solvable *s = pd->solvable;
163   struct stateswitch *sw;
164
165 #if 0
166       fprintf(stderr, "start: [%d]%s\n", pd->state, name);
167 #endif
168   if (pd->depth != pd->statedepth)
169     {
170       pd->depth++;
171       return;
172     }
173
174   pd->depth++;
175   if (!pd->swtab[pd->state])    /* no statetable -> no substates */
176     {
177 #if 0
178       fprintf(stderr, "into unknown: %s (from: %d)\n", name, pd->state);
179 #endif
180       return;
181     }
182   for (sw = pd->swtab[pd->state]; sw->from == pd->state; sw++)  /* find name in statetable */
183     if (!strcmp(sw->ename, name))
184       break;
185
186   if (sw->from != pd->state)
187     {
188 #if 0
189       fprintf(stderr, "into unknown: %s (from: %d)\n", name, pd->state);
190 #endif
191       return;
192     }
193   pd->state = sw->to;
194   pd->docontent = sw->docontent;
195   pd->statedepth = pd->depth;
196   pd->lcontent = 0;
197   *pd->content = 0;
198
199   switch(pd->state)
200     {
201     case STATE_PRODUCT:
202       /* parse 'schemeversion' and store in global variable */
203       {
204         const char * scheme = find_attr("schemeversion", atts, 0);
205         pd->productscheme = (scheme && *scheme) ? atoi(scheme) : -1;
206       }
207       if (!s)
208         {
209           s = pd->solvable = pool_id2solvable(pool, repo_add_solvable(pd->repo));
210           pd->handle = s - pool->solvables;
211         }
212       break;
213
214       /* <summary lang="xy">... */
215     case STATE_SUMMARY:
216       pd->tmplang = find_attr("lang", atts, 1);
217       break;
218     case STATE_DESCRIPTION:
219       pd->tmplang = find_attr("lang", atts, 1);
220       break;
221     case STATE_URL:
222       pd->tmpurltype = find_attr("name", atts, 1);
223       break;
224     default:
225       break;
226     }
227 }
228
229
230 static void XMLCALL
231 endElement(void *userData, const char *name)
232 {
233   struct parsedata *pd = userData;
234   Solvable *s = pd->solvable;
235
236 #if 0
237       fprintf(stderr, "end: [%d]%s\n", pd->state, name);
238 #endif
239   if (pd->depth != pd->statedepth)
240     {
241       pd->depth--;
242 #if 0
243       fprintf(stderr, "back from unknown %d %d %d\n", pd->state, pd->depth, pd->statedepth);
244 #endif
245       return;
246     }
247
248   pd->depth--;
249   pd->statedepth--;
250
251   switch (pd->state)
252     {
253     case STATE_PRODUCT:
254       /* product done, finish solvable */
255       if (pd->ctime)
256         repodata_set_num(pd->data, pd->handle, SOLVABLE_INSTALLTIME, pd->ctime);
257
258       if (pd->basename)
259         repodata_set_str(pd->data, pd->handle, PRODUCT_REFERENCEFILE, pd->basename);
260
261       /* this is where <productsdir>/baseproduct points to */
262       if (pd->currentproduct == pd->baseproduct)
263         repodata_set_str(pd->data, pd->handle, PRODUCT_TYPE, "base");
264
265       if (pd->tmprel)
266         {
267           if (pd->tmpvers)
268             s->evr = makeevr(pd->pool, join2(&pd->jd, pd->tmpvers, "-", pd->tmprel));
269           else
270             {
271               fprintf(stderr, "Seen <release> but no <version>\n");
272             }
273         }
274       else if (pd->tmpvers)
275         s->evr = makeevr(pd->pool, pd->tmpvers); /* just version, no release */
276       pd->tmpvers = solv_free((void *)pd->tmpvers);
277       pd->tmprel = solv_free((void *)pd->tmprel);
278       if (!s->arch)
279         s->arch = ARCH_NOARCH;
280       if (!s->evr)
281         s->evr = ID_EMPTY;
282       if (s->name && s->arch != ARCH_SRC && s->arch != ARCH_NOSRC)
283         s->provides = repo_addid_dep(pd->repo, s->provides, pool_rel2id(pd->pool, s->name, s->evr, REL_EQ, 1), 0);
284       pd->solvable = 0;
285       break;
286     case STATE_VENDOR:
287       s->vendor = pool_str2id(pd->pool, pd->content, 1);
288       break;
289     case STATE_NAME:
290       s->name = pool_str2id(pd->pool, join2(&pd->jd, "product", ":", pd->content), 1);
291       break;
292     case STATE_VERSION:
293       pd->tmpvers = solv_strdup(pd->content);
294       break;
295     case STATE_RELEASE:
296       pd->tmprel = solv_strdup(pd->content);
297       break;
298     case STATE_ARCH:
299       s->arch = pool_str2id(pd->pool, pd->content, 1);
300       break;
301     case STATE_PRODUCTLINE:
302       repodata_set_str(pd->data, pd->handle, PRODUCT_PRODUCTLINE, pd->content);
303     break;
304     case STATE_UPDATEREPOKEY:
305       /** obsolete **/
306       break;
307     case STATE_SUMMARY:
308       repodata_set_str(pd->data, pd->handle, pool_id2langid(pd->pool, SOLVABLE_SUMMARY, pd->tmplang, 1), pd->content);
309       pd->tmplang = solv_free((void *)pd->tmplang);
310       break;
311     case STATE_SHORTSUMMARY:
312       repodata_set_str(pd->data, pd->handle, PRODUCT_SHORTLABEL, pd->content);
313       break;
314     case STATE_DESCRIPTION:
315       repodata_set_str(pd->data, pd->handle, pool_id2langid(pd->pool, SOLVABLE_DESCRIPTION, pd->tmplang, 1), pd->content);
316       pd->tmplang = solv_free((void *)pd->tmplang);
317       break;
318     case STATE_URL:
319       if (pd->tmpurltype)
320         {
321           repodata_add_poolstr_array(pd->data, pd->handle, PRODUCT_URL, pd->content);
322           repodata_add_idarray(pd->data, pd->handle, PRODUCT_URL_TYPE, pool_str2id(pd->pool, pd->tmpurltype, 1));
323         }
324       pd->tmpurltype = solv_free((void *)pd->tmpurltype);
325       break;
326     case STATE_TARGET:
327       repodata_set_str(pd->data, pd->handle, PRODUCT_REGISTER_TARGET, pd->content);
328       break;
329     case STATE_REGRELEASE:
330       repodata_set_str(pd->data, pd->handle, PRODUCT_REGISTER_RELEASE, pd->content);
331       break;
332     case STATE_CPEID:
333       if (pd->content)
334         repodata_set_str(pd->data, pd->handle, SOLVABLE_CPEID, pd->content);
335     default:
336       break;
337     }
338
339   pd->state = pd->sbtab[pd->state];
340   pd->docontent = 0;
341
342 #if 0
343       fprintf(stderr, "end: [%s] -> %d\n", name, pd->state);
344 #endif
345 }
346
347
348 static void XMLCALL
349 characterData(void *userData, const XML_Char *s, int len)
350 {
351   struct parsedata *pd = userData;
352   int l;
353   char *c;
354   if (!pd->docontent)
355     return;
356   l = pd->lcontent + len + 1;
357   if (l > pd->acontent)
358     {
359       pd->content = solv_realloc(pd->content, l + 256);
360       pd->acontent = l + 256;
361     }
362   c = pd->content + pd->lcontent;
363   pd->lcontent += len;
364   while (len-- > 0)
365     *c++ = *s++;
366   *c = 0;
367 }
368
369 #define BUFF_SIZE 8192
370
371
372 /*
373  * add single product to repo
374  *
375  */
376
377 static void
378 add_code11_product(struct parsedata *pd, FILE *fp)
379 {
380   char buf[BUFF_SIZE];
381   int l;
382   struct stat st;
383   XML_Parser parser;
384
385   if (!fstat(fileno(fp), &st))
386     {
387       pd->currentproduct = st.st_ino;
388       pd->ctime = (unsigned int)st.st_ctime;
389     }
390   else
391     {
392       pd->currentproduct = pd->baseproduct + 1; /* make it != baseproduct if stat fails */
393       perror("fstat");
394       pd->ctime = 0;
395     }
396
397   parser = XML_ParserCreate(NULL);
398   XML_SetUserData(parser, pd);
399   XML_SetElementHandler(parser, startElement, endElement);
400   XML_SetCharacterDataHandler(parser, characterData);
401
402   for (;;)
403     {
404       l = fread(buf, 1, sizeof(buf), fp);
405       if (XML_Parse(parser, buf, l, l == 0) == XML_STATUS_ERROR)
406         {
407           pool_debug(pd->pool, SOLV_ERROR, "%s: %s at line %u:%u\n", pd->filename, XML_ErrorString(XML_GetErrorCode(parser)), (unsigned int)XML_GetCurrentLineNumber(parser), (unsigned int)XML_GetCurrentColumnNumber(parser));
408           pool_debug(pd->pool, SOLV_ERROR, "skipping this product\n");
409           XML_ParserFree(parser);
410           return;
411         }
412       if (l == 0)
413         break;
414     }
415   XML_ParserFree(parser);
416 }
417
418
419 void
420 repo_add_code11_products(Repo *repo, const char *dirpath, int flags)
421 {
422   Repodata *data;
423   struct parsedata pd;
424   struct stateswitch *sw;
425   DIR *dir;
426   int i;
427
428   data = repo_add_repodata(repo, flags);
429
430   memset(&pd, 0, sizeof(pd));
431   pd.repo = repo;
432   pd.pool = repo->pool;
433   pd.data = data;
434
435   pd.content = solv_malloc(256);
436   pd.acontent = 256;
437
438   for (i = 0, sw = stateswitches; sw->from != NUMSTATES; i++, sw++)
439     {
440       if (!pd.swtab[sw->from])
441         pd.swtab[sw->from] = sw;
442       pd.sbtab[sw->to] = sw->from;
443     }
444
445   dir = opendir(dirpath);
446   if (dir)
447     {
448       struct dirent *entry;
449       struct stat st;
450       char *fullpath;
451
452       /* check for <productsdir>/baseproduct on code11 and remember its target inode */
453       if (stat(join2(&pd.jd, dirpath, "/", "baseproduct"), &st) == 0) /* follow symlink */
454         pd.baseproduct = st.st_ino;
455       else
456         pd.baseproduct = 0;
457
458       while ((entry = readdir(dir)))
459         {
460           int len = strlen(entry->d_name);
461           FILE *fp;
462           if (len <= 5 || strcmp(entry->d_name + len - 5, ".prod") != 0)
463             continue;
464           fullpath = join2(&pd.jd, dirpath, "/", entry->d_name);
465           fp = fopen(fullpath, "r");
466           if (!fp)
467             {
468               perror(fullpath);
469               continue;
470             }
471           pd.filename = fullpath;
472           pd.basename = entry->d_name;
473           add_code11_product(&pd, fp);
474           fclose(fp);
475         }
476       closedir(dir);
477     }
478   solv_free((void *)pd.tmplang);
479   solv_free(pd.content);
480   join_freemem(&pd.jd);
481
482   if (!(flags & REPO_NO_INTERNALIZE))
483     repodata_internalize(data);
484 }
485
486
487 /******************************************************************************************/
488
489
490 /*
491  * read all installed products
492  *
493  * try proddir (reading all .xml files from this directory) first
494  * if not available, assume non-code11 layout and parse /etc/xyz-release
495  *
496  * parse each one as a product
497  */
498
499 /* Oh joy! Three parsers for the price of one! */
500
501 void
502 repo_add_products(Repo *repo, const char *proddir, const char *root, int flags)
503 {
504   char *fullpath;
505   DIR *dir;
506
507   if (proddir)
508     {
509       dir = opendir(proddir);
510       if (dir)
511         {
512           /* assume code11 stype products */
513           closedir(dir);
514           repo_add_code11_products(repo, proddir, flags);
515           return;
516         }
517     }
518
519   /* code11 didn't work, try old code10 zyppdb */
520   fullpath = solv_dupjoin(root ? root : 0, "/var/lib/zypp/db/products", 0);
521   dir = opendir(fullpath);
522   if (dir)
523     {
524       closedir(dir);
525       /* assume code10 style products */
526       repo_add_zyppdb_products(repo, fullpath, flags);
527       solv_free(fullpath);
528       return;
529     }
530   solv_free(fullpath);
531
532   /* code10/11 didn't work, try -release files parsing */
533   fullpath = solv_dupjoin(root ? root : 0, "/etc", 0);
534   dir = opendir(fullpath);
535   if (dir)
536     {
537       closedir(dir);
538       repo_add_releasefile_products(repo, fullpath, flags);
539       solv_free(fullpath);
540       return;
541     }
542
543   /* no luck. print an error message in case the root argument is wrong */
544   perror(fullpath);
545   solv_free(fullpath);
546
547   /* the least we can do... */
548   if (!(flags & REPO_NO_INTERNALIZE) && (flags & REPO_REUSE_REPODATA) != 0)
549     repodata_internalize(repo_last_repodata(repo));
550 }
551
552 /* EOF */