fix compile on 64bit
[platform/upstream/libsolv.git] / tools / repo_rpmmd.c
index f88c273..44ab8ee 100644 (file)
 
 enum state {
   STATE_START,
-  STATE_METADATA,
+
   STATE_SOLVABLE,
-  STATE_PRODUCT,
-  STATE_PATTERN,
-  STATE_PATCH,
+
   STATE_NAME,
   STATE_ARCH,
   STATE_VERSION,
@@ -40,6 +38,7 @@ enum state {
   /* resobject attributes */
   STATE_SUMMARY,
   STATE_DESCRIPTION,
+  STATE_DISTRIBUTION,
   STATE_PACKAGER,
   STATE_URL,
   STATE_INSNOTIFY,
@@ -50,14 +49,21 @@ enum state {
   STATE_DOWNLOADSIZE,
   STATE_INSTALLTIME,
   STATE_INSTALLONLY,
-  
+
+  /* Novell/SUSE extended attributes */
+  STATE_EULA,
+  STATE_KEYWORD,
+  STATE_DISKUSAGE,
+  STATE_DIRS,
+  STATE_DIR,
+
   /* patch */
   STATE_ID,
   STATE_TIMESTAMP,
   STATE_AFFECTSPKG,
   STATE_REBOOTNEEDED,
 
-   // xml store pattern attributes
+  // pattern attributes
   STATE_CATEGORY, /* pattern and patches */
   STATE_SCRIPT,
   STATE_ICON,
@@ -67,10 +73,14 @@ enum state {
 
   /* product */
   STATE_SHORTNAME,
-  STATE_DISTNAME,
-  STATE_DISTEDITION,
+  STATE_DISTNAME, // obsolete
+  STATE_DISTEDITION, // obsolete
   STATE_SOURCE,
+  STATE_TYPE,
   STATE_RELNOTESURL,
+  STATE_UPDATEURL,
+  STATE_OPTIONALURL,
+  STATE_FLAG,
 
   /* rpm-md dependencies inside the
      format tag */
@@ -110,12 +120,20 @@ struct stateswitch {
 };
 
 static struct stateswitch stateswitches[] = {
+  /** fake tag used to enclose 2 different xml files in one **/
+  { STATE_START,       "rpmmd",           STATE_START,    0 },
+
+  /** tags for different package data, we just ignore the tag **/
+  { STATE_START,       "metadata",        STATE_START,    0 },
+  { STATE_START,       "otherdata",       STATE_START,    0 },
+  { STATE_START,       "diskusagedata",   STATE_START,    0 },
+  { STATE_START,       "susedata",        STATE_START,    0 },
 
   { STATE_START,       "product",         STATE_SOLVABLE, 0 },
   { STATE_START,       "pattern",         STATE_SOLVABLE, 0 },
   { STATE_START,       "patch",           STATE_SOLVABLE, 0 },
   { STATE_START,       "package",         STATE_SOLVABLE, 0 },
-  
+
   { STATE_SOLVABLE,    "name",            STATE_NAME, 1 },
   { STATE_SOLVABLE,    "arch",            STATE_ARCH, 1 },
   { STATE_SOLVABLE,    "version",         STATE_VERSION, 0 },
@@ -123,48 +141,65 @@ static struct stateswitch stateswitches[] = {
   // package attributes rpm-md
   { STATE_SOLVABLE,    "location",        STATE_LOCATION, 0 },
   { STATE_SOLVABLE,    "checksum",        STATE_CHECKSUM, 1 },
-  
+
   /* resobject attributes */
 
-  { STATE_SOLVABLE,    "summary",         STATE_SUMMARY, 1 },
-  { STATE_SOLVABLE,    "description",     STATE_DESCRIPTION, 1 },
-  { STATE_SOLVABLE,    "url",             STATE_URL, 1 },
-  { STATE_SOLVABLE,    "packager",        STATE_PACKAGER, 1 },
+  { STATE_SOLVABLE,    "summary",         STATE_SUMMARY,      1 },
+  { STATE_SOLVABLE,    "description",     STATE_DESCRIPTION,  1 },
+  { STATE_SOLVABLE,    "distribution",    STATE_DISTRIBUTION, 1 },
+  { STATE_SOLVABLE,    "url",             STATE_URL,          1 },
+  { STATE_SOLVABLE,    "packager",        STATE_PACKAGER,     1 },
   //{ STATE_SOLVABLE,    "???",         STATE_INSNOTIFY, 1 },
   //{ STATE_SOLVABLE,    "??",     STATE_DELNOTIFY, 1 },
-  { STATE_SOLVABLE,    "vendor",          STATE_VENDOR, 1 },
-  { STATE_SOLVABLE,    "size",            STATE_SIZE, 0 },
+  { STATE_SOLVABLE,    "vendor",          STATE_VENDOR,       1 },
+  { STATE_SOLVABLE,    "size",            STATE_SIZE,         0 },
   { STATE_SOLVABLE,    "archive-size",    STATE_DOWNLOADSIZE, 1 },
-  { STATE_SOLVABLE,    "install-time",    STATE_INSTALLTIME, 1 },
-  { STATE_SOLVABLE,    "install-only",    STATE_INSTALLONLY, 1 },
-  { STATE_SOLVABLE,    "time",            STATE_TIME, 0 },
-
-  // xml store pattern attributes
-  { STATE_SOLVABLE,    "script",          STATE_SCRIPT, 1 },
-  { STATE_SOLVABLE,    "icon",            STATE_ICON, 1 },
-  { STATE_SOLVABLE,    "uservisible",     STATE_USERVISIBLE, 1 },
-  { STATE_SOLVABLE,    "category",        STATE_CATEGORY, 1 },
-  { STATE_SOLVABLE,    "default",         STATE_DEFAULT, 1 },
-  { STATE_SOLVABLE,    "install-time",    STATE_INSTALL_TIME, 1 },
-
-  { STATE_SOLVABLE,      "rpm:vendor",      STATE_VENDOR, 1 },
-  { STATE_SOLVABLE,      "rpm:group",       STATE_RPM_GROUP, 1 },
+  { STATE_SOLVABLE,    "install-time",    STATE_INSTALLTIME,  1 },
+  { STATE_SOLVABLE,    "install-only",    STATE_INSTALLONLY,  1 },
+  { STATE_SOLVABLE,    "time",            STATE_TIME,         0 },
+
+  /* extended Novell/SUSE attributes (susedata.xml) */
+  { STATE_SOLVABLE,    "eula",            STATE_EULA,         1 },
+  { STATE_SOLVABLE,    "keyword",         STATE_KEYWORD,      1 },
+  { STATE_SOLVABLE,    "diskusage",       STATE_DISKUSAGE,    0 },
+
+  // pattern attribute
+  { STATE_SOLVABLE,    "script",          STATE_SCRIPT,        1 },
+  { STATE_SOLVABLE,    "icon",            STATE_ICON,          1 },
+  { STATE_SOLVABLE,    "uservisible",     STATE_USERVISIBLE,   1 },
+  { STATE_SOLVABLE,    "category",        STATE_CATEGORY,      1 },
+  { STATE_SOLVABLE,    "default",         STATE_DEFAULT,       1 },
+  { STATE_SOLVABLE,    "install-time",    STATE_INSTALL_TIME,  1 },
+
+  /* product attributes */
+  /* note the product type is an attribute */
+  { STATE_SOLVABLE,    "release-notes-url", STATE_RELNOTESURL, 1 },
+  { STATE_SOLVABLE,    "update-url",        STATE_UPDATEURL,   1 },
+  { STATE_SOLVABLE,    "optional-url",      STATE_OPTIONALURL, 1 },
+  { STATE_SOLVABLE,    "flag",              STATE_FLAG,        1 },
+
+  { STATE_SOLVABLE,      "rpm:vendor",      STATE_VENDOR,      1 },
+  { STATE_SOLVABLE,      "rpm:group",       STATE_RPM_GROUP,   1 },
   { STATE_SOLVABLE,      "rpm:license",     STATE_RPM_LICENSE, 1 },
 
-  /* rpm-md dependencies */ 
-  { STATE_SOLVABLE,      "rpm:provides",    STATE_PROVIDES, 0 },
-  { STATE_SOLVABLE,      "rpm:requires",    STATE_REQUIRES, 0 },
-  { STATE_SOLVABLE,      "rpm:obsoletes",   STATE_OBSOLETES , 0 },
-  { STATE_SOLVABLE,      "rpm:conflicts",   STATE_CONFLICTS , 0 },
-  { STATE_SOLVABLE,      "rpm:recommends",  STATE_RECOMMENDS , 0 },
-  { STATE_SOLVABLE,      "rpm:supplements", STATE_SUPPLEMENTS, 0 },
-  { STATE_SOLVABLE,      "rpm:suggests",    STATE_SUGGESTS, 0 },
-  { STATE_SOLVABLE,      "rpm:enhances",    STATE_ENHANCES, 0 },
-  { STATE_SOLVABLE,      "rpm:freshens",    STATE_FRESHENS, 0 },
-  { STATE_SOLVABLE,      "rpm:sourcerpm",   STATE_SOURCERPM, 1 },
+  /* rpm-md dependencies */
+  { STATE_SOLVABLE,      "rpm:provides",    STATE_PROVIDES,     0 },
+  { STATE_SOLVABLE,      "rpm:requires",    STATE_REQUIRES,     0 },
+  { STATE_SOLVABLE,      "rpm:obsoletes",   STATE_OBSOLETES,    0 },
+  { STATE_SOLVABLE,      "rpm:conflicts",   STATE_CONFLICTS,    0 },
+  { STATE_SOLVABLE,      "rpm:recommends",  STATE_RECOMMENDS ,  0 },
+  { STATE_SOLVABLE,      "rpm:supplements", STATE_SUPPLEMENTS,  0 },
+  { STATE_SOLVABLE,      "rpm:suggests",    STATE_SUGGESTS,     0 },
+  { STATE_SOLVABLE,      "rpm:enhances",    STATE_ENHANCES,     0 },
+  { STATE_SOLVABLE,      "rpm:freshens",    STATE_FRESHENS,     0 },
+  { STATE_SOLVABLE,      "rpm:sourcerpm",   STATE_SOURCERPM,    1 },
   { STATE_SOLVABLE,      "rpm:header-range", STATE_HEADERRANGE, 0 },
   { STATE_SOLVABLE,      "file",            STATE_FILE, 1 },
-  
+
+   /* extended Novell/SUSE diskusage attributes (susedata.xml) */
+  { STATE_DISKUSAGE,   "dirs",            STATE_DIRS,         0 },
+  { STATE_DIRS,        "dir",             STATE_DIR,          0 },
+
   { STATE_PROVIDES,    "rpm:entry",       STATE_PROVIDESENTRY, 0 },
   { STATE_REQUIRES,    "rpm:entry",       STATE_REQUIRESENTRY, 0 },
   { STATE_OBSOLETES,   "rpm:entry",       STATE_OBSOLETESENTRY, 0 },
@@ -178,6 +213,11 @@ static struct stateswitch stateswitches[] = {
   { NUMSTATES}
 };
 
+/* maxmum initial size of
+   the checksum cache */
+#define MAX_CSCACHE 32768
+#define CSREALLOC_STEP 1024
+
 struct parsedata {
   struct parsedata_common common;
   char *kind;
@@ -192,7 +232,8 @@ struct parsedata {
   Offset freshens;
   struct stateswitch *swtab[NUMSTATES];
   enum state sbtab[NUMSTATES];
-  const char *lang;
+  /* temporal to store attribute tag language */
+  const char *tmplang;
   const char *capkind;
   // used to store tmp attributes
   // while the tag ends
@@ -200,9 +241,108 @@ struct parsedata {
   Repodata *data;
   Id handle;
   XML_Parser *parser;
+  Id (*dirs)[3]; // dirid, size, nfiles
+  int ndirs;
+  Id langcache[ID_NUM_INTERNAL];
+  /** system language */
+  const char *language;
+
+  /** Hash to maps checksums to solv */
+  Stringpool cspool;
+  /** Cache of known checksums to solvable id */
+  Id *cscache;
+  /* the current longest index in the table */
+  int ncscache;
 };
 
 static Id
+langtag(struct parsedata *pd, Id tag, const char *language)
+{
+  if (language && !language[0])
+    language = 0;
+  if (!language || tag >= ID_NUM_INTERNAL)
+    return pool_id2langid(pd->common.repo->pool, tag, language, 1);
+  return pool_id2langid(pd->common.repo->pool, tag, language, 1);
+  if (!pd->langcache[tag])
+    pd->langcache[tag] = pool_id2langid(pd->common.repo->pool, tag, language, 1);
+  return pd->langcache[tag];
+}
+
+static int
+id3_cmp (const void *v1, const void *v2)
+{
+  Id *i1 = (Id*)v1;
+  Id *i2 = (Id*)v2;
+  return i1[0] - i2[0];
+}
+
+static void
+commit_diskusage (struct parsedata *pd, unsigned handle)
+{
+  unsigned i;
+  Dirpool *dp = &pd->data->dirpool;
+  /* Now sort in dirid order.  This ensures that parents come before
+     their children.  */
+  if (pd->ndirs > 1)
+    qsort(pd->dirs, pd->ndirs, sizeof (pd->dirs[0]), id3_cmp);
+  /* Substract leaf numbers from all parents to make the numbers
+     non-cumulative.  This must be done post-order (i.e. all leafs
+     adjusted before parents).  We ensure this by starting at the end of
+     the array moving to the start, hence seeing leafs before parents.  */
+  for (i = pd->ndirs; i--;)
+    {
+      unsigned p = dirpool_parent(dp, pd->dirs[i][0]);
+      unsigned j = i;
+      for (; p; p = dirpool_parent(dp, p))
+        {
+          for (; j--;)
+           if (pd->dirs[j][0] == p)
+             break;
+         if (j < pd->ndirs)
+           {
+             if (pd->dirs[j][1] < pd->dirs[i][1])
+               pd->dirs[j][1] = 0;
+             else
+               pd->dirs[j][1] -= pd->dirs[i][1];
+             if (pd->dirs[j][2] < pd->dirs[i][2])
+               pd->dirs[j][2] = 0;
+             else
+               pd->dirs[j][2] -= pd->dirs[i][2];
+           }
+         else
+           /* Haven't found this parent in the list, look further if
+              we maybe find the parents parent.  */
+           j = i;
+       }
+    }
+#if 0
+  char sbuf[1024];
+  char *buf = sbuf;
+  unsigned slen = sizeof (sbuf);
+  for (i = 0; i < pd->ndirs; i++)
+    {
+      dir2str (attr, pd->dirs[i][0], &buf, &slen);
+      fprintf (stderr, "have dir %d %d %d %s\n", pd->dirs[i][0], pd->dirs[i][1], pd->dirs[i][2], buf);
+    }
+  if (buf != sbuf)
+    free (buf);
+#endif
+  for (i = 0; i < pd->ndirs; i++)
+    if (pd->dirs[i][1] || pd->dirs[i][2])
+      {
+       repodata_add_dirnumnum(pd->data, handle, SOLVABLE_DISKUSAGE, pd->dirs[i][0], pd->dirs[i][1], pd->dirs[i][2]);
+      }
+  pd->ndirs = 0;
+}
+
+
+/*
+ * makeevr_atts
+ * parse 'epoch', 'ver' and 'rel', return evr Id
+ *
+ */
+
+static Id
 makeevr_atts(Pool *pool, struct parsedata *pd, const char **atts)
 {
   const char *e, *v, *r, *v2;
@@ -267,6 +407,16 @@ makeevr_atts(Pool *pool, struct parsedata *pd, const char **atts)
   return str2id(pool, pd->content, 1);
 }
 
+
+/*
+ * find_attr
+ * find value for xml attribute
+ * I: txt, name of attribute
+ * I: atts, list of key/value attributes
+ * O: pointer to value of matching key, or NULL
+ *
+ */
+
 static inline const char *
 find_attr(const char *txt, const char **atts)
 {
@@ -278,6 +428,11 @@ find_attr(const char *txt, const char **atts)
   return 0;
 }
 
+
+/*
+ * dependency relations
+ */
+
 static char *flagtab[] = {
   "GT",
   "EQ",
@@ -287,6 +442,13 @@ static char *flagtab[] = {
   "LE"
 };
 
+
+/*
+ * adddep
+ * parse attributes to reldep Id
+ *
+ */
+
 static unsigned int
 adddep(Pool *pool, struct parsedata *pd, unsigned int olddeps, const char **atts, int isreq)
 {
@@ -319,8 +481,8 @@ adddep(Pool *pool, struct parsedata *pd, unsigned int olddeps, const char **atts
          pd->content = sat_realloc(pd->content, l + 256);
          pd->acontent = l + 256;
        }
-      sprintf(pd->content, "%s:%s", k, n); 
-      name = str2id(pool, pd->content, 1); 
+      sprintf(pd->content, "%s:%s", k, n);
+      name = str2id(pool, pd->content, 1);
     }
   else
     name = str2id(pool, (char *)n, 1);
@@ -342,6 +504,12 @@ adddep(Pool *pool, struct parsedata *pd, unsigned int olddeps, const char **atts
   return repo_addid_dep(pd->common.repo, olddeps, id, marker);
 }
 
+
+/*
+ * set_desciption_author
+ *
+ */
+
 static void
 set_desciption_author(Repodata *data, Id handle, char *str)
 {
@@ -350,27 +518,27 @@ set_desciption_author(Repodata *data, Id handle, char *str)
   if (!str || !*str)
     return;
   for (aut = str; (aut = strchr(aut, '\n')) != 0; aut++)
-    if (!strncmp(aut, "\nAuthors:\n--------\n", 19)) 
+    if (!strncmp(aut, "\nAuthors:\n--------\n", 19))
       break;
   if (aut)
     {
       /* oh my, found SUSE special author section */
-      int l = aut - str; 
-      str[l] = 0; 
+      int l = aut - str;
+      str[l] = 0;
       while (l > 0 && str[l - 1] == '\n')
-       str[--l] = 0; 
+       str[--l] = 0;
       if (l)
        repodata_set_str(data, handle, SOLVABLE_DESCRIPTION, str);
       p = aut + 19;
       aut = str;        /* copy over */
       while (*p == ' ' || *p == '\n')
        p++;
-      while (*p) 
+      while (*p)
        {
          if (*p == '\n')
            {
              *aut++ = *p++;
-             while (*p == ' ') 
+             while (*p == ' ')
                p++;
              continue;
            }
@@ -378,7 +546,7 @@ set_desciption_author(Repodata *data, Id handle, char *str)
        }
       while (aut != str && aut[-1] == '\n')
        aut--;
-      *aut = 0; 
+      *aut = 0;
       if (*str)
        repodata_set_str(data, handle, SOLVABLE_AUTHORS, str);
     }
@@ -386,6 +554,12 @@ set_desciption_author(Repodata *data, Id handle, char *str)
     repodata_set_str(data, handle, SOLVABLE_DESCRIPTION, str);
 }
 
+
+/*
+ * set_sourcerpm
+ *
+ */
+
 static void
 set_sourcerpm(Repodata *data, Solvable *s, Id handle, char *sourcerpm)
 {
@@ -431,6 +605,15 @@ set_sourcerpm(Repodata *data, Solvable *s, Id handle, char *sourcerpm)
     repodata_set_id(data, handle, SOLVABLE_SOURCENAME, strn2id(pool, sourcerpm, sevr - sourcerpm - 1, 1));
 }
 
+/*-----------------------------------------------*/
+/* XML callbacks */
+
+/*
+ * startElement
+ * XML callback
+ *
+ */
+
 static void XMLCALL
 startElement(void *userData, const char *name, const char **atts)
 {
@@ -452,12 +635,14 @@ startElement(void *userData, const char *name, const char **atts)
 
   if (pd->state == STATE_START && !strcmp(name, "patterns"))
     return;
-  if (pd->state == STATE_START && !strcmp(name, "metadata"))
-    return;
+  //if (pd->state == STATE_START && !strcmp(name, "metadata"))
+  //  return;
   if (pd->state == STATE_SOLVABLE && !strcmp(name, "format"))
     return;
 
   pd->depth++;
+  if (!pd->swtab[pd->state])
+    return;
   for (sw = pd->swtab[pd->state]; sw->from == pd->state; sw++)
     if (!strcmp(sw->ename, name))
       break;
@@ -483,64 +668,46 @@ startElement(void *userData, const char *name, const char **atts)
         pd->kind = "product";
       else if (name[2] == 't' && name[3] == 'c')
         pd->kind = "patch";
-      
-      /**
-       * now we have two cases, one is that we are in the package tag of a new package
-       * and the other is that we are in the tag of an extension file like other.xml or
-       * filelist.xml.
-       * We identify it by looking the attributes
-       *
-       * new package
-       * <package>
-       *     <name>...
-       *     <version...>
-       *
-       * extension package:
-       *
-       * For other.xml
-       *
-       * <package pkgid="b78f8664cd90efe42e09a345e272997ef1b53c18"
-       *          name="zaptel-kmp-default"
-       *          arch="i586">
-       *     <version epoch="0"
-       *              ver="1.2.10_2.6.22_rc4_git6_2"
-       *              rel="70"/>
-       */
-
-      /* first check if there is a pkgid attribute */
-      const char *pkgid = find_attr( "pkgid", atts);
-
-      if ( pkgid == NULL )
+
+      /* to support extension metadata files like others.xml which
+         have the following structure:
+
+         <otherdata xmlns="http://linux.duke.edu/metadata/other"
+                    packages="101">
+           <package pkgid="b78f8664cd90efe42e09a345e272997ef1b53c18"
+                    name="zaptel-kmp-default"
+                    arch="i586"><version epoch="0"
+                    ver="1.2.10_2.6.22_rc4_git6_2" rel="70"/>
+              ...
+
+         we need to check if the pkgid is there and if it matches
+         an already seen package, that means we don't need to create
+         a new solvable but just append the attributes to the existing
+         one.
+      */
+      const char *pkgid;
+      if ((pkgid = find_attr("pkgid", atts)) != NULL)
+        {
+          // look at the checksum cache
+          Id index = stringpool_str2id(&pd->cspool, pkgid, 0);
+          if (!index || index >= pd->ncscache || !pd->cscache[index])
+           {
+              fprintf(stderr, "error, the repository specifies extra information about package with checksum '%s', which does not exist in the repository.\n", pkgid);
+              exit(1);
+           }
+         pd->solvable = pool_id2solvable(pool, pd->cscache[index]);
+        }
+       else
         {
           /* this is a new package */
-          /*fprintf(stderr, "new package\n");*/
           pd->solvable = pool_id2solvable(pool, repo_add_solvable(pd->common.repo));
           pd->freshens = 0;
-          repodata_extend(pd->data, pd->solvable - pool->solvables);
         }
-      else
-        {
-          /* we need to look for the package based on the pkgid */
-          Dataiterator di;
-          dataiterator_init(&di, pd->common.repo, -1, SOLVABLE_CHECKSUM, pkgid, SEARCH_STRING);
-          if (dataiterator_step(&di))
-            {
-              /* we found it */
-              /*fprintf(stderr, "package found '%i'\n", di.solvid);*/
-              pd->solvable = pool_id2solvable(pool, di.solvid);
-            }
-          else
-            {
-              /* this is bad, here we should ignore the whole solvable */
-              fprintf(stderr, "can't find package with checksum '%s'\n", pkgid);
-              //exit(1);
-            }
-        }
-
-      pd->handle = repodata_get_handle(pd->data, (pd->solvable - pool->solvables) - pd->data->start);
+      pd->handle = pd->solvable - pool->solvables;
 #if 0
       fprintf(stderr, "package #%d\n", pd->solvable - pool->solvables);
 #endif
+
       break;
     case STATE_VERSION:
       s->evr = makeevr_atts(pool, pd, atts);
@@ -601,24 +768,12 @@ startElement(void *userData, const char *name, const char **atts)
       break;
     case STATE_SUMMARY:
     case STATE_DESCRIPTION:
-      pd->lang = find_attr("lang", atts);
+      pd->tmplang = find_attr("lang", atts);
       break;
     case STATE_LOCATION:
       str = find_attr("href", atts);
       if (str)
-       {
-         const char *str2 = strrchr(str, '/');
-         if (str2)
-           {
-             char *str3 = strdup(str);
-             str3[str2 - str] = 0;
-             repodata_set_poolstr(pd->data, handle, SOLVABLE_MEDIADIR, str3);
-             free(str3);
-              repodata_set_str(pd->data, handle, SOLVABLE_MEDIAFILE, str2 + 1);
-           }
-         else
-            repodata_set_str(pd->data, handle, SOLVABLE_MEDIAFILE, str);
-       }
+       repodata_set_location(pd->data, handle, 0, 0, str);
       break;
     case STATE_CHECKSUM:
       pd->tmpattr = find_attr("type", atts);
@@ -653,11 +808,62 @@ startElement(void *userData, const char *name, const char **atts)
        if (str && (end = atoi(str)) != 0)
          repodata_set_num(pd->data, handle, SOLVABLE_HEADEREND, end);
       }
+      /*
+        <diskusage>
+          <dirs>
+            <dir name="/" size="56" count="11"/>
+            <dir name="usr/" size="56" count="11"/>
+            <dir name="usr/bin/" size="38" count="10"/>
+            <dir name="usr/share/" size="18" count="1"/>
+            <dir name="usr/share/doc/" size="18" count="1"/>
+          </dirs>
+        </diskusage>
+      */
+    case STATE_DISKUSAGE:
+      {
+        /* Really, do nothing, wat for <dir> tag */
+        break;
+      }
+    case STATE_DIR:
+      {
+        long filesz = 0, filenum = 0;
+        unsigned dirid;
+        if ( (str = find_attr("name", atts)) )
+          {
+            dirid = repodata_str2dir(pd->data, str, 1);
+          }
+        else
+          {
+            fprintf( stderr, "<dir .../> tag without 'name' attribute, atts = %p, *atts = %p\n", atts, *atts);
+            break;
+          }
+        if ( (str = find_attr("size", atts)) )
+          {
+            filesz = strtol (str, 0, 0);
+          }
+        if ( (str = find_attr("count", atts)) )
+          {
+            filenum = strtol (str, 0, 0);
+          }
+        pd->dirs = sat_extend(pd->dirs, pd->ndirs, 1, sizeof(pd->dirs[0]), 31);
+        pd->dirs[pd->ndirs][0] = dirid;
+        pd->dirs[pd->ndirs][1] = filesz;
+        pd->dirs[pd->ndirs][2] = filenum;
+        pd->ndirs++;
+        break;
+      }
     default:
       break;
     }
 }
 
+
+/*
+ * endElement
+ * XML callback
+ *
+ */
+
 static void XMLCALL
 endElement(void *userData, const char *name)
 {
@@ -680,8 +886,8 @@ endElement(void *userData, const char *name)
   /* ignore patterns & metadata */
   if (pd->state == STATE_START && !strcmp(name, "patterns"))
     return;
-  if (pd->state == STATE_START && !strcmp(name, "metadata"))
-    return;
+  //if (pd->state == STATE_START && !strcmp(name, "metadata"))
+  //  return;
   if (pd->state == STATE_SOLVABLE && !strcmp(name, "format"))
     return;
 
@@ -689,8 +895,6 @@ endElement(void *userData, const char *name)
   pd->statedepth--;
   switch (pd->state)
     {
-    case STATE_PATTERN:
-    case STATE_PRODUCT:
     case STATE_SOLVABLE:
       if (!s->arch)
         s->arch = ARCH_NOARCH;
@@ -698,7 +902,8 @@ endElement(void *userData, const char *name)
         s->evr = ID_EMPTY;     /* some patterns have this */
       if (s->arch != ARCH_SRC && s->arch != ARCH_NOSRC)
         s->provides = repo_addid_dep(repo, s->provides, rel2id(pool, s->name, s->evr, REL_EQ, 1), 0);
-      s->supplements = repo_fix_legacy(repo, s->provides, s->supplements, pd->freshens);
+      s->supplements = repo_fix_supplements(repo, s->provides, s->supplements, pd->freshens);
+      s->conflicts = repo_fix_conflicts(repo, s->conflicts);
       pd->freshens = 0;
       pd->kind = 0;
       break;
@@ -721,9 +926,9 @@ endElement(void *userData, const char *name)
       repodata_set_poolstr(pd->data, handle, SOLVABLE_LICENSE, pd->content);
       break;
     case STATE_CHECKSUM:
-      { 
+      {
         int l;
-        Id type;
+        Id type, index;
         if (!strcasecmp (pd->tmpattr, "sha") || !strcasecmp (pd->tmpattr, "sha1"))
           l = SIZEOF_SHA1 * 2, type = REPOKEY_TYPE_SHA1;
         else if (!strcasecmp (pd->tmpattr, "md5"))
@@ -739,8 +944,18 @@ endElement(void *userData, const char *name)
             exit(1);
           }
         repodata_set_checksum(pd->data, handle, SOLVABLE_CHECKSUM, type, pd->content);
+        /* we save the checksum to solvable id relationship for extended
+           metadata */
+        index = stringpool_str2id(&pd->cspool, pd->content, 1 /* create it */);
+        if (index >= pd->ncscache)
+          {
+            pd->cscache = sat_zextend(pd->cscache, pd->ncscache, index + 1 - pd->ncscache, sizeof(Id), 255);
+            pd->ncscache = index + 1;
+          }
+        /* add the checksum to the cache */
+        pd->cscache[index] = s - pool->solvables;
+        break;
       }
-      break;
     case STATE_FILE:
 #if 0
       id = str2id(pool, pd->content, 1);
@@ -761,13 +976,16 @@ endElement(void *userData, const char *name)
       repodata_add_dirstr(pd->data, handle, SOLVABLE_FILELIST, id, p);
       break;
     case STATE_SUMMARY:
-      pd->lang = 0;
+      pd->tmplang = 0;
       repodata_set_str(pd->data, handle, SOLVABLE_SUMMARY, pd->content);
       break;
     case STATE_DESCRIPTION:
-      pd->lang = 0;
+      pd->tmplang = 0;
       set_desciption_author(pd->data, handle, pd->content);
       break;
+    case STATE_DISTRIBUTION:
+        repodata_set_poolstr(pd->data, handle, SOLVABLE_DISTRIBUTION, pd->content);
+        break;
     case STATE_URL:
       if (pd->content[0])
        repodata_set_str(pd->data, handle, SOLVABLE_URL, pd->content);
@@ -779,6 +997,43 @@ endElement(void *userData, const char *name)
     case STATE_SOURCERPM:
       set_sourcerpm(pd->data, s, handle, pd->content);
       break;
+    case STATE_RELNOTESURL:
+      if (pd->content[0])
+        {
+          repodata_add_poolstr_array(pd->data, pd->handle, PRODUCT_URL, pd->content);
+          repodata_add_idarray(pd->data, pd->handle, PRODUCT_URL_TYPE, str2id(pool, "releasenotes", 1));
+        }
+      break;
+    case STATE_UPDATEURL:
+      if (pd->content[0])
+        {
+          repodata_add_poolstr_array(pd->data, pd->handle, PRODUCT_URL, pd->content);
+          repodata_add_idarray(pd->data, pd->handle, PRODUCT_URL_TYPE, str2id(pool, "update", 1));
+        }
+      break;
+    case STATE_OPTIONALURL:
+      if (pd->content[0])
+        {
+          repodata_add_poolstr_array(pd->data, pd->handle, PRODUCT_URL, pd->content);
+          repodata_add_idarray(pd->data, pd->handle, PRODUCT_URL_TYPE, str2id(pool, "optional", 1));
+        }
+      break;
+    case STATE_FLAG:
+      if (pd->content[0])
+          repodata_set_poolstr(pd->data, handle, PRODUCT_FLAGS, pd->content);
+      break;
+    case STATE_EULA:
+      if (pd->content[0])
+        repodata_set_str(pd->data, handle, langtag(pd, SOLVABLE_EULA, pd->language), pd->content);
+      break;
+    case STATE_KEYWORD:
+      if (pd->content[0])
+        repodata_add_poolstr_array(pd->data, pd->handle, SOLVABLE_KEYWORDS, pd->content);
+      break;
+    case STATE_DISKUSAGE:
+      if (pd->ndirs)
+        commit_diskusage (pd, pd->handle);
+      break;
     default:
       break;
     }
@@ -787,6 +1042,13 @@ endElement(void *userData, const char *name)
   // fprintf(stderr, "back from known %d %d %d\n", pd->state, pd->depth, pd->statedepth);
 }
 
+
+/*
+ * characterData
+ * XML callback
+ *
+ */
+
 static void XMLCALL
 characterData(void *userData, const XML_Char *s, int len)
 {
@@ -810,16 +1072,33 @@ characterData(void *userData, const XML_Char *s, int len)
 }
 
 
+/*-----------------------------------------------*/
+/* 'main' */
+
 #define BUFF_SIZE 8192
 
+/*
+ * repo_add_rpmmd
+ * parse rpm-md metadata (primary, others)
+ *
+ */
+
 void
-repo_add_rpmmd(Repo *repo, FILE *fp, int flags)
+repo_add_rpmmd(Repo *repo, FILE *fp, const char *language, int flags)
 {
   Pool *pool = repo->pool;
   struct parsedata pd;
   char buf[BUFF_SIZE];
   int i, l;
   struct stateswitch *sw;
+  Repodata *data;
+  unsigned int now;
+
+  now = sat_timems(0);
+  if (!(flags & REPO_REUSE_REPODATA))
+    data = repo_add_repodata(repo, 0);
+  else
+    data = repo_last_repodata(repo);
 
   memset(&pd, 0, sizeof(pd));
   for (i = 0, sw = stateswitches; sw->from != NUMSTATES; i++, sw++)
@@ -831,7 +1110,7 @@ repo_add_rpmmd(Repo *repo, FILE *fp, int flags)
   pd.common.pool = pool;
   pd.common.repo = repo;
 
-  pd.data = repo_add_repodata(repo, 0);
+  pd.data = data;
 
   pd.content = sat_malloc(256);
   pd.acontent = 256;
@@ -839,6 +1118,13 @@ repo_add_rpmmd(Repo *repo, FILE *fp, int flags)
   pd.common.tmp = 0;
   pd.common.tmpl = 0;
   pd.kind = 0;
+  pd.language = language;
+
+  /* initialize the string pool where we will store
+     the package checksums we know about, to get an Id
+     we can use in a cache */
+  stringpool_init_empty(&pd.cspool);
+
   XML_Parser parser = XML_ParserCreate(NULL);
   XML_SetUserData(parser, &pd);
   pd.parser = &parser;
@@ -856,9 +1142,13 @@ repo_add_rpmmd(Repo *repo, FILE *fp, int flags)
        break;
     }
   XML_ParserFree(parser);
-
-  if (pd.data)
-    repodata_internalize(pd.data);
   sat_free(pd.content);
   join_freemem();
+  stringpool_free(&pd.cspool);
+  sat_free(pd.cscache);
+  if (!(flags & REPO_NO_INTERNALIZE))
+    repodata_internalize(data);
+  POOL_DEBUG(SAT_DEBUG_STATS, "repo_add_rpmmd took %d ms\n", sat_timems(now));
+  POOL_DEBUG(SAT_DEBUG_STATS, "repo size: %d solvables\n", repo->nsolvables);
+  POOL_DEBUG(SAT_DEBUG_STATS, "repo memory used: %ld K incore, %ld K idarray\n", (unsigned long)data->incoredatalen/1024, (unsigned long)repo->idarraysize / (1024/sizeof(Id)));
 }