Imported Upstream version 0.7.2
[platform/upstream/libsolv.git] / ext / repo_deltainfoxml.c
index 5ca9382..ad315da 100644 (file)
@@ -5,26 +5,17 @@
  * for further information
  */
 
-#define DO_ARRAY 1
-
 #define _GNU_SOURCE
 #include <sys/types.h>
-#include <limits.h>
-#include <fcntl.h>
 #include <stdio.h>
 #include <stdlib.h>
 #include <string.h>
-#include <expat.h>
 
 #include "pool.h"
 #include "repo.h"
 #include "chksum.h"
-#include "repo_updateinfoxml.h"
-
-#define DISABLE_SPLIT
-#include "tools_util.h"
-
-/* #define DUMPOUT 1 */
+#include "solv_xmlparser.h"
+#include "repo_deltainfoxml.h"
 
 /*
  * <deltainfo>
@@ -57,15 +48,7 @@ enum state {
   NUMSTATES
 };
 
-struct stateswitch {
-  enum state from;
-  char *ename;
-  enum state to;
-  int docontent;
-};
-
-/* !! must be sorted by first column !! */
-static struct stateswitch stateswitches[] = {
+static struct solv_xmlparser_element stateswitches[] = {
   /* compatibility with old yum-presto */
   { STATE_START,       "prestodelta",     STATE_START, 0 },
   { STATE_START,       "deltainfo",       STATE_START, 0 },
@@ -82,12 +65,10 @@ static struct stateswitch stateswitches[] = {
 
 /* Cumulated info about the current deltarpm or patchrpm */
 struct deltarpm {
-  Id locdir;
-  Id locname;
-  Id locevr;
-  Id locsuffix;
-  unsigned buildtime;
-  unsigned downloadsize, archivesize;
+  char *location;
+  char *locbase;
+  unsigned int buildtime;
+  unsigned long long downloadsize;
   char *filechecksum;
   int filechecksumtype;
   /* Baseversion.  deltarpm only has one. */
@@ -99,22 +80,11 @@ struct deltarpm {
 };
 
 struct parsedata {
-  int depth;
-  enum state state;
-  int statedepth;
-  char *content;
-  int lcontent;
-  int acontent;
-  int docontent;
+  int ret;
   Pool *pool;
   Repo *repo;
   Repodata *data;
-  
-  struct stateswitch *swtab[NUMSTATES];
-  enum state sbtab[NUMSTATES];
-  char *tempstr;
-  int ltemp;
-  int atemp;
+
   struct deltarpm delta;
   Id newpkgevr;
   Id newpkgname;
@@ -122,22 +92,9 @@ struct parsedata {
 
   Id *handles;
   int nhandles;
-};
 
-/*
- * find attribute
- */
-
-static const char *
-find_attr(const char *txt, const char **atts)
-{
-  for (; *atts; atts += 2)
-    {
-      if (!strcmp(*atts, txt))
-        return atts[1];
-    }
-  return 0;
-}
+  struct solv_xmlparser xmlp;
+};
 
 
 /*
@@ -148,7 +105,7 @@ static Id
 makeevr_atts(Pool *pool, struct parsedata *pd, const char **atts)
 {
   const char *e, *v, *r, *v2;
-  char *c;
+  char *c, *space;
   int l;
 
   e = v = r = 0;
@@ -167,7 +124,7 @@ makeevr_atts(Pool *pool, struct parsedata *pd, const char **atts)
       else if (!strcmp(*atts, "oldrelease"))
        r = atts[1];
     }
-  if (e && !strcmp(e, "0"))
+  if (e && (!*e || !strcmp(e, "0")))
     e = 0;
   if (v && !e)
     {
@@ -183,12 +140,7 @@ makeevr_atts(Pool *pool, struct parsedata *pd, const char **atts)
     l += strlen(v);
   if (r)
     l += strlen(r) + 1;
-  if (l > pd->acontent)
-    {
-      pd->content = solv_realloc(pd->content, l + 256);
-      pd->acontent = l + 256;
-    }
-  c = pd->content;
+  c = space = solv_xmlparser_contentspace(&pd->xmlp, l);
   if (e)
     {
       strcpy(c, e);
@@ -207,196 +159,80 @@ makeevr_atts(Pool *pool, struct parsedata *pd, const char **atts)
       c += strlen(c);
     }
   *c = 0;
-  if (!*pd->content)
+  if (!*space)
     return 0;
 #if 0
-  fprintf(stderr, "evr: %s\n", pd->content);
+  fprintf(stderr, "evr: %s\n", space);
 #endif
-  return pool_str2id(pool, pd->content, 1);
+  return pool_str2id(pool, space, 1);
 }
 
-static void parse_delta_location( struct parsedata *pd, 
-                                  const char* str )
-{
-  Pool *pool = pd->pool;
-  if (str)
-    {
-      /* Separate the filename into its different parts.
-        rpm/x86_64/alsa-1.0.14-31_31.2.x86_64.delta.rpm
-        --> dir = rpm/x86_64
-        name = alsa
-        evr = 1.0.14-31_31.2
-        suffix = x86_64.delta.rpm.  */
-      char *real_str = solv_strdup(str);
-      char *s = real_str;
-      char *s1, *s2;
-      s1 = strrchr (s, '/');
-      if (s1)
-       {
-         pd->delta.locdir = pool_strn2id(pool, s, s1 - s, 1);
-         s = s1 + 1;
-       }
-      /* Guess suffix.  */
-      s1 = strrchr (s, '.');
-      if (s1)
-       {
-         for (s2 = s1 - 1; s2 > s; s2--)
-           if (*s2 == '.')
-             break;
-         if (!strcmp (s2, ".delta.rpm") || !strcmp (s2, ".patch.rpm"))
-           {
-             s1 = s2;
-             /* We accept one more item as suffix.  */
-             for (s2 = s1 - 1; s2 > s; s2--)
-               if (*s2 == '.')
-                 break;
-             s1 = s2;
-           }
-         if (*s1 == '.')
-           *s1++ = 0;
-         pd->delta.locsuffix = pool_str2id(pool, s1, 1); 
-       }
-      /* Last '-'.  */
-      s1 = strrchr (s, '-');
-      if (s1)
-       {
-         /* Second to last '-'.  */
-         for (s2 = s1 - 1; s2 > s; s2--)
-           if (*s2 == '-')
-             break;
-       }
-      else
-       s2 = 0;
-      if (s2 > s && *s2 == '-')
-       {
-         *s2++ = 0;
-         pd->delta.locevr = pool_str2id(pool, s2, 1);
-       }
-      pd->delta.locname = pool_str2id(pool, s, 1);
-      free(real_str);
-    }
-}
-                                 
-static void XMLCALL
-startElement(void *userData, const char *name, const char **atts)
+static void
+startElement(struct solv_xmlparser *xmlp, int state, const char *name, const char **atts)
 {
-  struct parsedata *pd = userData;
+  struct parsedata *pd = xmlp->userdata;
   Pool *pool = pd->pool;
-  struct stateswitch *sw;
   const char *str;
 
-#if 0
-  fprintf(stderr, "start: [%d]%s\n", pd->state, name);
-#endif
-  if (pd->depth != pd->statedepth)
+  switch(state)
     {
-      pd->depth++;
-      return;
-    }
-
-  pd->depth++;
-  if (!pd->swtab[pd->state])
-    return;
-  for (sw = pd->swtab[pd->state]; sw->from == pd->state; sw++)  /* find name in statetable */
-    if (!strcmp(sw->ename, name))
-      break;
-  if (sw->from != pd->state)
-    {
-#if 0
-      fprintf(stderr, "into unknown: [%d]%s (from: %d)\n", sw->to, name, sw->from);
-      exit( 1 );
-#endif
-      return;
-    }
-  pd->state = sw->to;
-  pd->docontent = sw->docontent;
-  pd->statedepth = pd->depth;
-  pd->lcontent = 0;
-  *pd->content = 0;
-
-  switch(pd->state)
-    {
-    case STATE_START:
-      break;
     case STATE_NEWPACKAGE:
-      if ((str = find_attr("name", atts)) != 0)
+      if ((str = solv_xmlparser_find_attr("name", atts)) != 0)
        pd->newpkgname = pool_str2id(pool, str, 1);
       pd->newpkgevr = makeevr_atts(pool, pd, atts);
-      if ((str = find_attr("arch", atts)) != 0)
+      if ((str = solv_xmlparser_find_attr("arch", atts)) != 0)
        pd->newpkgarch = pool_str2id(pool, str, 1);
       break;
 
     case STATE_DELTA:
       memset(&pd->delta, 0, sizeof(pd->delta));
-      *pd->tempstr = 0;
-      pd->ltemp = 0;
       pd->delta.bevr = solv_extend(pd->delta.bevr, pd->delta.nbevr, 1, sizeof(Id), 7);
       pd->delta.bevr[pd->delta.nbevr++] = makeevr_atts(pool, pd, atts);
       break;
+
     case STATE_FILENAME:
+      if ((str = solv_xmlparser_find_attr("xml:base", atts)))
+        pd->delta.locbase = solv_strdup(str);
       break;
+
     case STATE_LOCATION:
-      parse_delta_location(pd, find_attr("href", atts));
-      break;
-    case STATE_SIZE:
+      pd->delta.location = solv_strdup(solv_xmlparser_find_attr("href", atts));
+      if ((str = solv_xmlparser_find_attr("xml:base", atts)))
+        pd->delta.locbase = solv_strdup(str);
       break;
+
     case STATE_CHECKSUM:
       pd->delta.filechecksum = 0;
       pd->delta.filechecksumtype = REPOKEY_TYPE_SHA1;
-      if ((str = find_attr("type", atts)) != 0)
+      if ((str = solv_xmlparser_find_attr("type", atts)) != 0)
        {
          pd->delta.filechecksumtype = solv_chksum_str2type(str);
          if (!pd->delta.filechecksumtype)
            pool_debug(pool, SOLV_ERROR, "unknown checksum type: '%s'\n", str);
        }
-    case STATE_SEQUENCE:
       break;
+
     default:
       break;
     }
 }
 
 
-static void XMLCALL
-endElement(void *userData, const char *name)
+static void
+endElement(struct solv_xmlparser *xmlp, int state, char *content)
 {
-  struct parsedata *pd = userData;
+  struct parsedata *pd = xmlp->userdata;
   Pool *pool = pd->pool;
   const char *str;
 
-#if 0
-  fprintf(stderr, "end: %s\n", name);
-#endif
-  if (pd->depth != pd->statedepth)
+  switch (state)
     {
-      pd->depth--;
-#if 0
-      fprintf(stderr, "back from unknown %d %d %d\n", pd->state, pd->depth, pd->statedepth);
-#endif
-      return;
-    }
-
-  pd->depth--;
-  pd->statedepth--;
-  switch (pd->state)
-    {
-    case STATE_START:
-      break;
-    case STATE_NEWPACKAGE:
-      break;
     case STATE_DELTA:
       {
        /* read all data for a deltarpm. commit into attributes */
        Id handle;
        struct deltarpm *d = &pd->delta;
-#ifdef DUMPOUT
-       int i;
-#endif
-
-#ifdef DUMPOUT
 
-       fprintf (stderr, "found deltarpm for %s:\n", id2str(pool, pd->newpkgname));
-#endif
        handle = repodata_new_handle(pd->data);
        /* we commit all handles later on in one go so that the
          * repodata code doesn't need to realloc every time */
@@ -405,81 +241,43 @@ endElement(void *userData, const char *name)
        repodata_set_id(pd->data, handle, DELTA_PACKAGE_NAME, pd->newpkgname);
        repodata_set_id(pd->data, handle, DELTA_PACKAGE_EVR, pd->newpkgevr);
        repodata_set_id(pd->data, handle, DELTA_PACKAGE_ARCH, pd->newpkgarch);
-       repodata_set_id(pd->data, handle, DELTA_LOCATION_NAME, d->locname);
-       repodata_set_id(pd->data, handle, DELTA_LOCATION_DIR, d->locdir);
-       repodata_set_id(pd->data, handle, DELTA_LOCATION_EVR, d->locevr);
-       repodata_set_id(pd->data, handle, DELTA_LOCATION_SUFFIX, d->locsuffix);
+       if (d->location)
+         {
+           repodata_set_deltalocation(pd->data, handle, 0, 0, d->location);
+           if (d->locbase)
+             repodata_set_poolstr(pd->data, handle, DELTA_LOCATION_BASE, d->locbase);
+         }
        if (d->downloadsize)
-         repodata_set_num(pd->data, handle, DELTA_DOWNLOADSIZE, (d->downloadsize + 1023) / 1024);
+         repodata_set_num(pd->data, handle, DELTA_DOWNLOADSIZE, d->downloadsize);
        if (d->filechecksum)
          repodata_set_checksum(pd->data, handle, DELTA_CHECKSUM, d->filechecksumtype, d->filechecksum);
-#ifdef DUMPOUT
-       fprintf (stderr, "   loc: %s %s %s %s\n", id2str(pool, d->locdir),
-                id2str(pool, d->locname), id2str(pool, d->locevr),
-                id2str(pool, d->locsuffix));
-       fprintf (stderr, "  size: %d down\n", d->downloadsize);
-       fprintf (stderr, "  chek: %s\n", d->filechecksum);
-#endif
-
        if (d->seqnum)
          {
-#ifdef DUMPOUT
-           fprintf (stderr, "  base: %s\n",
-                    id2str(pool, d->bevr[0]));
-           fprintf (stderr, "            seq: %s\n",
-                    id2str(pool, d->seqname));
-           fprintf (stderr, "                 %s\n",
-                    id2str(pool, d->seqevr));
-           fprintf (stderr, "                 %s\n",
-                    d->seqnum);
-#endif
            repodata_set_id(pd->data, handle, DELTA_BASE_EVR, d->bevr[0]);
            repodata_set_id(pd->data, handle, DELTA_SEQ_NAME, d->seqname);
            repodata_set_id(pd->data, handle, DELTA_SEQ_EVR, d->seqevr);
            /* should store as binary blob! */
            repodata_set_str(pd->data, handle, DELTA_SEQ_NUM, d->seqnum);
-
-#ifdef DUMPOUT
-           fprintf(stderr, "OK\n");
-#endif
-
-#ifdef DUMPOUT              
-           if (d->seqevr != d->bevr[0])
-             fprintf (stderr, "XXXXX evr\n");
-           /* Name of package ("xxxx") should match the sequence info
-              name.  */
-           if (strcmp(id2str(pool, d->seqname), id2str(pool, pd->newpkgname)))
-             fprintf (stderr, "XXXXX name\n");
-#endif
          }
-       else
-         {
-
-#ifdef DUMPOUT                          
-           fprintf (stderr, "  base:");
-           for (i = 0; i < d->nbevr; i++)
-             fprintf (stderr, " %s", id2str(pool, d->bevr[i]));
-           fprintf (stderr, "\n");
-#endif
-         }
-
       }
       pd->delta.filechecksum = solv_free(pd->delta.filechecksum);
       pd->delta.bevr = solv_free(pd->delta.bevr);
       pd->delta.nbevr = 0;
       pd->delta.seqnum = solv_free(pd->delta.seqnum);
+      pd->delta.location = solv_free(pd->delta.location);
+      pd->delta.locbase = solv_free(pd->delta.locbase);
       break;
     case STATE_FILENAME:
-      parse_delta_location(pd, pd->content);
+      pd->delta.location = solv_strdup(content);
       break;
     case STATE_CHECKSUM:
-      pd->delta.filechecksum = solv_strdup(pd->content);
+      pd->delta.filechecksum = solv_strdup(content);
       break;
     case STATE_SIZE:
-      pd->delta.downloadsize = atoi(pd->content);
+      pd->delta.downloadsize = strtoull(content, 0, 10);
       break;
     case STATE_SEQUENCE:
-      if ((str = pd->content))
+      if ((str = content) != 0)
        {
          const char *s1, *s2;
          s1 = strrchr(str, '-');
@@ -506,93 +304,36 @@ endElement(void *userData, const char *name)
     default:
       break;
     }
-
-  pd->state = pd->sbtab[pd->state];
-  pd->docontent = 0;
 }
 
-
-static void XMLCALL
-characterData(void *userData, const XML_Char *s, int len)
-{
-  struct parsedata *pd = userData;
-  int l;
-  char *c;
-  if (!pd->docontent)
-    return;
-  l = pd->lcontent + len + 1;
-  if (l > pd->acontent)
-    {
-      pd->content = solv_realloc(pd->content, l + 256);
-      pd->acontent = l + 256;
-    }
-  c = pd->content + pd->lcontent;
-  pd->lcontent += len;
-  while (len-- > 0)
-    *c++ = *s++;
-  *c = 0;
-}
-
-#define BUFF_SIZE 8192
-
-void
+int
 repo_add_deltainfoxml(Repo *repo, FILE *fp, int flags)
 {
   Pool *pool = repo->pool;
-  struct parsedata pd;
-  char buf[BUFF_SIZE];
-  int i, l;
-  struct stateswitch *sw;
   Repodata *data;
-  XML_Parser parser;
+  struct parsedata pd;
+  int i;
 
   data = repo_add_repodata(repo, flags);
 
   memset(&pd, 0, sizeof(pd));
-  for (i = 0, sw = stateswitches; sw->from != NUMSTATES; i++, sw++)
-    {
-      if (!pd.swtab[sw->from])
-        pd.swtab[sw->from] = sw;
-      pd.sbtab[sw->to] = sw->from;
-    }
   pd.pool = pool;
   pd.repo = repo;
   pd.data = data;
-
-  pd.content = solv_malloc(256);
-  pd.acontent = 256;
-  pd.lcontent = 0;
-  pd.tempstr = malloc(256);
-  pd.atemp = 256;
-  pd.ltemp = 0;
-
-  parser = XML_ParserCreate(NULL);
-  XML_SetUserData(parser, &pd);
-  XML_SetElementHandler(parser, startElement, endElement);
-  XML_SetCharacterDataHandler(parser, characterData);
-  for (;;)
-    {
-      l = fread(buf, 1, sizeof(buf), fp);
-      if (XML_Parse(parser, buf, l, l == 0) == XML_STATUS_ERROR)
-       {
-         pool_debug(pool, SOLV_FATAL, "repo_updateinfoxml: %s at line %u:%u\n", XML_ErrorString(XML_GetErrorCode(parser)), (unsigned int)XML_GetCurrentLineNumber(parser), (unsigned int)XML_GetCurrentColumnNumber(parser));
-         exit(1);
-       }
-      if (l == 0)
-       break;
-    }
-  XML_ParserFree(parser);
-  solv_free(pd.content);
-  solv_free(pd.tempstr);
-  join_freemem();
+  solv_xmlparser_init(&pd.xmlp, stateswitches, &pd, startElement, endElement);
+  if (solv_xmlparser_parse(&pd.xmlp, fp) != SOLV_XMLPARSER_OK)
+     pd.ret = pool_error(pd.pool, -1, "repo_deltainfoxml: %s at line %u:%u", pd.xmlp.errstr, pd.xmlp.line, pd.xmlp.column);
+  solv_xmlparser_free(&pd.xmlp);
 
   /* now commit all handles */
-  for (i = 0; i < pd.nhandles; i++)
-    repodata_add_flexarray(pd.data, SOLVID_META, REPOSITORY_DELTAINFO, pd.handles[i]);
+  if (!pd.ret)
+    for (i = 0; i < pd.nhandles; i++)
+      repodata_add_flexarray(pd.data, SOLVID_META, REPOSITORY_DELTAINFO, pd.handles[i]);
   solv_free(pd.handles);
 
   if (!(flags & REPO_NO_INTERNALIZE))
     repodata_internalize(data);
+  return pd.ret;
 }
 
 /* EOF */