Fix access after end of search string in regex matcher
[platform/upstream/glibc.git] / posix / bug-regex17.c
1 /* German regular expression tests.
2    Copyright (C) 2002, 2003, 2009 Free Software Foundation, Inc.
3    This file is part of the GNU C Library.
4    Contributed by Jakub Jelinek <jakub@redhat.com>, 2002.
5
6    The GNU C Library is free software; you can redistribute it and/or
7    modify it under the terms of the GNU Lesser General Public
8    License as published by the Free Software Foundation; either
9    version 2.1 of the License, or (at your option) any later version.
10
11    The GNU C Library is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14    Lesser General Public License for more details.
15
16    You should have received a copy of the GNU Lesser General Public
17    License along with the GNU C Library; if not, write to the Free
18    Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA
19    02111-1307 USA.  */
20
21 #include <sys/types.h>
22 #include <mcheck.h>
23 #include <regex.h>
24 #include <stdio.h>
25 #include <stdlib.h>
26 #include <locale.h>
27
28 /* Tests supposed to match.  */
29 struct
30 {
31   const char *pattern;
32   const char *string;
33   int flags, nmatch;
34   regmatch_t rm[5];
35 } tests[] = {
36   /* U+00C4     \xc3\x84        LATIN CAPITAL LETTER A WITH DIAERESIS
37      U+00D6     \xc3\x96        LATIN CAPITAL LETTER O WITH DIAERESIS
38      U+00E4     \xc3\xa4        LATIN SMALL LETTER A WITH DIAERESIS
39      U+00F6     \xc3\xb6        LATIN SMALL LETTER O WITH DIAERESIS  */
40   { "\xc3\x84\xc3\x96*\xc3\xb6$", "aB\xc3\xa4\xc3\xb6\xc3\xb6\xc3\x96", REG_ICASE, 2,
41     { { 2, 10 }, { -1, -1 } } },
42   { "[\xc3\x84x]\xc3\x96*\xc3\xb6$", "aB\xc3\x84\xc3\xb6\xc3\xb6\xc3\x96", REG_ICASE, 2,
43     { { 2, 10 }, { -1, -1 } } },
44   { "[\xc3\x84x]\xc3\x96*\xc3\xb6$", "aB\xc3\xa4\xc3\xb6\xc3\xb6\xc3\x96", REG_ICASE, 2,
45     { { 2, 10 }, { -1, -1 } } },
46   { "[^x]\xc3\x96*\xc3\xb6$", "aB\xc3\xa4\xc3\xb6\xc3\xb6\xc3\x96", REG_ICASE, 2,
47     { { 2, 10 }, { -1, -1 } } },
48
49   /* Tests for bug 9697:
50      U+00DF     \xc3\x9f        LATIN SMALL LETTER SHARP S
51      U+02DA     \xcb\x9a        RING ABOVE
52      U+02E2     \xcb\xa2        MODIFIER LETTER SMALL S  */
53   { "[a-z]|[^a-z]", "\xcb\xa2", REG_EXTENDED, 2,
54     { { 0, 2 }, { -1, -1 } } },
55   { "[a-z]", "\xc3\x9f", REG_EXTENDED, 2,
56     { { 0, 2 }, { -1, -1 } } },
57   { "[^a-z]", "\xcb\x9a", REG_EXTENDED, 2,
58     { { 0, 2 }, { -1, -1 } } },
59 };
60
61
62 static int
63 do_test (void)
64 {
65   regex_t re;
66   regmatch_t rm[5];
67   size_t i;
68   int n, ret = 0;
69
70   setlocale (LC_ALL, "de_DE.UTF-8");
71   for (i = 0; i < sizeof (tests) / sizeof (tests[0]); ++i)
72     {
73       n = regcomp (&re, tests[i].pattern, tests[i].flags);
74       if (n != 0)
75         {
76           char buf[500];
77           regerror (n, &re, buf, sizeof (buf));
78           printf ("regcomp %zd failed: %s\n", i, buf);
79           ret = 1;
80           continue;
81         }
82
83       if (regexec (&re, tests[i].string, tests[i].nmatch, rm, 0))
84         {
85           printf ("regexec %zd failed\n", i);
86           ret = 1;
87           regfree (&re);
88           continue;
89         }
90
91       for (n = 0; n < tests[i].nmatch; ++n)
92         if (rm[n].rm_so != tests[i].rm[n].rm_so
93               || rm[n].rm_eo != tests[i].rm[n].rm_eo)
94           {
95             if (tests[i].rm[n].rm_so == -1 && tests[i].rm[n].rm_eo == -1)
96               break;
97             printf ("regexec match failure rm[%d] %d..%d\n",
98                     n, rm[n].rm_so, rm[n].rm_eo);
99             ret = 1;
100             break;
101           }
102
103       regfree (&re);
104     }
105
106   return ret;
107 }
108
109 #define TEST_FUNCTION do_test ()
110 #include "../test-skeleton.c"