regex: Add accessor for PCRE_INFO_HASCRORLF
[platform/upstream/glib.git] / glib / gregex.h
1 /* GRegex -- regular expression API wrapper around PCRE.
2  *
3  * Copyright (C) 1999, 2000 Scott Wimer
4  * Copyright (C) 2004, Matthias Clasen <mclasen@redhat.com>
5  * Copyright (C) 2005 - 2007, Marco Barisione <marco@barisione.org>
6  *
7  * This library is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 2.1 of the License, or (at your option) any later version.
11  *
12  * This library is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with this library; if not, write to the Free Software
19  * Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
20  */
21
22 #if !defined (__GLIB_H_INSIDE__) && !defined (GLIB_COMPILATION)
23 #error "Only <glib.h> can be included directly."
24 #endif
25
26 #ifndef __G_REGEX_H__
27 #define __G_REGEX_H__
28
29 #include <glib/gerror.h>
30 #include <glib/gstring.h>
31
32 G_BEGIN_DECLS
33
34 /**
35  * GRegexError:
36  * @G_REGEX_ERROR_COMPILE: Compilation of the regular expression failed.
37  * @G_REGEX_ERROR_OPTIMIZE: Optimization of the regular expression failed.
38  * @G_REGEX_ERROR_REPLACE: Replacement failed due to an ill-formed replacement
39  *     string.
40  * @G_REGEX_ERROR_MATCH: The match process failed.
41  * @G_REGEX_ERROR_INTERNAL: Internal error of the regular expression engine.
42  *     Since 2.16
43  * @G_REGEX_ERROR_STRAY_BACKSLASH: "\\" at end of pattern. Since 2.16
44  * @G_REGEX_ERROR_MISSING_CONTROL_CHAR: "\\c" at end of pattern. Since 2.16
45  * @G_REGEX_ERROR_UNRECOGNIZED_ESCAPE: Unrecognized character follows "\\".
46  *     Since 2.16
47  * @G_REGEX_ERROR_QUANTIFIERS_OUT_OF_ORDER: Numbers out of order in "{}"
48  *     quantifier. Since 2.16
49  * @G_REGEX_ERROR_QUANTIFIER_TOO_BIG: Number too big in "{}" quantifier.
50  *     Since 2.16
51  * @G_REGEX_ERROR_UNTERMINATED_CHARACTER_CLASS: Missing terminating "]" for
52  *     character class. Since 2.16
53  * @G_REGEX_ERROR_INVALID_ESCAPE_IN_CHARACTER_CLASS: Invalid escape sequence
54  *     in character class. Since 2.16
55  * @G_REGEX_ERROR_RANGE_OUT_OF_ORDER: Range out of order in character class.
56  *     Since 2.16
57  * @G_REGEX_ERROR_NOTHING_TO_REPEAT: Nothing to repeat. Since 2.16
58  * @G_REGEX_ERROR_UNRECOGNIZED_CHARACTER: Unrecognized character after "(?",
59  *     "(?&lt;" or "(?P". Since 2.16
60  * @G_REGEX_ERROR_POSIX_NAMED_CLASS_OUTSIDE_CLASS: POSIX named classes are
61  *     supported only within a class. Since 2.16
62  * @G_REGEX_ERROR_UNMATCHED_PARENTHESIS: Missing terminating ")" or ")"
63  *     without opening "(". Since 2.16
64  * @G_REGEX_ERROR_INEXISTENT_SUBPATTERN_REFERENCE: Reference to non-existent
65  *     subpattern. Since 2.16
66  * @G_REGEX_ERROR_UNTERMINATED_COMMENT: Missing terminating ")" after comment.
67  *     Since 2.16
68  * @G_REGEX_ERROR_EXPRESSION_TOO_LARGE: Regular expression too large.
69  *     Since 2.16
70  * @G_REGEX_ERROR_MEMORY_ERROR: Failed to get memory. Since 2.16
71  * @G_REGEX_ERROR_VARIABLE_LENGTH_LOOKBEHIND: Lookbehind assertion is not
72  *     fixed length. Since 2.16
73  * @G_REGEX_ERROR_MALFORMED_CONDITION: Malformed number or name after "(?(".
74  *     Since 2.16
75  * @G_REGEX_ERROR_TOO_MANY_CONDITIONAL_BRANCHES: Conditional group contains
76  *     more than two branches. Since 2.16
77  * @G_REGEX_ERROR_ASSERTION_EXPECTED: Assertion expected after "(?(".
78  *     Since 2.16
79  * @G_REGEX_ERROR_UNKNOWN_POSIX_CLASS_NAME: Unknown POSIX class name.
80  *     Since 2.16
81  * @G_REGEX_ERROR_POSIX_COLLATING_ELEMENTS_NOT_SUPPORTED: POSIX collating
82  *     elements are not supported. Since 2.16
83  * @G_REGEX_ERROR_HEX_CODE_TOO_LARGE: Character value in "\\x{...}" sequence
84  *     is too large. Since 2.16
85  * @G_REGEX_ERROR_INVALID_CONDITION: Invalid condition "(?(0)". Since 2.16
86  * @G_REGEX_ERROR_SINGLE_BYTE_MATCH_IN_LOOKBEHIND: \\C not allowed in
87  *     lookbehind assertion. Since 2.16
88  * @G_REGEX_ERROR_INFINITE_LOOP: Recursive call could loop indefinitely.
89  *     Since 2.16
90  * @G_REGEX_ERROR_MISSING_SUBPATTERN_NAME_TERMINATOR: Missing terminator
91  *     in subpattern name. Since 2.16
92  * @G_REGEX_ERROR_DUPLICATE_SUBPATTERN_NAME: Two named subpatterns have
93  *     the same name. Since 2.16
94  * @G_REGEX_ERROR_MALFORMED_PROPERTY: Malformed "\\P" or "\\p" sequence.
95  *     Since 2.16
96  * @G_REGEX_ERROR_UNKNOWN_PROPERTY: Unknown property name after "\\P" or
97  *     "\\p". Since 2.16
98  * @G_REGEX_ERROR_SUBPATTERN_NAME_TOO_LONG: Subpattern name is too long
99  *     (maximum 32 characters). Since 2.16
100  * @G_REGEX_ERROR_TOO_MANY_SUBPATTERNS: Too many named subpatterns (maximum
101  *     10,000). Since 2.16
102  * @G_REGEX_ERROR_INVALID_OCTAL_VALUE: Octal value is greater than "\\377".
103  *     Since 2.16
104  * @G_REGEX_ERROR_TOO_MANY_BRANCHES_IN_DEFINE: "DEFINE" group contains more
105  *     than one branch. Since 2.16
106  * @G_REGEX_ERROR_DEFINE_REPETION: Repeating a "DEFINE" group is not allowed.
107  *     This error is never raised. Since: 2.16 Deprecated: 2.34
108  * @G_REGEX_ERROR_INCONSISTENT_NEWLINE_OPTIONS: Inconsistent newline options.
109  *     Since 2.16
110  * @G_REGEX_ERROR_MISSING_BACK_REFERENCE: "\\g" is not followed by a braced,
111  *      angle-bracketed, or quoted name or number, or by a plain number. Since: 2.16
112  * @G_REGEX_ERROR_INVALID_RELATIVE_REFERENCE: relative reference must not be zero. Since: 2.34
113  * @G_REGEX_ERROR_BACKTRACKING_CONTROL_VERB_ARGUMENT_FORBIDDEN: the backtracing
114  *     control verb used does not allow an argument. Since: 2.34
115  * @G_REGEX_ERROR_UNKNOWN_BACKTRACKING_CONTROL_VERB: unknown backtracing 
116  *     control verb. Since: 2.34
117  * @G_REGEX_ERROR_NUMBER_TOO_BIG: number is too big in escape sequence. Since: 2.34
118  * @G_REGEX_ERROR_MISSING_SUBPATTERN_NAME: Missing subpattern name. Since: 2.34
119  * @G_REGEX_ERROR_EXTRA_SUBPATTERN_NAME: different names for subpatterns of the 
120  *     same number are not allowed. Since: 2.34
121  * @G_REGEX_ERROR_BACKTRACKING_CONTROL_VERB_ARGUMENT_REQUIRED: the backtracing control
122  *     verb requires an argument. Since: 2.34
123  * @G_REGEX_ERROR_INVALID_CONTROL_CHAR: "\\c" must be followed by an ASCII 
124  *     character. Since: 2.34
125  * @G_REGEX_ERROR_MISSING_NAME: "\\k" is not followed by a braced, angle-bracketed, or 
126  *     quoted name. Since: 2.34
127  * @G_REGEX_ERROR_NOT_SUPPORTED_IN_CLASS: "\\N" is not supported in a class. Since: 2.34
128  * @G_REGEX_ERROR_TOO_MANY_FORWARD_REFERENCES: too many forward references. Since: 2.34
129  * @G_REGEX_ERROR_NAME_TOO_LONG: the name is too long in "(*MARK)", "(*PRUNE)", 
130  *     "(*SKIP)", or "(*THEN)". Since: 2.34
131  * 
132  * Error codes returned by regular expressions functions.
133  *
134  * Since: 2.14
135  */
136 typedef enum
137 {
138   G_REGEX_ERROR_COMPILE,
139   G_REGEX_ERROR_OPTIMIZE,
140   G_REGEX_ERROR_REPLACE,
141   G_REGEX_ERROR_MATCH,
142   G_REGEX_ERROR_INTERNAL,
143
144   /* These are the error codes from PCRE + 100 */
145   G_REGEX_ERROR_STRAY_BACKSLASH = 101,
146   G_REGEX_ERROR_MISSING_CONTROL_CHAR = 102,
147   G_REGEX_ERROR_UNRECOGNIZED_ESCAPE = 103,
148   G_REGEX_ERROR_QUANTIFIERS_OUT_OF_ORDER = 104,
149   G_REGEX_ERROR_QUANTIFIER_TOO_BIG = 105,
150   G_REGEX_ERROR_UNTERMINATED_CHARACTER_CLASS = 106,
151   G_REGEX_ERROR_INVALID_ESCAPE_IN_CHARACTER_CLASS = 107,
152   G_REGEX_ERROR_RANGE_OUT_OF_ORDER = 108,
153   G_REGEX_ERROR_NOTHING_TO_REPEAT = 109,
154   G_REGEX_ERROR_UNRECOGNIZED_CHARACTER = 112,
155   G_REGEX_ERROR_POSIX_NAMED_CLASS_OUTSIDE_CLASS = 113,
156   G_REGEX_ERROR_UNMATCHED_PARENTHESIS = 114,
157   G_REGEX_ERROR_INEXISTENT_SUBPATTERN_REFERENCE = 115,
158   G_REGEX_ERROR_UNTERMINATED_COMMENT = 118,
159   G_REGEX_ERROR_EXPRESSION_TOO_LARGE = 120,
160   G_REGEX_ERROR_MEMORY_ERROR = 121,
161   G_REGEX_ERROR_VARIABLE_LENGTH_LOOKBEHIND = 125,
162   G_REGEX_ERROR_MALFORMED_CONDITION = 126,
163   G_REGEX_ERROR_TOO_MANY_CONDITIONAL_BRANCHES = 127,
164   G_REGEX_ERROR_ASSERTION_EXPECTED = 128,
165   G_REGEX_ERROR_UNKNOWN_POSIX_CLASS_NAME = 130,
166   G_REGEX_ERROR_POSIX_COLLATING_ELEMENTS_NOT_SUPPORTED = 131,
167   G_REGEX_ERROR_HEX_CODE_TOO_LARGE = 134,
168   G_REGEX_ERROR_INVALID_CONDITION = 135,
169   G_REGEX_ERROR_SINGLE_BYTE_MATCH_IN_LOOKBEHIND = 136,
170   G_REGEX_ERROR_INFINITE_LOOP = 140,
171   G_REGEX_ERROR_MISSING_SUBPATTERN_NAME_TERMINATOR = 142,
172   G_REGEX_ERROR_DUPLICATE_SUBPATTERN_NAME = 143,
173   G_REGEX_ERROR_MALFORMED_PROPERTY = 146,
174   G_REGEX_ERROR_UNKNOWN_PROPERTY = 147,
175   G_REGEX_ERROR_SUBPATTERN_NAME_TOO_LONG = 148,
176   G_REGEX_ERROR_TOO_MANY_SUBPATTERNS = 149,
177   G_REGEX_ERROR_INVALID_OCTAL_VALUE = 151,
178   G_REGEX_ERROR_TOO_MANY_BRANCHES_IN_DEFINE = 154,
179   G_REGEX_ERROR_DEFINE_REPETION = 155,
180   G_REGEX_ERROR_INCONSISTENT_NEWLINE_OPTIONS = 156,
181   G_REGEX_ERROR_MISSING_BACK_REFERENCE = 157,
182   G_REGEX_ERROR_INVALID_RELATIVE_REFERENCE = 158,
183   G_REGEX_ERROR_BACKTRACKING_CONTROL_VERB_ARGUMENT_FORBIDDEN = 159,
184   G_REGEX_ERROR_UNKNOWN_BACKTRACKING_CONTROL_VERB  = 160,
185   G_REGEX_ERROR_NUMBER_TOO_BIG = 161,
186   G_REGEX_ERROR_MISSING_SUBPATTERN_NAME = 162,
187   G_REGEX_ERROR_MISSING_DIGIT = 163,
188   G_REGEX_ERROR_EXTRA_SUBPATTERN_NAME = 165,
189   G_REGEX_ERROR_BACKTRACKING_CONTROL_VERB_ARGUMENT_REQUIRED = 166,
190   G_REGEX_ERROR_INVALID_CONTROL_CHAR = 168,
191   G_REGEX_ERROR_MISSING_NAME = 169,
192   G_REGEX_ERROR_NOT_SUPPORTED_IN_CLASS = 171,
193   G_REGEX_ERROR_TOO_MANY_FORWARD_REFERENCES = 172,
194   G_REGEX_ERROR_NAME_TOO_LONG = 175
195 } GRegexError;
196
197 /**
198  * G_REGEX_ERROR:
199  *
200  * Error domain for regular expressions. Errors in this domain will be
201  * from the #GRegexError enumeration. See #GError for information on
202  * error domains.
203  *
204  * Since: 2.14
205  */
206 #define G_REGEX_ERROR g_regex_error_quark ()
207
208 GQuark g_regex_error_quark (void);
209
210 /**
211  * GRegexCompileFlags:
212  * @G_REGEX_CASELESS: Letters in the pattern match both upper- and
213  *     lowercase letters. This option can be changed within a pattern
214  *     by a "(?i)" option setting.
215  * @G_REGEX_MULTILINE: By default, GRegex treats the strings as consisting
216  *     of a single line of characters (even if it actually contains
217  *     newlines). The "start of line" metacharacter ("^") matches only
218  *     at the start of the string, while the "end of line" metacharacter
219  *     ("$") matches only at the end of the string, or before a terminating
220  *     newline (unless #G_REGEX_DOLLAR_ENDONLY is set). When
221  *     #G_REGEX_MULTILINE is set, the "start of line" and "end of line"
222  *     constructs match immediately following or immediately before any
223  *     newline in the string, respectively, as well as at the very start
224  *     and end. This can be changed within a pattern by a "(?m)" option
225  *     setting.
226  * @G_REGEX_DOTALL: A dot metacharater (".") in the pattern matches all
227  *     characters, including newlines. Without it, newlines are excluded.
228  *     This option can be changed within a pattern by a ("?s") option setting.
229  * @G_REGEX_EXTENDED: Whitespace data characters in the pattern are
230  *     totally ignored except when escaped or inside a character class.
231  *     Whitespace does not include the VT character (code 11). In addition,
232  *     characters between an unescaped "#" outside a character class and
233  *     the next newline character, inclusive, are also ignored. This can
234  *     be changed within a pattern by a "(?x)" option setting.
235  * @G_REGEX_ANCHORED: The pattern is forced to be "anchored", that is,
236  *     it is constrained to match only at the first matching point in the
237  *     string that is being searched. This effect can also be achieved by
238  *     appropriate constructs in the pattern itself such as the "^"
239  *     metacharater.
240  * @G_REGEX_DOLLAR_ENDONLY: A dollar metacharacter ("$") in the pattern
241  *     matches only at the end of the string. Without this option, a
242  *     dollar also matches immediately before the final character if
243  *     it is a newline (but not before any other newlines). This option
244  *     is ignored if #G_REGEX_MULTILINE is set.
245  * @G_REGEX_UNGREEDY: Inverts the "greediness" of the quantifiers so that
246  *     they are not greedy by default, but become greedy if followed by "?".
247  *     It can also be set by a "(?U)" option setting within the pattern.
248  * @G_REGEX_RAW: Usually strings must be valid UTF-8 strings, using this
249  *     flag they are considered as a raw sequence of bytes.
250  *     @G_REGEX_NO_AUTO_CAPTURE: Disables the use of numbered capturing
251  *     parentheses in the pattern. Any opening parenthesis that is not
252  *     followed by "?" behaves as if it were followed by "?:" but named
253  *     parentheses can still be used for capturing (and they acquire numbers
254  *     in the usual way).
255  * @G_REGEX_OPTIMIZE: Optimize the regular expression. If the pattern will
256  *     be used many times, then it may be worth the effort to optimize it
257  *     to improve the speed of matches.
258  * @G_REGEX_DUPNAMES: Names used to identify capturing subpatterns need not
259  *     be unique. This can be helpful for certain types of pattern when it
260  *     is known that only one instance of the named subpattern can ever be
261  *     matched.
262  * @G_REGEX_NEWLINE_CR: Usually any newline character or character sequence is
263  *     recognized. If this option is set, the only recognized newline character
264  *     is '\r'.
265  * @G_REGEX_NEWLINE_LF: Usually any newline character or character sequence is
266  *     recognized. If this option is set, the only recognized newline character
267  *     is '\n'.
268  * @G_REGEX_NEWLINE_CRLF: Usually any newline character or character sequence is
269  *     recognized. If this option is set, the only recognized newline character
270  *     sequence is '\r\n'.
271  * @G_REGEX_NEWLINE_ANYCRLF: Usually any newline character or character sequence
272  *     is recognized. If this option is set, the only recognized newline character
273  *     sequences are '\r', '\n', and '\r\n'. Since: 2.34
274  *
275  * Flags specifying compile-time options.
276  *
277  * Since: 2.14
278  */
279 /* Remember to update G_REGEX_COMPILE_MASK in gregex.c after
280  * adding a new flag. */
281 typedef enum
282 {
283   G_REGEX_CASELESS          = 1 << 0,
284   G_REGEX_MULTILINE         = 1 << 1,
285   G_REGEX_DOTALL            = 1 << 2,
286   G_REGEX_EXTENDED          = 1 << 3,
287   G_REGEX_ANCHORED          = 1 << 4,
288   G_REGEX_DOLLAR_ENDONLY    = 1 << 5,
289   G_REGEX_UNGREEDY          = 1 << 9,
290   G_REGEX_RAW               = 1 << 11,
291   G_REGEX_NO_AUTO_CAPTURE   = 1 << 12,
292   G_REGEX_OPTIMIZE          = 1 << 13,
293   G_REGEX_DUPNAMES          = 1 << 19,
294   G_REGEX_NEWLINE_CR        = 1 << 20,
295   G_REGEX_NEWLINE_LF        = 1 << 21,
296   G_REGEX_NEWLINE_CRLF      = G_REGEX_NEWLINE_CR | G_REGEX_NEWLINE_LF,
297   G_REGEX_NEWLINE_ANYCRLF   = G_REGEX_NEWLINE_CR | 1 << 22
298 } GRegexCompileFlags;
299
300 /**
301  * GRegexMatchFlags:
302  * @G_REGEX_MATCH_ANCHORED: The pattern is forced to be "anchored", that is,
303  *     it is constrained to match only at the first matching point in the
304  *     string that is being searched. This effect can also be achieved by
305  *     appropriate constructs in the pattern itself such as the "^"
306  *     metacharater.
307  * @G_REGEX_MATCH_NOTBOL: Specifies that first character of the string is
308  *     not the beginning of a line, so the circumflex metacharacter should
309  *     not match before it. Setting this without #G_REGEX_MULTILINE (at
310  *     compile time) causes circumflex never to match. This option affects
311  *     only the behaviour of the circumflex metacharacter, it does not
312  *     affect "\A".
313  * @G_REGEX_MATCH_NOTEOL: Specifies that the end of the subject string is
314  *     not the end of a line, so the dollar metacharacter should not match
315  *     it nor (except in multiline mode) a newline immediately before it.
316  *     Setting this without #G_REGEX_MULTILINE (at compile time) causes
317  *     dollar never to match. This option affects only the behaviour of
318  *     the dollar metacharacter, it does not affect "\Z" or "\z".
319  * @G_REGEX_MATCH_NOTEMPTY: An empty string is not considered to be a valid
320  *     match if this option is set. If there are alternatives in the pattern,
321  *     they are tried. If all the alternatives match the empty string, the
322  *     entire match fails. For example, if the pattern "a?b?" is applied to
323  *     a string not beginning with "a" or "b", it matches the empty string
324  *     at the start of the string. With this flag set, this match is not
325  *     valid, so GRegex searches further into the string for occurrences
326  *     of "a" or "b".
327  * @G_REGEX_MATCH_PARTIAL: Turns on the partial matching feature, for more
328  *     documentation on partial matching see g_match_info_is_partial_match().
329  * @G_REGEX_MATCH_NEWLINE_CR: Overrides the newline definition set when
330  *     creating a new #GRegex, setting the '\r' character as line terminator.
331  * @G_REGEX_MATCH_NEWLINE_LF: Overrides the newline definition set when
332  *     creating a new #GRegex, setting the '\n' character as line terminator.
333  * @G_REGEX_MATCH_NEWLINE_CRLF: Overrides the newline definition set when
334  *     creating a new #GRegex, setting the '\r\n' characters sequence as line terminator.
335  * @G_REGEX_MATCH_NEWLINE_ANY: Overrides the newline definition set when
336  *     creating a new #GRegex, any Unicode newline sequence
337  *     is recognised as a newline. These are '\r', '\n' and '\rn', and the
338  *     single characters U+000B LINE TABULATION, U+000C FORM FEED (FF),
339  *     U+0085 NEXT LINE (NEL), U+2028 LINE SEPARATOR and
340  *     U+2029 PARAGRAPH SEPARATOR.
341  * @G_REGEX_MATCH_NEWLINE_ANYCRLF: Overrides the newline definition set when
342  *     creating a new #GRegex; any '\r', '\n', or '\r\n' character sequence
343  *     is recognized as a newline. Since: 2.34
344  *
345  * Flags specifying match-time options.
346  *
347  * Since: 2.14
348  */
349 /* Remember to update G_REGEX_MATCH_MASK in gregex.c after
350  * adding a new flag. */
351 typedef enum
352 {
353   G_REGEX_MATCH_ANCHORED        = 1 << 4,
354   G_REGEX_MATCH_NOTBOL          = 1 << 7,
355   G_REGEX_MATCH_NOTEOL          = 1 << 8,
356   G_REGEX_MATCH_NOTEMPTY        = 1 << 10,
357   G_REGEX_MATCH_PARTIAL         = 1 << 15,
358   G_REGEX_MATCH_NEWLINE_CR      = 1 << 20,
359   G_REGEX_MATCH_NEWLINE_LF      = 1 << 21,
360   G_REGEX_MATCH_NEWLINE_CRLF    = G_REGEX_MATCH_NEWLINE_CR | G_REGEX_MATCH_NEWLINE_LF,
361   G_REGEX_MATCH_NEWLINE_ANY     = 1 << 22,
362   G_REGEX_MATCH_NEWLINE_ANYCRLF = G_REGEX_MATCH_NEWLINE_CR | G_REGEX_MATCH_NEWLINE_ANY
363 } GRegexMatchFlags;
364
365 /**
366  * GRegex:
367  *
368  * A GRegex is the "compiled" form of a regular expression pattern. This
369  * structure is opaque and its fields cannot be accessed directly.
370  *
371  * Since: 2.14
372  */
373 typedef struct _GRegex          GRegex;
374
375
376 typedef struct _GMatchInfo      GMatchInfo;
377
378 /**
379  * GRegexEvalCallback:
380  * @match_info: the #GMatchInfo generated by the match.
381  *     Use g_match_info_get_regex() and g_match_info_get_string() if you
382  *     need the #GRegex or the matched string.
383  * @result: a #GString containing the new string
384  * @user_data: user data passed to g_regex_replace_eval()
385  *
386  * Specifies the type of the function passed to g_regex_replace_eval().
387  * It is called for each occurrence of the pattern in the string passed
388  * to g_regex_replace_eval(), and it should append the replacement to
389  * @result.
390  *
391  * Returns: %FALSE to continue the replacement process, %TRUE to stop it
392  *
393  * Since: 2.14
394  */
395 typedef gboolean (*GRegexEvalCallback)          (const GMatchInfo *match_info,
396                                                  GString          *result,
397                                                  gpointer          user_data);
398
399
400 GRegex           *g_regex_new                   (const gchar         *pattern,
401                                                  GRegexCompileFlags   compile_options,
402                                                  GRegexMatchFlags     match_options,
403                                                  GError             **error);
404 GRegex           *g_regex_ref                   (GRegex              *regex);
405 void              g_regex_unref                 (GRegex              *regex);
406 const gchar      *g_regex_get_pattern           (const GRegex        *regex);
407 gint              g_regex_get_max_backref       (const GRegex        *regex);
408 gint              g_regex_get_capture_count     (const GRegex        *regex);
409 gboolean          g_regex_get_has_cr_or_lf      (const GRegex        *regex);
410 gint              g_regex_get_string_number     (const GRegex        *regex, 
411                                                  const gchar         *name);
412 gchar            *g_regex_escape_string         (const gchar         *string,
413                                                  gint                 length);
414 gchar            *g_regex_escape_nul            (const gchar         *string,
415                                                  gint                 length);
416
417 GRegexCompileFlags g_regex_get_compile_flags    (const GRegex        *regex);
418 GRegexMatchFlags   g_regex_get_match_flags      (const GRegex        *regex);
419
420 /* Matching. */
421 gboolean          g_regex_match_simple          (const gchar         *pattern,
422                                                  const gchar         *string,
423                                                  GRegexCompileFlags   compile_options,
424                                                  GRegexMatchFlags     match_options);
425 gboolean          g_regex_match                 (const GRegex        *regex,
426                                                  const gchar         *string,
427                                                  GRegexMatchFlags     match_options,
428                                                  GMatchInfo         **match_info);
429 gboolean          g_regex_match_full            (const GRegex        *regex,
430                                                  const gchar         *string,
431                                                  gssize               string_len,
432                                                  gint                 start_position,
433                                                  GRegexMatchFlags     match_options,
434                                                  GMatchInfo         **match_info,
435                                                  GError             **error);
436 gboolean          g_regex_match_all             (const GRegex        *regex,
437                                                  const gchar         *string,
438                                                  GRegexMatchFlags     match_options,
439                                                  GMatchInfo         **match_info);
440 gboolean          g_regex_match_all_full        (const GRegex        *regex,
441                                                  const gchar         *string,
442                                                  gssize               string_len,
443                                                  gint                 start_position,
444                                                  GRegexMatchFlags     match_options,
445                                                  GMatchInfo         **match_info,
446                                                  GError             **error);
447
448 /* String splitting. */
449 gchar           **g_regex_split_simple          (const gchar         *pattern,
450                                                  const gchar         *string,
451                                                  GRegexCompileFlags   compile_options,
452                                                  GRegexMatchFlags     match_options);
453 gchar           **g_regex_split                 (const GRegex        *regex,
454                                                  const gchar         *string,
455                                                  GRegexMatchFlags     match_options);
456 gchar           **g_regex_split_full            (const GRegex        *regex,
457                                                  const gchar         *string,
458                                                  gssize               string_len,
459                                                  gint                 start_position,
460                                                  GRegexMatchFlags     match_options,
461                                                  gint                 max_tokens,
462                                                  GError             **error);
463
464 /* String replacement. */
465 gchar            *g_regex_replace               (const GRegex        *regex,
466                                                  const gchar         *string,
467                                                  gssize               string_len,
468                                                  gint                 start_position,
469                                                  const gchar         *replacement,
470                                                  GRegexMatchFlags     match_options,
471                                                  GError             **error);
472 gchar            *g_regex_replace_literal       (const GRegex        *regex,
473                                                  const gchar         *string,
474                                                  gssize               string_len,
475                                                  gint                 start_position,
476                                                  const gchar         *replacement,
477                                                  GRegexMatchFlags     match_options,
478                                                  GError             **error);
479 gchar            *g_regex_replace_eval          (const GRegex        *regex,
480                                                  const gchar         *string,
481                                                  gssize               string_len,
482                                                  gint                 start_position,
483                                                  GRegexMatchFlags     match_options,
484                                                  GRegexEvalCallback   eval,
485                                                  gpointer             user_data,
486                                                  GError             **error);
487 gboolean          g_regex_check_replacement     (const gchar         *replacement,
488                                                  gboolean            *has_references,
489                                                  GError             **error);
490
491 /* Match info */
492 GRegex           *g_match_info_get_regex        (const GMatchInfo    *match_info);
493 const gchar      *g_match_info_get_string       (const GMatchInfo    *match_info);
494
495 GMatchInfo       *g_match_info_ref              (GMatchInfo          *match_info);
496 void              g_match_info_unref            (GMatchInfo          *match_info);
497 void              g_match_info_free             (GMatchInfo          *match_info);
498 gboolean          g_match_info_next             (GMatchInfo          *match_info,
499                                                  GError             **error);
500 gboolean          g_match_info_matches          (const GMatchInfo    *match_info);
501 gint              g_match_info_get_match_count  (const GMatchInfo    *match_info);
502 gboolean          g_match_info_is_partial_match (const GMatchInfo    *match_info);
503 gchar            *g_match_info_expand_references(const GMatchInfo    *match_info,
504                                                  const gchar         *string_to_expand,
505                                                  GError             **error);
506 gchar            *g_match_info_fetch            (const GMatchInfo    *match_info,
507                                                  gint                 match_num);
508 gboolean          g_match_info_fetch_pos        (const GMatchInfo    *match_info,
509                                                  gint                 match_num,
510                                                  gint                *start_pos,
511                                                  gint                *end_pos);
512 gchar            *g_match_info_fetch_named      (const GMatchInfo    *match_info,
513                                                  const gchar         *name);
514 gboolean          g_match_info_fetch_named_pos  (const GMatchInfo    *match_info,
515                                                  const gchar         *name,
516                                                  gint                *start_pos,
517                                                  gint                *end_pos);
518 gchar           **g_match_info_fetch_all        (const GMatchInfo    *match_info);
519
520 G_END_DECLS
521
522 #endif  /*  __G_REGEX_H__ */