regcomp.c: Slightly relax restriction of SIMPLE nodes
authorKarl Williamson <public@khwilliamson.com>
Sat, 6 Oct 2012 17:21:02 +0000 (11:21 -0600)
committerKarl Williamson <public@khwilliamson.com>
Tue, 9 Oct 2012 17:16:05 +0000 (11:16 -0600)
commit51e68360f9d9caf2a439cb6a3ca38dcf1ad0e35d
treecba30b955c15279ca3b86b85e6fd69e2282ea00a
parenteb5c1be832f933916254966c4be6834e40ae081c
regcomp.c: Slightly relax restriction of SIMPLE nodes

Currently all EXACTish nodes that are SIMPLE must be a single UTF-8
invariant character.  It turns out that the code works not just for
these, but for all Latin1 characters (when the pattern isn't UTF-8)
except the SHARP S under /d folding.

SIMPLE nodes allow for better optimization possibilities, such as CURLY
instead of CURLYM.

There is still a discrepancy in that non-EXACTish nodes that match a
single character, such as the dot (SANY), can be SIMPLE, but EXACTish
nodes have to be just a single byte.
regcomp.c
regexec.c