preprocessor: C2x identifier rules
authorJoseph Myers <joseph@codesourcery.com>
Fri, 14 Oct 2022 23:07:50 +0000 (23:07 +0000)
committerJoseph Myers <joseph@codesourcery.com>
Fri, 14 Oct 2022 23:07:50 +0000 (23:07 +0000)
commit36d20fa4a83d1a294462c2622ca76eac93465c2c
treef2ce724a425779a555362f80d7d418a7318f836d
parent89f20c9ae4641f9b2e87e47f7dab3dc197faa0aa
preprocessor: C2x identifier rules

C2x has, like C++, adopted rules for identifiers based directly on an
unversioned normative reference to Unicode.  Make libcpp follow those
rules for c2x / gnu2x standards (this involves bringing back a flag
separate from the C++ one for whether to use these identifier rules,
but this time enabled for all C++ language versions since that was the
conclusion adopted for C++ identifier handling).

There is one change here that affects C++.  I believe the new
normative requirement for NFC only applies to identifiers, not to the
use of identifier-continue characters in pp-numbers, where there is no
such requirement and so the diagnostic ought to be a warning not a
pedwarn in pp-numbers, and that this is the case for both C and C++.

Bootstrapped with no regressions for x86_64-pc-linux-gnu.

libcpp/
* charset.cc (ucn_valid_in_identifier): Check xid_identifiers not
cplusplus to determine whether to use CXX23 and NXX23 flags.
* include/cpplib.h (struct cpp_options): Add xid_identifiers.
* init.cc (struct lang_flags, lang_defaults): Add xid_identifiers.
(cpp_set_lang): Set xid_identifiers.
* lex.cc (warn_about_normalization): Add parameter identifier.
Only pedwarn about non-NFC for identifiers, not pp-numbers.
(_cpp_lex_direct): Update calls to warn_about_normalization.

gcc/testsuite/
* gcc.dg/cpp/c2x-ucnid-1-utf8.c, gcc.dg/cpp/c2x-ucnid-1.c: New
tests.
gcc/testsuite/gcc.dg/cpp/c2x-ucnid-1-utf8.c [new file with mode: 0644]
gcc/testsuite/gcc.dg/cpp/c2x-ucnid-1.c [new file with mode: 0644]
libcpp/charset.cc
libcpp/include/cpplib.h
libcpp/init.cc
libcpp/lex.cc