[Clang] Fix a crash when encountering an ill-formed delimited UCN.
authorCorentin Jabot <corentinjabot@gmail.com>
Mon, 12 Dec 2022 23:26:13 +0000 (00:26 +0100)
committerCorentin Jabot <corentinjabot@gmail.com>
Tue, 3 Jan 2023 19:57:52 +0000 (20:57 +0100)
\u<DIGIT>{...} was incorrectly parsed as a valid UCN instead
of emitting a diagnostic, causing an assertion failure.

Reviewed By: tahonermann

Differential Revision: https://reviews.llvm.org/D139889

clang/lib/Lex/Lexer.cpp
clang/test/Preprocessor/ucn-pp-identifier.c

index 2f21f7b..ce48e7d 100644 (file)
@@ -3286,7 +3286,7 @@ llvm::Optional<uint32_t> Lexer::tryReadNumericUCN(const char *&StartPtr,
   uint32_t CodePoint = 0;
   while (Count != NumHexDigits || Delimited) {
     char C = getCharAndSize(CurPtr, CharSize);
-    if (!Delimited && C == '{') {
+    if (!Delimited && Count == 0 && C == '{') {
       Delimited = true;
       CurPtr += CharSize;
       continue;
index 8d30a6a..c47ed21 100644 (file)
@@ -117,6 +117,7 @@ C 1
 // CHECK-NEXT: {{^                   u}}
 
 #define \u{}           // expected-warning {{empty delimited universal character name; treating as '\' 'u' '{' '}'}} expected-error {{macro name must be an identifier}}
+#define \u1{123}       // expected-warning {{incomplete universal character name; treating as '\' followed by identifier}} expected-error {{macro name must be an identifier}}
 #define \u{123456789}  // expected-error {{hex escape sequence out of range}} expected-error {{macro name must be an identifier}}
 #define \u{            // expected-warning {{incomplete delimited universal character name; treating as '\' 'u' '{' identifier}} expected-error {{macro name must be an identifier}}
 #define \u{fgh}        // expected-warning {{incomplete delimited universal character name; treating as '\' 'u' '{' identifier}} expected-error {{macro name must be an identifier}}