Converted to single-line parser specifications where appropriate.
[external/ragel.git] / ragel / rlparse.kh
1 /*
2  *  Copyright 2001-2007 Adrian Thurston <thurston@cs.queensu.ca>
3  */
4
5 /*  This file is part of Ragel.
6  *
7  *  Ragel is free software; you can redistribute it and/or modify
8  *  it under the terms of the GNU General Public License as published by
9  *  the Free Software Foundation; either version 2 of the License, or
10  *  (at your option) any later version.
11  * 
12  *  Ragel is distributed in the hope that it will be useful,
13  *  but WITHOUT ANY WARRANTY; without even the implied warranty of
14  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  *  GNU General Public License for more details.
16  * 
17  *  You should have received a copy of the GNU General Public License
18  *  along with Ragel; if not, write to the Free Software
19  *  Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA 
20  */
21
22 #ifndef RLPARSE_H
23 #define RLPARSE_H
24
25 #include <iostream>
26 #include "avltree.h"
27 #include "parsedata.h"
28
29 extern char *Parser_lelNames[];
30
31 struct LangEl;
32
33 struct Parser
34 {
35         %%{
36         parser Parser;
37
38         # These must be declared first and in this order. Ragel currently cannot
39         # import kelbt keywords for use in machines, so in the scanner
40         # rely on knowing the values that kelbt will assign to these.
41         token KW_Machine, KW_Include, KW_Write, TK_Word, TK_Literal;
42
43         token TK_Number, TK_Inline, TK_Reference, TK_ColonEquals, TK_EndSection;
44
45         # General tokens.
46         token TK_UInt, TK_Hex, TK_Word, TK_Literal, TK_BaseClause,
47                 TK_DotDot, TK_ColonGt, TK_ColonGtGt, TK_LtColon, TK_Arrow,
48                 TK_DoubleArrow, TK_StarStar, TK_ColonEquals, TK_NameSep, TK_BarStar,
49                 TK_DashDash;
50
51         # Conditions.
52         token TK_StartCond, TK_AllCond, TK_LeavingCond;
53
54         token TK_Middle;
55
56         # Global error actions.
57         token TK_StartGblError, TK_AllGblError, TK_FinalGblError,
58                 TK_NotFinalGblError, TK_NotStartGblError, TK_MiddleGblError;
59
60         # Local error actions.
61         token TK_StartLocalError, TK_AllLocalError, TK_FinalLocalError,
62                 TK_NotFinalLocalError, TK_NotStartLocalError, TK_MiddleLocalError;
63
64         # EOF Action embedding.
65         token TK_StartEOF, TK_AllEOF, TK_FinalEOF, TK_NotFinalEOF, TK_NotStartEOF,
66                 TK_MiddleEOF;
67
68         # To State Actions.
69         token TK_StartToState, TK_AllToState, TK_FinalToState, TK_NotFinalToState,
70                 TK_NotStartToState, TK_MiddleToState;
71
72         # In State Actions.
73         token TK_StartFromState, TK_AllFromState, TK_FinalFromState,
74                 TK_NotFinalFromState, TK_NotStartFromState, TK_MiddleFromState;
75
76         # Regular expression tokens. */
77         token RE_Slash, RE_SqOpen, RE_SqOpenNeg, RE_SqClose, RE_Dot, RE_Star,
78                 RE_Dash, RE_Char;
79
80         # Tokens specific to inline code.
81         token IL_WhiteSpace, IL_Comment, IL_Literal, IL_Symbol;
82
83         # Keywords.
84         token KW_Action, KW_AlphType, KW_Range, KW_GetKey, KW_Include, KW_Write,
85                 KW_Machine, KW_When, KW_Eof, KW_Err, KW_Lerr, KW_To, KW_From;
86
87         # Specials in code blocks.
88         token KW_Break, KW_Exec, KW_Hold, KW_PChar, KW_Char, KW_Goto, KW_Call,
89                 KW_Ret, KW_CurState, KW_TargState, KW_Entry, KW_Next, KW_Exec,
90                 KW_Variable, KW_Access;
91
92         # Special token for terminating semi-terminated code blocks. Needed because
93         # semi is sent as a token in the code block rather than as a generic
94         # symbol.
95         token TK_Semi;
96         }%%
97
98         %% write instance_data;
99
100         void init();
101         int parseLangEl( int type, const Token *token );
102
103         Parser( char *fileName, char *sectionName, InputLoc &sectionLoc )
104                 : sectionName(sectionName)
105         {
106                 pd = new ParseData( fileName, sectionName, sectionLoc );
107         }
108
109         int token( InputLoc &loc, int tokId, char *tokstart, int toklen );
110         void tryMachineDef( InputLoc &loc, char *name, 
111                 JoinOrLm *joinOrLm, bool isInstance );
112
113         /* Report an error encountered by the parser. */
114         ostream &parser_error( int tokId, Token &token );
115
116         ParseData *pd;
117
118         /* The name of the root section, this does not change during an include. */
119         char *sectionName;
120
121         NameRef nameRef;
122         NameRefList nameRefList;
123 };
124
125 %% write token_defs;
126
127 #endif