Merge branch 'nasm-2.09.xx'
[platform/upstream/nasm.git] / directiv.pl
1 #!/usr/bin/perl
2 ## --------------------------------------------------------------------------
3 ##
4 ##   Copyright 1996-2009 The NASM Authors - All Rights Reserved
5 ##   See the file AUTHORS included with the NASM distribution for
6 ##   the specific copyright holders.
7 ##
8 ##   Redistribution and use in source and binary forms, with or without
9 ##   modification, are permitted provided that the following
10 ##   conditions are met:
11 ##
12 ##   * Redistributions of source code must retain the above copyright
13 ##     notice, this list of conditions and the following disclaimer.
14 ##   * Redistributions in binary form must reproduce the above
15 ##     copyright notice, this list of conditions and the following
16 ##     disclaimer in the documentation and/or other materials provided
17 ##     with the distribution.
18 ##
19 ##     THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND
20 ##     CONTRIBUTORS "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES,
21 ##     INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF
22 ##     MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
23 ##     DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR
24 ##     CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
25 ##     SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT
26 ##     NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
27 ##     LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
28 ##     HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
29 ##     CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR
30 ##     OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE,
31 ##     EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
32 ##
33 ## --------------------------------------------------------------------------
34
35 #
36 # Generate a perfect hash for directive parsing
37 #
38 # Usage: directiv.pl directiv.dat directiv.c directiv.h
39 #
40
41 require 'phash.ph';
42
43 my($output, $directives_dat, $outfile) = @ARGV;
44
45 @directives = ();
46 @specials   = ('none', 'unknown');
47
48 open(DD, "< ${directives_dat}\0")
49     or die "$0: cannot open: ${directives_dat}: $!\n";
50 while (defined($line = <DD>)) {
51     chomp $line;
52     if ($line =~ /^\s*([[:alnum:]]+)\s*(|[\;\#].*)$/) {
53         push(@directives, $1);
54     }
55 }
56 close(DD);
57
58 if ($output eq 'h') {
59     open(H, "> ${outfile}\0")
60         or die "$0: cannot create: ${outfile}: $!\n";
61
62     print H "/*\n";
63     print H " * This     file is generated from directiv.dat\n";
64     print H " * by directiv.pl; do not edit.\n";
65     print H " */\n";
66     print H "\n";
67
68     print H "#ifndef NASM_DIRECTIVES_H\n";
69     print H "#define NASM_DIRECTIVES_H\n";
70     print H "\n";
71
72     $c = '{';
73     print H "enum directives ";
74     foreach $d (@specials) {
75         print H "$c\n    D_$d";
76         $c = ',';
77     }
78     foreach $d (@directives) {
79         print H "$c\n    D_\U$d";
80         $c = ',';
81     }
82     print H "\n};\n\n";
83     printf H "extern const char * const directives[%d];\n",
84         scalar(@directives)+scalar(@specials);
85     print H "enum directives find_directive(const char *token);\n\n";
86     print H "#endif /* NASM_DIRECTIVES_H */\n";
87 } elsif ($output eq 'c') {
88     %directive = ();
89     $n = 0;
90     foreach $d (@directives) {
91         if (exists($directive{$d})) {
92             die "$0: $directives_dat: duplicate directive: $d\n";
93         }
94         $directive{$d} = $n++;  # This is zero-based, unlike the enum!
95     }
96
97     @hashinfo = gen_perfect_hash(\%directive);
98     if (!@hashinfo) {
99         die "$0: no hash found\n";
100     }
101
102     # Paranoia...
103     verify_hash_table(\%directive, \@hashinfo);
104
105     ($n, $sv, $g) = @hashinfo;
106
107     die if ($n & ($n-1));
108
109     open(C, "> ${outfile}\0")
110         or die "$0: cannot create: ${directives_c}: $!\n";
111
112     print C "/*\n";
113     print C " * This file is generated from directiv.dat\n";
114     print C " * by directiv.pl; do not edit.\n";
115     print C " */\n";
116     print C "\n";
117
118     print C "#include \"compiler.h\"\n";
119     print C "#include <string.h>\n";
120     print C "#include \"nasm.h\"\n";
121     print C "#include \"hashtbl.h\"\n";
122     print C "#include \"directiv.h\"\n";
123     print C "\n";
124
125     printf C "const char * const directives[%d] = \n",
126         scalar(@directives)+scalar(@specials);
127     $c = '{';
128     foreach $d (@specials) {
129         print C "$c\n    NULL";
130         $c = ',';
131     }
132     foreach $d (@directives) {
133         print C "$c\n    \"$d\"";
134         $c = ',';
135     }
136     print C "\n};\n\n";
137
138     print C "enum directives find_directive(const char *token)\n";
139     print C "{\n";
140
141     # Put a large value in unused slots.  This makes it extremely unlikely
142     # that any combination that involves unused slot will pass the range test.
143     # This speeds up rejection of unrecognized tokens, i.e. identifiers.
144     print C "#define UNUSED 16383\n";
145
146     print C "    static const int16_t hash1[$n] = {\n";
147     for ($i = 0; $i < $n; $i++) {
148         my $h = ${$g}[$i*2+0];
149         print C "        ", defined($h) ? $h : 'UNUSED', ",\n";
150     }
151     print C "    };\n";
152
153     print C "    static const int16_t hash2[$n] = {\n";
154     for ($i = 0; $i < $n; $i++) {
155         my $h = ${$g}[$i*2+1];
156         print C "        ", defined($h) ? $h : 'UNUSED', ",\n";
157     }
158     print C "    };\n";
159
160     print C  "    uint32_t k1, k2;\n";
161     print C  "    uint64_t crc;\n";
162     # For correct overflow behavior, "ix" should be unsigned of the same
163     # width as the hash arrays.
164     print C  "    uint16_t ix;\n";
165     print C  "\n";
166     printf C "    crc = crc64i(UINT64_C(0x%08x%08x), token);\n",
167         $$sv[0], $$sv[1];
168     print C  "    k1 = (uint32_t)crc;\n";
169     print C  "    k2 = (uint32_t)(crc >> 32);\n";
170     print C  "\n";
171     printf C "    ix = hash1[k1 & 0x%x] + hash2[k2 & 0x%x];\n", $n-1, $n-1;
172     printf C "    if (ix >= %d)\n", scalar(@directives);
173     print C  "        return D_unknown;\n";
174     print C  "\n";
175     printf C "    ix += %d;\n", scalar(@specials);
176     print C  "    if (nasm_stricmp(token, directives[ix]))\n";
177     print C  "        return D_unknown;\n";
178     print C  "\n";
179     print C  "    return ix;\n";
180     print C  "}\n";
181 }