(operand): Do not as_bad() if RELAX_PAREN_GROUPING is
[external/binutils.git] / gas / expr.c
1 /* expr.c -operands, expressions-
2    Copyright (C) 1987, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 2000
3    Free Software Foundation, Inc.
4
5    This file is part of GAS, the GNU Assembler.
6
7    GAS is free software; you can redistribute it and/or modify
8    it under the terms of the GNU General Public License as published by
9    the Free Software Foundation; either version 2, or (at your option)
10    any later version.
11
12    GAS is distributed in the hope that it will be useful,
13    but WITHOUT ANY WARRANTY; without even the implied warranty of
14    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15    GNU General Public License for more details.
16
17    You should have received a copy of the GNU General Public License
18    along with GAS; see the file COPYING.  If not, write to the Free
19    Software Foundation, 59 Temple Place - Suite 330, Boston, MA
20    02111-1307, USA. */
21
22 /*
23  * This is really a branch office of as-read.c. I split it out to clearly
24  * distinguish the world of expressions from the world of statements.
25  * (It also gives smaller files to re-compile.)
26  * Here, "operand"s are of expressions, not instructions.
27  */
28
29 #include <ctype.h>
30 #include <string.h>
31 #define min(a, b)       ((a) < (b) ? (a) : (b))
32
33 #include "as.h"
34 #include "obstack.h"
35
36 static void floating_constant PARAMS ((expressionS * expressionP));
37 static valueT generic_bignum_to_int32 PARAMS ((void));
38 #ifdef BFD64
39 static valueT generic_bignum_to_int64 PARAMS ((void));
40 #endif
41 static void integer_constant PARAMS ((int radix, expressionS * expressionP));
42 static void mri_char_constant PARAMS ((expressionS *));
43 static void current_location PARAMS ((expressionS *));
44 static void clean_up_expression PARAMS ((expressionS * expressionP));
45 static segT operand PARAMS ((expressionS *));
46 static operatorT operator PARAMS ((void));
47
48 extern const char EXP_CHARS[], FLT_CHARS[];
49
50 /* We keep a mapping of expression symbols to file positions, so that
51    we can provide better error messages.  */
52
53 struct expr_symbol_line
54 {
55   struct expr_symbol_line *next;
56   symbolS *sym;
57   char *file;
58   unsigned int line;
59 };
60
61 static struct expr_symbol_line *expr_symbol_lines;
62 \f
63 /* Build a dummy symbol to hold a complex expression.  This is how we
64    build expressions up out of other expressions.  The symbol is put
65    into the fake section expr_section.  */
66
67 symbolS *
68 make_expr_symbol (expressionP)
69      expressionS *expressionP;
70 {
71   expressionS zero;
72   const char *fake;
73   symbolS *symbolP;
74   struct expr_symbol_line *n;
75
76   if (expressionP->X_op == O_symbol
77       && expressionP->X_add_number == 0)
78     return expressionP->X_add_symbol;
79
80   if (expressionP->X_op == O_big)
81     {
82       /* This won't work, because the actual value is stored in
83          generic_floating_point_number or generic_bignum, and we are
84          going to lose it if we haven't already.  */
85       if (expressionP->X_add_number > 0)
86         as_bad (_("bignum invalid; zero assumed"));
87       else
88         as_bad (_("floating point number invalid; zero assumed"));
89       zero.X_op = O_constant;
90       zero.X_add_number = 0;
91       zero.X_unsigned = 0;
92       clean_up_expression (&zero);
93       expressionP = &zero;
94     }
95
96   fake = FAKE_LABEL_NAME;
97
98   /* Putting constant symbols in absolute_section rather than
99      expr_section is convenient for the old a.out code, for which
100      S_GET_SEGMENT does not always retrieve the value put in by
101      S_SET_SEGMENT.  */
102   symbolP = symbol_create (fake,
103                            (expressionP->X_op == O_constant
104                             ? absolute_section
105                             : expr_section),
106                            0, &zero_address_frag);
107   symbol_set_value_expression (symbolP, expressionP);
108
109   if (expressionP->X_op == O_constant)
110     resolve_symbol_value (symbolP, 1);
111
112   n = (struct expr_symbol_line *) xmalloc (sizeof *n);
113   n->sym = symbolP;
114   as_where (&n->file, &n->line);
115   n->next = expr_symbol_lines;
116   expr_symbol_lines = n;
117
118   return symbolP;
119 }
120
121 /* Return the file and line number for an expr symbol.  Return
122    non-zero if something was found, 0 if no information is known for
123    the symbol.  */
124
125 int
126 expr_symbol_where (sym, pfile, pline)
127      symbolS *sym;
128      char **pfile;
129      unsigned int *pline;
130 {
131   register struct expr_symbol_line *l;
132
133   for (l = expr_symbol_lines; l != NULL; l = l->next)
134     {
135       if (l->sym == sym)
136         {
137           *pfile = l->file;
138           *pline = l->line;
139           return 1;
140         }
141     }
142
143   return 0;
144 }
145 \f
146 /* Utilities for building expressions.
147    Since complex expressions are recorded as symbols for use in other
148    expressions these return a symbolS * and not an expressionS *.
149    These explicitly do not take an "add_number" argument.  */
150 /* ??? For completeness' sake one might want expr_build_symbol.
151    It would just return its argument.  */
152
153 /* Build an expression for an unsigned constant.
154    The corresponding one for signed constants is missing because
155    there's currently no need for it.  One could add an unsigned_p flag
156    but that seems more clumsy.  */
157
158 symbolS *
159 expr_build_uconstant (value)
160      offsetT value;
161 {
162   expressionS e;
163
164   e.X_op = O_constant;
165   e.X_add_number = value;
166   e.X_unsigned = 1;
167   return make_expr_symbol (&e);
168 }
169
170 /* Build an expression for OP s1.  */
171
172 symbolS *
173 expr_build_unary (op, s1)
174      operatorT op;
175      symbolS *s1;
176 {
177   expressionS e;
178
179   e.X_op = op;
180   e.X_add_symbol = s1;
181   e.X_add_number = 0;
182   return make_expr_symbol (&e);
183 }
184
185 /* Build an expression for s1 OP s2.  */
186
187 symbolS *
188 expr_build_binary (op, s1, s2)
189      operatorT op;
190      symbolS *s1;
191      symbolS *s2;
192 {
193   expressionS e;
194
195   e.X_op = op;
196   e.X_add_symbol = s1;
197   e.X_op_symbol = s2;
198   e.X_add_number = 0;
199   return make_expr_symbol (&e);
200 }
201
202 /* Build an expression for the current location ('.').  */
203
204 symbolS *
205 expr_build_dot ()
206 {
207   expressionS e;
208
209   current_location (&e);
210   return make_expr_symbol (&e);
211 }
212 \f
213 /*
214  * Build any floating-point literal here.
215  * Also build any bignum literal here.
216  */
217
218 /* Seems atof_machine can backscan through generic_bignum and hit whatever
219    happens to be loaded before it in memory.  And its way too complicated
220    for me to fix right.  Thus a hack.  JF:  Just make generic_bignum bigger,
221    and never write into the early words, thus they'll always be zero.
222    I hate Dean's floating-point code.  Bleh.  */
223 LITTLENUM_TYPE generic_bignum[SIZE_OF_LARGE_NUMBER + 6];
224 FLONUM_TYPE generic_floating_point_number =
225 {
226   &generic_bignum[6],           /* low (JF: Was 0) */
227   &generic_bignum[SIZE_OF_LARGE_NUMBER + 6 - 1], /* high JF: (added +6) */
228   0,                            /* leader */
229   0,                            /* exponent */
230   0                             /* sign */
231 };
232 /* If nonzero, we've been asked to assemble nan, +inf or -inf */
233 int generic_floating_point_magic;
234 \f
235 static void
236 floating_constant (expressionP)
237      expressionS *expressionP;
238 {
239   /* input_line_pointer->*/
240   /* floating-point constant. */
241   int error_code;
242
243   error_code = atof_generic (&input_line_pointer, ".", EXP_CHARS,
244                              &generic_floating_point_number);
245
246   if (error_code)
247     {
248       if (error_code == ERROR_EXPONENT_OVERFLOW)
249         {
250           as_bad (_("bad floating-point constant: exponent overflow, probably assembling junk"));
251         }
252       else
253         {
254           as_bad (_("bad floating-point constant: unknown error code=%d."), error_code);
255         }
256     }
257   expressionP->X_op = O_big;
258   /* input_line_pointer->just after constant, */
259   /* which may point to whitespace. */
260   expressionP->X_add_number = -1;
261 }
262
263 static valueT 
264 generic_bignum_to_int32 () 
265 {
266   valueT number =
267            ((generic_bignum[1] & LITTLENUM_MASK) << LITTLENUM_NUMBER_OF_BITS)
268            | (generic_bignum[0] & LITTLENUM_MASK);
269   number &= 0xffffffff;
270   return number;
271 }
272
273 #ifdef BFD64
274 static valueT 
275 generic_bignum_to_int64 () 
276 {
277   valueT number = 
278            ((((((((valueT) generic_bignum[3] & LITTLENUM_MASK)
279                  << LITTLENUM_NUMBER_OF_BITS)
280                 | ((valueT) generic_bignum[2] & LITTLENUM_MASK))
281                << LITTLENUM_NUMBER_OF_BITS)
282               | ((valueT) generic_bignum[1] & LITTLENUM_MASK))
283              << LITTLENUM_NUMBER_OF_BITS)
284             | ((valueT) generic_bignum[0] & LITTLENUM_MASK));
285   return number;
286 }
287 #endif
288
289 static void
290 integer_constant (radix, expressionP)
291      int radix;
292      expressionS *expressionP;
293 {
294   char *start;          /* start of number. */
295   char *suffix = NULL;
296   char c;
297   valueT number;        /* offset or (absolute) value */
298   short int digit;      /* value of next digit in current radix */
299   short int maxdig = 0;/* highest permitted digit value. */
300   int too_many_digits = 0;      /* if we see >= this number of */
301   char *name;           /* points to name of symbol */
302   symbolS *symbolP;     /* points to symbol */
303
304   int small;                    /* true if fits in 32 bits. */
305
306   /* May be bignum, or may fit in 32 bits. */
307   /* Most numbers fit into 32 bits, and we want this case to be fast.
308      so we pretend it will fit into 32 bits.  If, after making up a 32
309      bit number, we realise that we have scanned more digits than
310      comfortably fit into 32 bits, we re-scan the digits coding them
311      into a bignum.  For decimal and octal numbers we are
312      conservative: Some numbers may be assumed bignums when in fact
313      they do fit into 32 bits.  Numbers of any radix can have excess
314      leading zeros: We strive to recognise this and cast them back
315      into 32 bits.  We must check that the bignum really is more than
316      32 bits, and change it back to a 32-bit number if it fits.  The
317      number we are looking for is expected to be positive, but if it
318      fits into 32 bits as an unsigned number, we let it be a 32-bit
319      number.  The cavalier approach is for speed in ordinary cases. */
320   /* This has been extended for 64 bits.  We blindly assume that if
321      you're compiling in 64-bit mode, the target is a 64-bit machine.
322      This should be cleaned up.  */
323
324 #ifdef BFD64
325 #define valuesize 64
326 #else /* includes non-bfd case, mostly */
327 #define valuesize 32
328 #endif
329
330   if ((NUMBERS_WITH_SUFFIX || flag_m68k_mri) && radix == 0)
331     {
332       int flt = 0;
333
334       /* In MRI mode, the number may have a suffix indicating the
335          radix.  For that matter, it might actually be a floating
336          point constant.  */
337       for (suffix = input_line_pointer;
338            isalnum ((unsigned char) *suffix);
339            suffix++)
340         {
341           if (*suffix == 'e' || *suffix == 'E')
342             flt = 1;
343         }
344
345       if (suffix == input_line_pointer)
346         {
347           radix = 10;
348           suffix = NULL;
349         }
350       else
351         {
352           c = *--suffix;
353           if (islower ((unsigned char) c))
354             c = toupper (c);
355           if (c == 'B')
356             radix = 2;
357           else if (c == 'D')
358             radix = 10;
359           else if (c == 'O' || c == 'Q')
360             radix = 8;
361           else if (c == 'H')
362             radix = 16;
363           else if (suffix[1] == '.' || c == 'E' || flt)
364             {
365               floating_constant (expressionP);
366               return;
367             }
368           else
369             {
370               radix = 10;
371               suffix = NULL;
372             }
373         }
374     }
375
376   switch (radix)
377     {
378     case 2:
379       maxdig = 2;
380       too_many_digits = valuesize + 1;
381       break;
382     case 8:
383       maxdig = radix = 8;
384       too_many_digits = (valuesize + 2) / 3 + 1;
385       break;
386     case 16:
387       maxdig = radix = 16;
388       too_many_digits = (valuesize + 3) / 4 + 1;
389       break;
390     case 10:
391       maxdig = radix = 10;
392       too_many_digits = (valuesize + 11) / 4; /* very rough */
393     }
394 #undef valuesize
395   start = input_line_pointer;
396   c = *input_line_pointer++;
397   for (number = 0;
398        (digit = hex_value (c)) < maxdig;
399        c = *input_line_pointer++)
400     {
401       number = number * radix + digit;
402     }
403   /* c contains character after number. */
404   /* input_line_pointer->char after c. */
405   small = (input_line_pointer - start - 1) < too_many_digits;
406
407   if (radix == 16 && c == '_') 
408     {
409       /* This is literal of the form 0x333_0_12345678_1.
410          This example is equivalent to 0x00000333000000001234567800000001.  */
411
412       int num_little_digits = 0;
413       int i;
414       input_line_pointer = start;       /*->1st digit. */
415
416       know (LITTLENUM_NUMBER_OF_BITS == 16);
417
418       for (c = '_'; c == '_'; num_little_digits+=2)
419         {
420
421           /* Convert one 64-bit word. */
422           int ndigit = 0; 
423           number = 0;
424           for (c = *input_line_pointer++;
425                (digit = hex_value (c)) < maxdig;
426                c = *(input_line_pointer++))
427             {
428               number = number * radix + digit;
429               ndigit++;
430             }
431
432           /* Check for 8 digit per word max.  */
433           if (ndigit > 8) 
434             as_bad (_("A bignum with underscores may not have more than 8 hex digits in any word."));
435
436           /* Add this chunk to the bignum.  Shift things down 2 little digits.*/
437           know (LITTLENUM_NUMBER_OF_BITS == 16);
438           for (i = min (num_little_digits + 1, SIZE_OF_LARGE_NUMBER - 1); i >= 2; i--)
439             generic_bignum[i] = generic_bignum[i-2];
440
441           /* Add the new digits as the least significant new ones. */
442           generic_bignum[0] = number & 0xffffffff;
443           generic_bignum[1] = number >> 16;
444         }
445
446       /* Again, c is char after number, input_line_pointer->after c. */
447
448       if (num_little_digits > SIZE_OF_LARGE_NUMBER - 1)
449         num_little_digits = SIZE_OF_LARGE_NUMBER - 1;
450
451       assert (num_little_digits >= 4);
452
453       if (num_little_digits != 8)
454         as_bad (_("A bignum with underscores must have exactly 4 words."));
455
456       /* We might have some leading zeros.  These can be trimmed to give
457        * us a change to fit this constant into a small number.
458        */
459       while (generic_bignum[num_little_digits-1] == 0 && num_little_digits > 1)
460         num_little_digits--;
461         
462       if (num_little_digits <= 2)
463         {
464           /* will fit into 32 bits. */
465           number = generic_bignum_to_int32 ();
466           small = 1;
467         }
468 #ifdef BFD64
469       else if (num_little_digits <= 4)
470         {
471           /* Will fit into 64 bits.  */
472           number = generic_bignum_to_int64 ();
473           small = 1;
474         }
475 #endif
476       else
477         {
478           small = 0;
479           number = num_little_digits; /* number of littlenums in the bignum. */
480         }
481     }
482   else if (!small)
483     {
484       /*
485        * we saw a lot of digits. manufacture a bignum the hard way.
486        */
487       LITTLENUM_TYPE *leader;   /*->high order littlenum of the bignum. */
488       LITTLENUM_TYPE *pointer;  /*->littlenum we are frobbing now. */
489       long carry;
490
491       leader = generic_bignum;
492       generic_bignum[0] = 0;
493       generic_bignum[1] = 0;
494       generic_bignum[2] = 0;
495       generic_bignum[3] = 0;
496       input_line_pointer = start;       /*->1st digit. */
497       c = *input_line_pointer++;
498       for (;
499            (carry = hex_value (c)) < maxdig;
500            c = *input_line_pointer++)
501         {
502           for (pointer = generic_bignum;
503                pointer <= leader;
504                pointer++)
505             {
506               long work;
507
508               work = carry + radix * *pointer;
509               *pointer = work & LITTLENUM_MASK;
510               carry = work >> LITTLENUM_NUMBER_OF_BITS;
511             }
512           if (carry)
513             {
514               if (leader < generic_bignum + SIZE_OF_LARGE_NUMBER - 1)
515                 {
516                   /* room to grow a longer bignum. */
517                   *++leader = carry;
518                 }
519             }
520         }
521       /* again, c is char after number, */
522       /* input_line_pointer->after c. */
523       know (LITTLENUM_NUMBER_OF_BITS == 16);
524       if (leader < generic_bignum + 2)
525         {
526           /* will fit into 32 bits. */
527           number = generic_bignum_to_int32 ();
528           small = 1;
529         }
530 #ifdef BFD64
531       else if (leader < generic_bignum + 4)
532         {
533           /* Will fit into 64 bits.  */
534           number = generic_bignum_to_int64 ();
535           small = 1;
536         }
537 #endif
538       else
539         {
540           number = leader - generic_bignum + 1; /* number of littlenums in the bignum. */
541         }
542     }
543
544   if ((NUMBERS_WITH_SUFFIX || flag_m68k_mri)
545       && suffix != NULL
546       && input_line_pointer - 1 == suffix)
547     c = *input_line_pointer++;
548
549   if (small)
550     {
551       /*
552        * here with number, in correct radix. c is the next char.
553        * note that unlike un*x, we allow "011f" "0x9f" to
554        * both mean the same as the (conventional) "9f". this is simply easier
555        * than checking for strict canonical form. syntax sux!
556        */
557
558       if (LOCAL_LABELS_FB && c == 'b')
559         {
560           /*
561            * backward ref to local label.
562            * because it is backward, expect it to be defined.
563            */
564           /* Construct a local label.  */
565           name = fb_label_name ((int) number, 0);
566
567           /* seen before, or symbol is defined: ok */
568           symbolP = symbol_find (name);
569           if ((symbolP != NULL) && (S_IS_DEFINED (symbolP)))
570             {
571               /* local labels are never absolute. don't waste time
572                  checking absoluteness. */
573               know (SEG_NORMAL (S_GET_SEGMENT (symbolP)));
574
575               expressionP->X_op = O_symbol;
576               expressionP->X_add_symbol = symbolP;
577             }
578           else
579             {
580               /* either not seen or not defined. */
581               /* @@ Should print out the original string instead of
582                  the parsed number.  */
583               as_bad (_("backw. ref to unknown label \"%d:\", 0 assumed."),
584                       (int) number);
585               expressionP->X_op = O_constant;
586             }
587
588           expressionP->X_add_number = 0;
589         }                       /* case 'b' */
590       else if (LOCAL_LABELS_FB && c == 'f')
591         {
592           /*
593            * forward reference. expect symbol to be undefined or
594            * unknown. undefined: seen it before. unknown: never seen
595            * it before.
596            * construct a local label name, then an undefined symbol.
597            * don't create a xseg frag for it: caller may do that.
598            * just return it as never seen before.
599            */
600           name = fb_label_name ((int) number, 1);
601           symbolP = symbol_find_or_make (name);
602           /* we have no need to check symbol properties. */
603 #ifndef many_segments
604           /* since "know" puts its arg into a "string", we
605              can't have newlines in the argument.  */
606           know (S_GET_SEGMENT (symbolP) == undefined_section || S_GET_SEGMENT (symbolP) == text_section || S_GET_SEGMENT (symbolP) == data_section);
607 #endif
608           expressionP->X_op = O_symbol;
609           expressionP->X_add_symbol = symbolP;
610           expressionP->X_add_number = 0;
611         }                       /* case 'f' */
612       else if (LOCAL_LABELS_DOLLAR && c == '$')
613         {
614           /* If the dollar label is *currently* defined, then this is just
615              another reference to it.  If it is not *currently* defined,
616              then this is a fresh instantiation of that number, so create
617              it.  */
618
619           if (dollar_label_defined ((long) number))
620             {
621               name = dollar_label_name ((long) number, 0);
622               symbolP = symbol_find (name);
623               know (symbolP != NULL);
624             }
625           else
626             {
627               name = dollar_label_name ((long) number, 1);
628               symbolP = symbol_find_or_make (name);
629             }
630
631           expressionP->X_op = O_symbol;
632           expressionP->X_add_symbol = symbolP;
633           expressionP->X_add_number = 0;
634         }                       /* case '$' */
635       else
636         {
637           expressionP->X_op = O_constant;
638 #ifdef TARGET_WORD_SIZE
639           /* Sign extend NUMBER.  */
640           number |= (-(number >> (TARGET_WORD_SIZE - 1))) << (TARGET_WORD_SIZE - 1);
641 #endif
642           expressionP->X_add_number = number;
643           input_line_pointer--; /* restore following character. */
644         }                       /* really just a number */
645     }
646   else
647     {
648       /* not a small number */
649       expressionP->X_op = O_big;
650       expressionP->X_add_number = number;       /* number of littlenums */
651       input_line_pointer--;     /*->char following number. */
652     }
653 }
654
655 /* Parse an MRI multi character constant.  */
656
657 static void
658 mri_char_constant (expressionP)
659      expressionS *expressionP;
660 {
661   int i;
662
663   if (*input_line_pointer == '\''
664       && input_line_pointer[1] != '\'')
665     {
666       expressionP->X_op = O_constant;
667       expressionP->X_add_number = 0;
668       return;
669     }
670
671   /* In order to get the correct byte ordering, we must build the
672      number in reverse.  */
673   for (i = SIZE_OF_LARGE_NUMBER - 1; i >= 0; i--)
674     {
675       int j;
676
677       generic_bignum[i] = 0;
678       for (j = 0; j < CHARS_PER_LITTLENUM; j++)
679         {
680           if (*input_line_pointer == '\'')
681             {
682               if (input_line_pointer[1] != '\'')
683                 break;
684               ++input_line_pointer;
685             }
686           generic_bignum[i] <<= 8;
687           generic_bignum[i] += *input_line_pointer;
688           ++input_line_pointer;
689         }
690
691       if (i < SIZE_OF_LARGE_NUMBER - 1)
692         {
693           /* If there is more than one littlenum, left justify the
694              last one to make it match the earlier ones.  If there is
695              only one, we can just use the value directly.  */
696           for (; j < CHARS_PER_LITTLENUM; j++)
697             generic_bignum[i] <<= 8;
698         }
699
700       if (*input_line_pointer == '\''
701           && input_line_pointer[1] != '\'')
702         break;
703     }
704
705   if (i < 0)
706     {
707       as_bad (_("Character constant too large"));
708       i = 0;
709     }
710
711   if (i > 0)
712     {
713       int c;
714       int j;
715
716       c = SIZE_OF_LARGE_NUMBER - i;
717       for (j = 0; j < c; j++)
718         generic_bignum[j] = generic_bignum[i + j];
719       i = c;
720     }
721
722   know (LITTLENUM_NUMBER_OF_BITS == 16);
723   if (i > 2)
724     {
725       expressionP->X_op = O_big;
726       expressionP->X_add_number = i;
727     }
728   else
729     {
730       expressionP->X_op = O_constant;
731       if (i < 2)
732         expressionP->X_add_number = generic_bignum[0] & LITTLENUM_MASK;
733       else
734         expressionP->X_add_number =
735           (((generic_bignum[1] & LITTLENUM_MASK)
736             << LITTLENUM_NUMBER_OF_BITS)
737            | (generic_bignum[0] & LITTLENUM_MASK));
738     }
739
740   /* Skip the final closing quote.  */
741   ++input_line_pointer;
742 }
743
744 /* Return an expression representing the current location.  This
745    handles the magic symbol `.'.  */
746
747 static void
748 current_location (expressionp)
749      expressionS *expressionp;
750 {
751   if (now_seg == absolute_section)
752     {
753       expressionp->X_op = O_constant;
754       expressionp->X_add_number = abs_section_offset;
755     }
756   else
757     {
758       symbolS *symbolp;
759
760       symbolp = symbol_new (FAKE_LABEL_NAME, now_seg,
761                             (valueT) frag_now_fix (),
762                             frag_now);
763       expressionp->X_op = O_symbol;
764       expressionp->X_add_symbol = symbolp;
765       expressionp->X_add_number = 0;
766     }
767 }
768
769 /*
770  * Summary of operand().
771  *
772  * in:  Input_line_pointer points to 1st char of operand, which may
773  *      be a space.
774  *
775  * out: A expressionS.
776  *      The operand may have been empty: in this case X_op == O_absent.
777  *      Input_line_pointer->(next non-blank) char after operand.
778  */
779
780 static segT
781 operand (expressionP)
782      expressionS *expressionP;
783 {
784   char c;
785   symbolS *symbolP;     /* points to symbol */
786   char *name;           /* points to name of symbol */
787   segT segment;
788
789   /* All integers are regarded as unsigned unless they are negated.
790      This is because the only thing which cares whether a number is
791      unsigned is the code in emit_expr which extends constants into
792      bignums.  It should only sign extend negative numbers, so that
793      something like ``.quad 0x80000000'' is not sign extended even
794      though it appears negative if valueT is 32 bits.  */
795   expressionP->X_unsigned = 1;
796
797   /* digits, assume it is a bignum. */
798
799   SKIP_WHITESPACE ();           /* leading whitespace is part of operand. */
800   c = *input_line_pointer++;    /* input_line_pointer->past char in c. */
801
802   if (is_end_of_line[(unsigned char) c])
803     goto eol;
804
805   switch (c)
806     {
807     case '1':
808     case '2':
809     case '3':
810     case '4':
811     case '5':
812     case '6':
813     case '7':
814     case '8':
815     case '9':
816       input_line_pointer--;
817
818       integer_constant ((NUMBERS_WITH_SUFFIX || flag_m68k_mri)
819                         ? 0 : 10,
820                         expressionP);
821       break;
822
823     case '0':
824       /* non-decimal radix */
825
826       if (NUMBERS_WITH_SUFFIX || flag_m68k_mri)
827         {
828           char *s;
829
830           /* Check for a hex constant.  */
831           for (s = input_line_pointer; hex_p (*s); s++)
832             ;
833           if (*s == 'h' || *s == 'H')
834             {
835               --input_line_pointer;
836               integer_constant (0, expressionP);
837               break;
838             }
839         }
840       c = *input_line_pointer;
841       switch (c)
842         {
843         case 'o':
844         case 'O':
845         case 'q':
846         case 'Q':
847         case '8':
848         case '9':
849           if (NUMBERS_WITH_SUFFIX || flag_m68k_mri)
850             {
851               integer_constant (0, expressionP);
852               break;
853             }
854           /* Fall through.  */
855         default:
856         default_case:
857           if (c && strchr (FLT_CHARS, c))
858             {
859               input_line_pointer++;
860               floating_constant (expressionP);
861               expressionP->X_add_number =
862                 - (isupper ((unsigned char) c) ? tolower (c) : c);
863             }
864           else
865             {
866               /* The string was only zero */
867               expressionP->X_op = O_constant;
868               expressionP->X_add_number = 0;
869             }
870
871           break;
872
873         case 'x':
874         case 'X':
875           if (flag_m68k_mri)
876             goto default_case;
877           input_line_pointer++;
878           integer_constant (16, expressionP);
879           break;
880
881         case 'b':
882           if (LOCAL_LABELS_FB && ! (flag_m68k_mri || NUMBERS_WITH_SUFFIX))
883             {
884               /* This code used to check for '+' and '-' here, and, in
885                  some conditions, fall through to call
886                  integer_constant.  However, that didn't make sense,
887                  as integer_constant only accepts digits.  */
888               /* Some of our code elsewhere does permit digits greater
889                  than the expected base; for consistency, do the same
890                  here.  */
891               if (input_line_pointer[1] < '0'
892                   || input_line_pointer[1] > '9')
893                 {
894                   /* Parse this as a back reference to label 0.  */
895                   input_line_pointer--;
896                   integer_constant (10, expressionP);
897                   break;
898                 }
899               /* Otherwise, parse this as a binary number.  */
900             }
901           /* Fall through.  */
902         case 'B':
903           input_line_pointer++;
904           if (flag_m68k_mri || NUMBERS_WITH_SUFFIX)
905             goto default_case;
906           integer_constant (2, expressionP);
907           break;
908
909         case '0':
910         case '1':
911         case '2':
912         case '3':
913         case '4':
914         case '5':
915         case '6':
916         case '7':
917           integer_constant ((flag_m68k_mri || NUMBERS_WITH_SUFFIX)
918                             ? 0 : 8, 
919                             expressionP);
920           break;
921
922         case 'f':
923           if (LOCAL_LABELS_FB)
924             {
925               /* If it says "0f" and it could possibly be a floating point
926                  number, make it one.  Otherwise, make it a local label,
927                  and try to deal with parsing the rest later.  */
928               if (!input_line_pointer[1]
929                   || (is_end_of_line[0xff & input_line_pointer[1]])
930                   || strchr (FLT_CHARS, 'f') == NULL)
931                 goto is_0f_label;
932               {
933                 char *cp = input_line_pointer + 1;
934                 int r = atof_generic (&cp, ".", EXP_CHARS,
935                                       &generic_floating_point_number);
936                 switch (r)
937                   {
938                   case 0:
939                   case ERROR_EXPONENT_OVERFLOW:
940                     if (*cp == 'f' || *cp == 'b')
941                       /* looks like a difference expression */
942                       goto is_0f_label;
943                     else if (cp == input_line_pointer + 1)
944                       /* No characters has been accepted -- looks like
945                          end of operand. */
946                       goto is_0f_label;
947                     else
948                       goto is_0f_float;
949                   default:
950                     as_fatal (_("expr.c(operand): bad atof_generic return val %d"),
951                               r);
952                   }
953               }
954
955               /* Okay, now we've sorted it out.  We resume at one of these
956                  two labels, depending on what we've decided we're probably
957                  looking at.  */
958             is_0f_label:
959               input_line_pointer--;
960               integer_constant (10, expressionP);
961               break;
962
963             is_0f_float:
964               /* fall through */
965               ;
966             }
967
968         case 'd':
969         case 'D':
970           if (flag_m68k_mri || NUMBERS_WITH_SUFFIX)
971             {
972               integer_constant (0, expressionP);
973               break;
974             }
975           /* Fall through.  */
976         case 'F':
977         case 'r':
978         case 'e':
979         case 'E':
980         case 'g':
981         case 'G':
982           input_line_pointer++;
983           floating_constant (expressionP);
984           expressionP->X_add_number =
985             - (isupper ((unsigned char) c) ? tolower (c) : c);
986           break;
987
988         case '$':
989           if (LOCAL_LABELS_DOLLAR)
990             {
991               integer_constant (10, expressionP);
992               break;
993             }
994           else
995             goto default_case;
996         }
997
998       break;
999
1000     case '(':
1001 #ifndef NEED_INDEX_OPERATOR
1002     case '[':
1003 #endif
1004       /* didn't begin with digit & not a name */
1005       segment = expression (expressionP);
1006       /* Expression() will pass trailing whitespace */
1007       if ((c == '(' && *input_line_pointer != ')')
1008           || (c == '[' && *input_line_pointer != ']'))
1009         {
1010 #ifdef RELAX_PAREN_GROUPING
1011           if (c != '(')
1012 #endif
1013             as_bad (_("Missing '%c' assumed"), c == '(' ? ')' : ']');
1014         }
1015       else
1016         input_line_pointer++;
1017       SKIP_WHITESPACE ();
1018       /* here with input_line_pointer->char after "(...)" */
1019       return segment;
1020
1021 #ifdef TC_M68K
1022     case 'E':
1023       if (! flag_m68k_mri || *input_line_pointer != '\'')
1024         goto de_fault;
1025       as_bad (_("EBCDIC constants are not supported"));
1026       /* Fall through.  */
1027     case 'A':
1028       if (! flag_m68k_mri || *input_line_pointer != '\'')
1029         goto de_fault;
1030       ++input_line_pointer;
1031       /* Fall through.  */
1032 #endif
1033     case '\'':
1034       if (! flag_m68k_mri)
1035         {
1036           /* Warning: to conform to other people's assemblers NO
1037              ESCAPEMENT is permitted for a single quote. The next
1038              character, parity errors and all, is taken as the value
1039              of the operand. VERY KINKY.  */
1040           expressionP->X_op = O_constant;
1041           expressionP->X_add_number = *input_line_pointer++;
1042           break;
1043         }
1044
1045       mri_char_constant (expressionP);
1046       break;
1047
1048     case '+':
1049       (void) operand (expressionP);
1050       break;
1051
1052 #ifdef TC_M68K
1053     case '"':
1054       /* Double quote is the bitwise not operator in MRI mode.  */
1055       if (! flag_m68k_mri)
1056         goto de_fault;
1057       /* Fall through.  */
1058 #endif
1059     case '~':
1060       /* ~ is permitted to start a label on the Delta.  */
1061       if (is_name_beginner (c))
1062         goto isname;
1063     case '!':
1064     case '-':
1065       {
1066         operand (expressionP);
1067         if (expressionP->X_op == O_constant)
1068           {
1069             /* input_line_pointer -> char after operand */
1070             if (c == '-')
1071               {
1072                 expressionP->X_add_number = - expressionP->X_add_number;
1073                 /* Notice: '-' may overflow: no warning is given. This is
1074                    compatible with other people's assemblers. Sigh.  */
1075                 expressionP->X_unsigned = 0;
1076               }
1077             else if (c == '~' || c == '"')
1078               expressionP->X_add_number = ~ expressionP->X_add_number;
1079             else
1080               expressionP->X_add_number = ! expressionP->X_add_number;
1081           }
1082         else if (expressionP->X_op != O_illegal
1083                  && expressionP->X_op != O_absent)
1084           {
1085             expressionP->X_add_symbol = make_expr_symbol (expressionP);
1086             if (c == '-')
1087               expressionP->X_op = O_uminus;
1088             else if (c == '~' || c == '"')
1089               expressionP->X_op = O_bit_not;
1090             else
1091               expressionP->X_op = O_logical_not;
1092             expressionP->X_add_number = 0;
1093           }
1094         else
1095           as_warn (_("Unary operator %c ignored because bad operand follows"),
1096                    c);
1097       }
1098       break;
1099
1100 #if defined (DOLLAR_DOT) || defined (TC_M68K)
1101     case '$':
1102       /* $ is the program counter when in MRI mode, or when DOLLAR_DOT
1103          is defined.  */
1104 #ifndef DOLLAR_DOT
1105       if (! flag_m68k_mri)
1106         goto de_fault;
1107 #endif
1108       if (flag_m68k_mri && hex_p (*input_line_pointer))
1109         {
1110           /* In MRI mode, $ is also used as the prefix for a
1111              hexadecimal constant.  */
1112           integer_constant (16, expressionP);
1113           break;
1114         }
1115
1116       if (is_part_of_name (*input_line_pointer))
1117         goto isname;
1118
1119       current_location (expressionP);
1120       break;
1121 #endif
1122
1123     case '.':
1124       if (!is_part_of_name (*input_line_pointer))
1125         {
1126           current_location (expressionP);
1127           break;
1128         }
1129       else if ((strncasecmp (input_line_pointer, "startof.", 8) == 0
1130                 && ! is_part_of_name (input_line_pointer[8]))
1131                || (strncasecmp (input_line_pointer, "sizeof.", 7) == 0
1132                    && ! is_part_of_name (input_line_pointer[7])))
1133         {
1134           int start;
1135
1136           start = (input_line_pointer[1] == 't'
1137                    || input_line_pointer[1] == 'T');
1138           input_line_pointer += start ? 8 : 7;
1139           SKIP_WHITESPACE ();
1140           if (*input_line_pointer != '(')
1141             as_bad (_("syntax error in .startof. or .sizeof."));
1142           else
1143             {
1144               char *buf;
1145
1146               ++input_line_pointer;
1147               SKIP_WHITESPACE ();
1148               name = input_line_pointer;
1149               c = get_symbol_end ();
1150
1151               buf = (char *) xmalloc (strlen (name) + 10);
1152               if (start)
1153                 sprintf (buf, ".startof.%s", name);
1154               else
1155                 sprintf (buf, ".sizeof.%s", name);
1156               symbolP = symbol_make (buf);
1157               free (buf);
1158
1159               expressionP->X_op = O_symbol;
1160               expressionP->X_add_symbol = symbolP;
1161               expressionP->X_add_number = 0;
1162
1163               *input_line_pointer = c;
1164               SKIP_WHITESPACE ();
1165               if (*input_line_pointer != ')')
1166                 as_bad (_("syntax error in .startof. or .sizeof."));
1167               else
1168                 ++input_line_pointer;
1169             }
1170           break;
1171         }
1172       else
1173         {
1174           goto isname;
1175         }
1176
1177     case ',':
1178     eol:
1179       /* can't imagine any other kind of operand */
1180       expressionP->X_op = O_absent;
1181       input_line_pointer--;
1182       break;
1183
1184 #ifdef TC_M68K
1185     case '%':
1186       if (! flag_m68k_mri)
1187         goto de_fault;
1188       integer_constant (2, expressionP);
1189       break;
1190
1191     case '@':
1192       if (! flag_m68k_mri)
1193         goto de_fault;
1194       integer_constant (8, expressionP);
1195       break;
1196
1197     case ':':
1198       if (! flag_m68k_mri)
1199         goto de_fault;
1200
1201       /* In MRI mode, this is a floating point constant represented
1202          using hexadecimal digits.  */
1203
1204       ++input_line_pointer;
1205       integer_constant (16, expressionP);
1206       break;
1207
1208     case '*':
1209       if (! flag_m68k_mri || is_part_of_name (*input_line_pointer))
1210         goto de_fault;
1211
1212       current_location (expressionP);
1213       break;
1214 #endif
1215
1216     default:
1217 #ifdef TC_M68K
1218     de_fault:
1219 #endif
1220       if (is_name_beginner (c)) /* here if did not begin with a digit */
1221         {
1222           /*
1223            * Identifier begins here.
1224            * This is kludged for speed, so code is repeated.
1225            */
1226         isname:
1227           name = --input_line_pointer;
1228           c = get_symbol_end ();
1229
1230 #ifdef md_parse_name
1231           /* This is a hook for the backend to parse certain names
1232              specially in certain contexts.  If a name always has a
1233              specific value, it can often be handled by simply
1234              entering it in the symbol table.  */
1235           if (md_parse_name (name, expressionP))
1236             {
1237               *input_line_pointer = c;
1238               break;
1239             }
1240 #endif
1241
1242 #ifdef TC_I960
1243           /* The MRI i960 assembler permits
1244                  lda sizeof code,g13
1245              FIXME: This should use md_parse_name.  */
1246           if (flag_mri
1247               && (strcasecmp (name, "sizeof") == 0
1248                   || strcasecmp (name, "startof") == 0))
1249             {
1250               int start;
1251               char *buf;
1252
1253               start = (name[1] == 't'
1254                        || name[1] == 'T');
1255
1256               *input_line_pointer = c;
1257               SKIP_WHITESPACE ();
1258
1259               name = input_line_pointer;
1260               c = get_symbol_end ();
1261
1262               buf = (char *) xmalloc (strlen (name) + 10);
1263               if (start)
1264                 sprintf (buf, ".startof.%s", name);
1265               else
1266                 sprintf (buf, ".sizeof.%s", name);
1267               symbolP = symbol_make (buf);
1268               free (buf);
1269
1270               expressionP->X_op = O_symbol;
1271               expressionP->X_add_symbol = symbolP;
1272               expressionP->X_add_number = 0;
1273
1274               *input_line_pointer = c;
1275               SKIP_WHITESPACE ();
1276
1277               break;
1278             }         
1279 #endif
1280
1281           symbolP = symbol_find_or_make (name);
1282
1283           /* If we have an absolute symbol or a reg, then we know its
1284              value now.  */
1285           segment = S_GET_SEGMENT (symbolP);
1286           if (segment == absolute_section)
1287             {
1288               expressionP->X_op = O_constant;
1289               expressionP->X_add_number = S_GET_VALUE (symbolP);
1290             }
1291           else if (segment == reg_section)
1292             {
1293               expressionP->X_op = O_register;
1294               expressionP->X_add_number = S_GET_VALUE (symbolP);
1295             }
1296           else
1297             {
1298               expressionP->X_op = O_symbol;
1299               expressionP->X_add_symbol = symbolP;
1300               expressionP->X_add_number = 0;
1301             }
1302           *input_line_pointer = c;
1303         }
1304       else
1305         {
1306           /* Let the target try to parse it.  Success is indicated by changing
1307              the X_op field to something other than O_absent and pointing
1308              input_line_pointer passed the expression.  If it can't parse the
1309              expression, X_op and input_line_pointer should be unchanged.  */
1310           expressionP->X_op = O_absent;
1311           --input_line_pointer;
1312           md_operand (expressionP);
1313           if (expressionP->X_op == O_absent)
1314             {
1315               ++input_line_pointer;
1316               as_bad (_("Bad expression"));
1317               expressionP->X_op = O_constant;
1318               expressionP->X_add_number = 0;
1319             }
1320         }
1321       break;
1322     }
1323
1324   /*
1325    * It is more 'efficient' to clean up the expressionS when they are created.
1326    * Doing it here saves lines of code.
1327    */
1328   clean_up_expression (expressionP);
1329   SKIP_WHITESPACE ();           /*->1st char after operand. */
1330   know (*input_line_pointer != ' ');
1331
1332   /* The PA port needs this information.  */
1333   if (expressionP->X_add_symbol)
1334     symbol_mark_used (expressionP->X_add_symbol);
1335
1336   switch (expressionP->X_op)
1337     {
1338     default:
1339       return absolute_section;
1340     case O_symbol:
1341       return S_GET_SEGMENT (expressionP->X_add_symbol);
1342     case O_register:
1343       return reg_section;
1344     }
1345 }                               /* operand() */
1346 \f
1347 /* Internal. Simplify a struct expression for use by expr() */
1348
1349 /*
1350  * In:  address of a expressionS.
1351  *      The X_op field of the expressionS may only take certain values.
1352  *      Elsewise we waste time special-case testing. Sigh. Ditto SEG_ABSENT.
1353  * Out: expressionS may have been modified:
1354  *      'foo-foo' symbol references cancelled to 0,
1355  *              which changes X_op from O_subtract to O_constant.
1356  *      Unused fields zeroed to help expr().
1357  */
1358
1359 static void
1360 clean_up_expression (expressionP)
1361      expressionS *expressionP;
1362 {
1363   switch (expressionP->X_op)
1364     {
1365     case O_illegal:
1366     case O_absent:
1367       expressionP->X_add_number = 0;
1368       /* Fall through.  */
1369     case O_big:
1370     case O_constant:
1371     case O_register:
1372       expressionP->X_add_symbol = NULL;
1373       /* Fall through.  */
1374     case O_symbol:
1375     case O_uminus:
1376     case O_bit_not:
1377       expressionP->X_op_symbol = NULL;
1378       break;
1379     case O_subtract:
1380       if (expressionP->X_op_symbol == expressionP->X_add_symbol
1381           || ((symbol_get_frag (expressionP->X_op_symbol)
1382                == symbol_get_frag (expressionP->X_add_symbol))
1383               && SEG_NORMAL (S_GET_SEGMENT (expressionP->X_add_symbol))
1384               && (S_GET_VALUE (expressionP->X_op_symbol)
1385                   == S_GET_VALUE (expressionP->X_add_symbol))))
1386         {
1387           addressT diff = (S_GET_VALUE (expressionP->X_add_symbol)
1388                            - S_GET_VALUE (expressionP->X_op_symbol));
1389
1390           expressionP->X_op = O_constant;
1391           expressionP->X_add_symbol = NULL;
1392           expressionP->X_op_symbol = NULL;
1393           expressionP->X_add_number += diff;
1394         }
1395       break;
1396     default:
1397       break;
1398     }
1399 }
1400 \f
1401 /* Expression parser. */
1402
1403 /*
1404  * We allow an empty expression, and just assume (absolute,0) silently.
1405  * Unary operators and parenthetical expressions are treated as operands.
1406  * As usual, Q==quantity==operand, O==operator, X==expression mnemonics.
1407  *
1408  * We used to do a aho/ullman shift-reduce parser, but the logic got so
1409  * warped that I flushed it and wrote a recursive-descent parser instead.
1410  * Now things are stable, would anybody like to write a fast parser?
1411  * Most expressions are either register (which does not even reach here)
1412  * or 1 symbol. Then "symbol+constant" and "symbol-symbol" are common.
1413  * So I guess it doesn't really matter how inefficient more complex expressions
1414  * are parsed.
1415  *
1416  * After expr(RANK,resultP) input_line_pointer->operator of rank <= RANK.
1417  * Also, we have consumed any leading or trailing spaces (operand does that)
1418  * and done all intervening operators.
1419  *
1420  * This returns the segment of the result, which will be
1421  * absolute_section or the segment of a symbol.
1422  */
1423
1424 #undef __
1425 #define __ O_illegal
1426
1427 static const operatorT op_encoding[256] =
1428 {                               /* maps ASCII->operators */
1429
1430   __, __, __, __, __, __, __, __, __, __, __, __, __, __, __, __,
1431   __, __, __, __, __, __, __, __, __, __, __, __, __, __, __, __,
1432
1433   __, O_bit_or_not, __, __, __, O_modulus, O_bit_and, __,
1434   __, __, O_multiply, O_add, __, O_subtract, __, O_divide,
1435   __, __, __, __, __, __, __, __,
1436   __, __, __, __, O_lt, __, O_gt, __,
1437   __, __, __, __, __, __, __, __,
1438   __, __, __, __, __, __, __, __,
1439   __, __, __, __, __, __, __, __,
1440   __, __, __,
1441 #ifdef NEED_INDEX_OPERATOR
1442   O_index,
1443 #else
1444   __,
1445 #endif
1446   __, __, O_bit_exclusive_or, __,
1447   __, __, __, __, __, __, __, __,
1448   __, __, __, __, __, __, __, __,
1449   __, __, __, __, __, __, __, __,
1450   __, __, __, __, O_bit_inclusive_or, __, __, __,
1451
1452   __, __, __, __, __, __, __, __, __, __, __, __, __, __, __, __,
1453   __, __, __, __, __, __, __, __, __, __, __, __, __, __, __, __,
1454   __, __, __, __, __, __, __, __, __, __, __, __, __, __, __, __,
1455   __, __, __, __, __, __, __, __, __, __, __, __, __, __, __, __,
1456   __, __, __, __, __, __, __, __, __, __, __, __, __, __, __, __,
1457   __, __, __, __, __, __, __, __, __, __, __, __, __, __, __, __,
1458   __, __, __, __, __, __, __, __, __, __, __, __, __, __, __, __,
1459   __, __, __, __, __, __, __, __, __, __, __, __, __, __, __, __
1460 };
1461
1462
1463 /*
1464  *      Rank    Examples
1465  *      0       operand, (expression)
1466  *      1       ||
1467  *      2       &&
1468  *      3       = <> < <= >= >
1469  *      4       + -
1470  *      5       used for * / % in MRI mode
1471  *      6       & ^ ! |
1472  *      7       * / % << >>
1473  *      8       unary - unary ~
1474  */
1475 static operator_rankT op_rank[] =
1476 {
1477   0,    /* O_illegal */
1478   0,    /* O_absent */
1479   0,    /* O_constant */
1480   0,    /* O_symbol */
1481   0,    /* O_symbol_rva */
1482   0,    /* O_register */
1483   0,    /* O_bit */
1484   9,    /* O_uminus */
1485   9,    /* O_bit_not */
1486   9,    /* O_logical_not */
1487   8,    /* O_multiply */
1488   8,    /* O_divide */
1489   8,    /* O_modulus */
1490   8,    /* O_left_shift */
1491   8,    /* O_right_shift */
1492   7,    /* O_bit_inclusive_or */
1493   7,    /* O_bit_or_not */
1494   7,    /* O_bit_exclusive_or */
1495   7,    /* O_bit_and */
1496   5,    /* O_add */
1497   5,    /* O_subtract */
1498   4,    /* O_eq */
1499   4,    /* O_ne */
1500   4,    /* O_lt */
1501   4,    /* O_le */
1502   4,    /* O_ge */
1503   4,    /* O_gt */
1504   3,    /* O_logical_and */
1505   2,    /* O_logical_or */
1506   1,    /* O_index */
1507   0,    /* O_md1 */
1508   0,    /* O_md2 */
1509   0,    /* O_md3 */
1510   0,    /* O_md4 */
1511   0,    /* O_md5 */
1512   0,    /* O_md6 */
1513   0,    /* O_md7 */
1514   0,    /* O_md8 */
1515   0,    /* O_md9 */
1516   0,    /* O_md10 */
1517   0,    /* O_md11 */
1518   0,    /* O_md12 */
1519   0,    /* O_md13 */
1520   0,    /* O_md14 */
1521   0,    /* O_md15 */
1522   0,    /* O_md16 */
1523 };
1524
1525 /* Unfortunately, in MRI mode for the m68k, multiplication and
1526    division have lower precedence than the bit wise operators.  This
1527    function sets the operator precedences correctly for the current
1528    mode.  Also, MRI uses a different bit_not operator, and this fixes
1529    that as well.  */
1530
1531 #define STANDARD_MUL_PRECEDENCE (7)
1532 #define MRI_MUL_PRECEDENCE (5)
1533
1534 void
1535 expr_set_precedence ()
1536 {
1537   if (flag_m68k_mri)
1538     {
1539       op_rank[O_multiply] = MRI_MUL_PRECEDENCE;
1540       op_rank[O_divide] = MRI_MUL_PRECEDENCE;
1541       op_rank[O_modulus] = MRI_MUL_PRECEDENCE;
1542     }
1543   else
1544     {
1545       op_rank[O_multiply] = STANDARD_MUL_PRECEDENCE;
1546       op_rank[O_divide] = STANDARD_MUL_PRECEDENCE;
1547       op_rank[O_modulus] = STANDARD_MUL_PRECEDENCE;
1548     }
1549 }
1550
1551 /* Initialize the expression parser.  */
1552
1553 void
1554 expr_begin ()
1555 {
1556   expr_set_precedence ();
1557
1558   /* Verify that X_op field is wide enough.  */
1559   {
1560     expressionS e;
1561     e.X_op = O_max;
1562     assert (e.X_op == O_max);
1563   }
1564 }
1565 \f
1566 /* Return the encoding for the operator at INPUT_LINE_POINTER.
1567    Advance INPUT_LINE_POINTER to the last character in the operator
1568    (i.e., don't change it for a single character operator).  */
1569
1570 static inline operatorT
1571 operator ()
1572 {
1573   int c;
1574   operatorT ret;
1575
1576   c = *input_line_pointer & 0xff;
1577
1578   if (is_end_of_line[c])
1579     return O_illegal;
1580
1581   switch (c)
1582     {
1583     default:
1584       return op_encoding[c];
1585
1586     case '<':
1587       switch (input_line_pointer[1])
1588         {
1589         default:
1590           return op_encoding[c];
1591         case '<':
1592           ret = O_left_shift;
1593           break;
1594         case '>':
1595           ret = O_ne;
1596           break;
1597         case '=':
1598           ret = O_le;
1599           break;
1600         }
1601       ++input_line_pointer;
1602       return ret;
1603
1604     case '=':
1605       if (input_line_pointer[1] != '=')
1606         return op_encoding[c];
1607
1608       ++input_line_pointer;
1609       return O_eq;
1610
1611     case '>':
1612       switch (input_line_pointer[1])
1613         {
1614         default:
1615           return op_encoding[c];
1616         case '>':
1617           ret = O_right_shift;
1618           break;
1619         case '=':
1620           ret = O_ge;
1621           break;
1622         }
1623       ++input_line_pointer;
1624       return ret;
1625
1626     case '!':
1627       /* We accept !! as equivalent to ^ for MRI compatibility.  */
1628       if (input_line_pointer[1] != '!')
1629         {
1630           if (flag_m68k_mri)
1631             return O_bit_inclusive_or;
1632           return op_encoding[c];
1633         }
1634       ++input_line_pointer;
1635       return O_bit_exclusive_or;
1636
1637     case '|':
1638       if (input_line_pointer[1] != '|')
1639         return op_encoding[c];
1640
1641       ++input_line_pointer;
1642       return O_logical_or;
1643
1644     case '&':
1645       if (input_line_pointer[1] != '&')
1646         return op_encoding[c];
1647
1648       ++input_line_pointer;
1649       return O_logical_and;
1650     }
1651
1652   /*NOTREACHED*/
1653 }
1654
1655 /* Parse an expression.  */
1656
1657 segT
1658 expr (rankarg, resultP)
1659      int rankarg;       /* Larger # is higher rank. */
1660      expressionS *resultP;      /* Deliver result here. */
1661 {
1662   operator_rankT rank = (operator_rankT) rankarg;
1663   segT retval;
1664   expressionS right;
1665   operatorT op_left;
1666   operatorT op_right;
1667
1668   know (rank >= 0);
1669
1670   retval = operand (resultP);
1671
1672   know (*input_line_pointer != ' ');    /* Operand() gobbles spaces. */
1673
1674   op_left = operator ();
1675   while (op_left != O_illegal && op_rank[(int) op_left] > rank)
1676     {
1677       segT rightseg;
1678
1679       input_line_pointer++;     /*->after 1st character of operator. */
1680
1681       rightseg = expr (op_rank[(int) op_left], &right);
1682       if (right.X_op == O_absent)
1683         {
1684           as_warn (_("missing operand; zero assumed"));
1685           right.X_op = O_constant;
1686           right.X_add_number = 0;
1687           right.X_add_symbol = NULL;
1688           right.X_op_symbol = NULL;
1689         }
1690
1691       know (*input_line_pointer != ' ');
1692
1693       if (op_left == O_index)
1694         {
1695           if (*input_line_pointer != ']')
1696             as_bad ("missing right bracket");
1697           else
1698             {
1699               ++input_line_pointer;
1700               SKIP_WHITESPACE ();
1701             }
1702         }
1703
1704       if (retval == undefined_section)
1705         {
1706           if (SEG_NORMAL (rightseg))
1707             retval = rightseg;
1708         }
1709       else if (! SEG_NORMAL (retval))
1710         retval = rightseg;
1711       else if (SEG_NORMAL (rightseg)
1712                && retval != rightseg
1713 #ifdef DIFF_EXPR_OK
1714                && op_left != O_subtract
1715 #endif
1716                )
1717         as_bad (_("operation combines symbols in different segments"));
1718
1719       op_right = operator ();
1720
1721       know (op_right == O_illegal || op_rank[(int) op_right] <= op_rank[(int) op_left]);
1722       know ((int) op_left >= (int) O_multiply
1723             && (int) op_left <= (int) O_logical_or);
1724
1725       /* input_line_pointer->after right-hand quantity. */
1726       /* left-hand quantity in resultP */
1727       /* right-hand quantity in right. */
1728       /* operator in op_left. */
1729
1730       if (resultP->X_op == O_big)
1731         {
1732           if (resultP->X_add_number > 0)
1733             as_warn (_("left operand is a bignum; integer 0 assumed"));
1734           else
1735             as_warn (_("left operand is a float; integer 0 assumed"));
1736           resultP->X_op = O_constant;
1737           resultP->X_add_number = 0;
1738           resultP->X_add_symbol = NULL;
1739           resultP->X_op_symbol = NULL;
1740         }
1741       if (right.X_op == O_big)
1742         {
1743           if (right.X_add_number > 0)
1744             as_warn (_("right operand is a bignum; integer 0 assumed"));
1745           else
1746             as_warn (_("right operand is a float; integer 0 assumed"));
1747           right.X_op = O_constant;
1748           right.X_add_number = 0;
1749           right.X_add_symbol = NULL;
1750           right.X_op_symbol = NULL;
1751         }
1752
1753       /* Optimize common cases.  */
1754 #ifdef md_optimize_expr
1755       if (md_optimize_expr (resultP, op_left, &right))
1756         {
1757           /* skip */;
1758         }
1759       else
1760 #endif
1761       if (op_left == O_add && right.X_op == O_constant)
1762         {
1763           /* X + constant.  */
1764           resultP->X_add_number += right.X_add_number;
1765         }
1766       /* This case comes up in PIC code.  */
1767       else if (op_left == O_subtract
1768                && right.X_op == O_symbol
1769                && resultP->X_op == O_symbol
1770                && (symbol_get_frag (right.X_add_symbol)
1771                    == symbol_get_frag (resultP->X_add_symbol))
1772                && SEG_NORMAL (S_GET_SEGMENT (right.X_add_symbol)))
1773
1774         {
1775           resultP->X_add_number -= right.X_add_number;
1776           resultP->X_add_number += (S_GET_VALUE (resultP->X_add_symbol)
1777                                     - S_GET_VALUE (right.X_add_symbol));
1778           resultP->X_op = O_constant;
1779           resultP->X_add_symbol = 0;
1780         }
1781       else if (op_left == O_subtract && right.X_op == O_constant)
1782         {
1783           /* X - constant.  */
1784           resultP->X_add_number -= right.X_add_number;
1785         }
1786       else if (op_left == O_add && resultP->X_op == O_constant)
1787         {
1788           /* Constant + X.  */
1789           resultP->X_op = right.X_op;
1790           resultP->X_add_symbol = right.X_add_symbol;
1791           resultP->X_op_symbol = right.X_op_symbol;
1792           resultP->X_add_number += right.X_add_number;
1793           retval = rightseg;
1794         }
1795       else if (resultP->X_op == O_constant && right.X_op == O_constant)
1796         {
1797           /* Constant OP constant.  */
1798           offsetT v = right.X_add_number;
1799           if (v == 0 && (op_left == O_divide || op_left == O_modulus))
1800             {
1801               as_warn (_("division by zero"));
1802               v = 1;
1803             }
1804           switch (op_left)
1805             {
1806             default:                    abort ();
1807             case O_multiply:            resultP->X_add_number *= v; break;
1808             case O_divide:              resultP->X_add_number /= v; break;
1809             case O_modulus:             resultP->X_add_number %= v; break;
1810             case O_left_shift:          resultP->X_add_number <<= v; break;
1811             case O_right_shift:
1812               /* We always use unsigned shifts, to avoid relying on
1813                  characteristics of the compiler used to compile gas.  */
1814               resultP->X_add_number =
1815                 (offsetT) ((valueT) resultP->X_add_number >> (valueT) v);
1816               break;
1817             case O_bit_inclusive_or:    resultP->X_add_number |= v; break;
1818             case O_bit_or_not:          resultP->X_add_number |= ~v; break;
1819             case O_bit_exclusive_or:    resultP->X_add_number ^= v; break;
1820             case O_bit_and:             resultP->X_add_number &= v; break;
1821             case O_add:                 resultP->X_add_number += v; break;
1822             case O_subtract:            resultP->X_add_number -= v; break;
1823             case O_eq:
1824               resultP->X_add_number =
1825                 resultP->X_add_number == v ? ~ (offsetT) 0 : 0;
1826               break;
1827             case O_ne:
1828               resultP->X_add_number =
1829                 resultP->X_add_number != v ? ~ (offsetT) 0 : 0;
1830               break;
1831             case O_lt:
1832               resultP->X_add_number =
1833                 resultP->X_add_number <  v ? ~ (offsetT) 0 : 0;
1834               break;
1835             case O_le:
1836               resultP->X_add_number =
1837                 resultP->X_add_number <= v ? ~ (offsetT) 0 : 0;
1838               break;
1839             case O_ge:
1840               resultP->X_add_number =
1841                 resultP->X_add_number >= v ? ~ (offsetT) 0 : 0;
1842               break;
1843             case O_gt:
1844               resultP->X_add_number =
1845                 resultP->X_add_number >  v ? ~ (offsetT) 0 : 0;
1846               break;
1847             case O_logical_and:
1848               resultP->X_add_number = resultP->X_add_number && v;
1849               break;
1850             case O_logical_or:
1851               resultP->X_add_number = resultP->X_add_number || v;
1852               break;
1853             }
1854         }
1855       else if (resultP->X_op == O_symbol
1856                && right.X_op == O_symbol
1857                && (op_left == O_add
1858                    || op_left == O_subtract
1859                    || (resultP->X_add_number == 0
1860                        && right.X_add_number == 0)))
1861         {
1862           /* Symbol OP symbol.  */
1863           resultP->X_op = op_left;
1864           resultP->X_op_symbol = right.X_add_symbol;
1865           if (op_left == O_add)
1866             resultP->X_add_number += right.X_add_number;
1867           else if (op_left == O_subtract)
1868             resultP->X_add_number -= right.X_add_number;
1869         }
1870       else
1871         {
1872           /* The general case.  */
1873           resultP->X_add_symbol = make_expr_symbol (resultP);
1874           resultP->X_op_symbol = make_expr_symbol (&right);
1875           resultP->X_op = op_left;
1876           resultP->X_add_number = 0;
1877           resultP->X_unsigned = 1;
1878         }
1879
1880       op_left = op_right;
1881     }                           /* While next operator is >= this rank. */
1882
1883   /* The PA port needs this information.  */
1884   if (resultP->X_add_symbol)
1885     symbol_mark_used (resultP->X_add_symbol);
1886
1887   return resultP->X_op == O_constant ? absolute_section : retval;
1888 }
1889 \f
1890 /*
1891  *                      get_symbol_end()
1892  *
1893  * This lives here because it belongs equally in expr.c & read.c.
1894  * Expr.c is just a branch office read.c anyway, and putting it
1895  * here lessens the crowd at read.c.
1896  *
1897  * Assume input_line_pointer is at start of symbol name.
1898  * Advance input_line_pointer past symbol name.
1899  * Turn that character into a '\0', returning its former value.
1900  * This allows a string compare (RMS wants symbol names to be strings)
1901  * of the symbol name.
1902  * There will always be a char following symbol name, because all good
1903  * lines end in end-of-line.
1904  */
1905 char
1906 get_symbol_end ()
1907 {
1908   char c;
1909
1910   /* We accept \001 in a name in case this is being called with a
1911      constructed string.  */
1912   if (is_name_beginner (c = *input_line_pointer++) || c == '\001')
1913     {
1914       while (is_part_of_name (c = *input_line_pointer++)
1915              || c == '\001')
1916         ;
1917       if (is_name_ender (c))
1918         c = *input_line_pointer++;
1919     }
1920   *--input_line_pointer = 0;
1921   return (c);
1922 }
1923
1924
1925 unsigned int
1926 get_single_number ()
1927 {
1928   expressionS exp;
1929   operand (&exp);
1930   return exp.X_add_number;
1931
1932 }
1933
1934 /* end of expr.c */