Add AMD SSE5 support
[platform/upstream/binutils.git] / gas / config / tc-i386.c
1 /* tc-i386.c -- Assemble code for the Intel 80386
2    Copyright 1989, 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
3    2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007
4    Free Software Foundation, Inc.
5
6    This file is part of GAS, the GNU Assembler.
7
8    GAS is free software; you can redistribute it and/or modify
9    it under the terms of the GNU General Public License as published by
10    the Free Software Foundation; either version 3, or (at your option)
11    any later version.
12
13    GAS is distributed in the hope that it will be useful,
14    but WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16    GNU General Public License for more details.
17
18    You should have received a copy of the GNU General Public License
19    along with GAS; see the file COPYING.  If not, write to the Free
20    Software Foundation, 51 Franklin Street - Fifth Floor, Boston, MA
21    02110-1301, USA.  */
22
23 /* Intel 80386 machine specific gas.
24    Written by Eliot Dresselhaus (eliot@mgm.mit.edu).
25    x86_64 support by Jan Hubicka (jh@suse.cz)
26    VIA PadLock support by Michal Ludvig (mludvig@suse.cz)
27    Bugs & suggestions are completely welcome.  This is free software.
28    Please help us make it better.  */
29
30 #include "as.h"
31 #include "safe-ctype.h"
32 #include "subsegs.h"
33 #include "dwarf2dbg.h"
34 #include "dw2gencfi.h"
35 #include "elf/x86-64.h"
36 #include "opcodes/i386-init.h"
37
38 #ifndef REGISTER_WARNINGS
39 #define REGISTER_WARNINGS 1
40 #endif
41
42 #ifndef INFER_ADDR_PREFIX
43 #define INFER_ADDR_PREFIX 1
44 #endif
45
46 #ifndef SCALE1_WHEN_NO_INDEX
47 /* Specifying a scale factor besides 1 when there is no index is
48    futile.  eg. `mov (%ebx,2),%al' does exactly the same as
49    `mov (%ebx),%al'.  To slavishly follow what the programmer
50    specified, set SCALE1_WHEN_NO_INDEX to 0.  */
51 #define SCALE1_WHEN_NO_INDEX 1
52 #endif
53
54 #ifndef DEFAULT_ARCH
55 #define DEFAULT_ARCH "i386"
56 #endif
57
58 #ifndef INLINE
59 #if __GNUC__ >= 2
60 #define INLINE __inline__
61 #else
62 #define INLINE
63 #endif
64 #endif
65
66 static void set_code_flag (int);
67 static void set_16bit_gcc_code_flag (int);
68 static void set_intel_syntax (int);
69 static void set_cpu_arch (int);
70 #ifdef TE_PE
71 static void pe_directive_secrel (int);
72 #endif
73 static void signed_cons (int);
74 static char *output_invalid (int c);
75 static int i386_operand (char *);
76 static int i386_intel_operand (char *, int);
77 static const reg_entry *parse_register (char *, char **);
78 static char *parse_insn (char *, char *);
79 static char *parse_operands (char *, const char *);
80 static void swap_operands (void);
81 static void swap_2_operands (int, int);
82 static void optimize_imm (void);
83 static void optimize_disp (void);
84 static int match_template (void);
85 static int check_string (void);
86 static int process_suffix (void);
87 static int check_byte_reg (void);
88 static int check_long_reg (void);
89 static int check_qword_reg (void);
90 static int check_word_reg (void);
91 static int finalize_imm (void);
92 static void process_drex (void);
93 static int process_operands (void);
94 static const seg_entry *build_modrm_byte (void);
95 static void output_insn (void);
96 static void output_imm (fragS *, offsetT);
97 static void output_disp (fragS *, offsetT);
98 #ifndef I386COFF
99 static void s_bss (int);
100 #endif
101 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
102 static void handle_large_common (int small ATTRIBUTE_UNUSED);
103 #endif
104
105 static const char *default_arch = DEFAULT_ARCH;
106
107 /* 'md_assemble ()' gathers together information and puts it into a
108    i386_insn.  */
109
110 union i386_op
111   {
112     expressionS *disps;
113     expressionS *imms;
114     const reg_entry *regs;
115   };
116
117 struct _i386_insn
118   {
119     /* TM holds the template for the insn were currently assembling.  */
120     template tm;
121
122     /* SUFFIX holds the instruction mnemonic suffix if given.
123        (e.g. 'l' for 'movl')  */
124     char suffix;
125
126     /* OPERANDS gives the number of given operands.  */
127     unsigned int operands;
128
129     /* REG_OPERANDS, DISP_OPERANDS, MEM_OPERANDS, IMM_OPERANDS give the number
130        of given register, displacement, memory operands and immediate
131        operands.  */
132     unsigned int reg_operands, disp_operands, mem_operands, imm_operands;
133
134     /* TYPES [i] is the type (see above #defines) which tells us how to
135        use OP[i] for the corresponding operand.  */
136     i386_operand_type types[MAX_OPERANDS];
137
138     /* Displacement expression, immediate expression, or register for each
139        operand.  */
140     union i386_op op[MAX_OPERANDS];
141
142     /* Flags for operands.  */
143     unsigned int flags[MAX_OPERANDS];
144 #define Operand_PCrel 1
145
146     /* Relocation type for operand */
147     enum bfd_reloc_code_real reloc[MAX_OPERANDS];
148
149     /* BASE_REG, INDEX_REG, and LOG2_SCALE_FACTOR are used to encode
150        the base index byte below.  */
151     const reg_entry *base_reg;
152     const reg_entry *index_reg;
153     unsigned int log2_scale_factor;
154
155     /* SEG gives the seg_entries of this insn.  They are zero unless
156        explicit segment overrides are given.  */
157     const seg_entry *seg[2];
158
159     /* PREFIX holds all the given prefix opcodes (usually null).
160        PREFIXES is the number of prefix opcodes.  */
161     unsigned int prefixes;
162     unsigned char prefix[MAX_PREFIXES];
163
164     /* RM and SIB are the modrm byte and the sib byte where the
165        addressing modes of this insn are encoded.  DREX is the byte
166        added by the SSE5 instructions.  */
167
168     modrm_byte rm;
169     rex_byte rex;
170     sib_byte sib;
171     drex_byte drex;
172   };
173
174 typedef struct _i386_insn i386_insn;
175
176 /* List of chars besides those in app.c:symbol_chars that can start an
177    operand.  Used to prevent the scrubber eating vital white-space.  */
178 const char extra_symbol_chars[] = "*%-(["
179 #ifdef LEX_AT
180         "@"
181 #endif
182 #ifdef LEX_QM
183         "?"
184 #endif
185         ;
186
187 #if (defined (TE_I386AIX)                               \
188      || ((defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)) \
189          && !defined (TE_GNU)                           \
190          && !defined (TE_LINUX)                         \
191          && !defined (TE_NETWARE)                       \
192          && !defined (TE_FreeBSD)                       \
193          && !defined (TE_NetBSD)))
194 /* This array holds the chars that always start a comment.  If the
195    pre-processor is disabled, these aren't very useful.  The option
196    --divide will remove '/' from this list.  */
197 const char *i386_comment_chars = "#/";
198 #define SVR4_COMMENT_CHARS 1
199 #define PREFIX_SEPARATOR '\\'
200
201 #else
202 const char *i386_comment_chars = "#";
203 #define PREFIX_SEPARATOR '/'
204 #endif
205
206 /* This array holds the chars that only start a comment at the beginning of
207    a line.  If the line seems to have the form '# 123 filename'
208    .line and .file directives will appear in the pre-processed output.
209    Note that input_file.c hand checks for '#' at the beginning of the
210    first line of the input file.  This is because the compiler outputs
211    #NO_APP at the beginning of its output.
212    Also note that comments started like this one will always work if
213    '/' isn't otherwise defined.  */
214 const char line_comment_chars[] = "#/";
215
216 const char line_separator_chars[] = ";";
217
218 /* Chars that can be used to separate mant from exp in floating point
219    nums.  */
220 const char EXP_CHARS[] = "eE";
221
222 /* Chars that mean this number is a floating point constant
223    As in 0f12.456
224    or    0d1.2345e12.  */
225 const char FLT_CHARS[] = "fFdDxX";
226
227 /* Tables for lexical analysis.  */
228 static char mnemonic_chars[256];
229 static char register_chars[256];
230 static char operand_chars[256];
231 static char identifier_chars[256];
232 static char digit_chars[256];
233
234 /* Lexical macros.  */
235 #define is_mnemonic_char(x) (mnemonic_chars[(unsigned char) x])
236 #define is_operand_char(x) (operand_chars[(unsigned char) x])
237 #define is_register_char(x) (register_chars[(unsigned char) x])
238 #define is_space_char(x) ((x) == ' ')
239 #define is_identifier_char(x) (identifier_chars[(unsigned char) x])
240 #define is_digit_char(x) (digit_chars[(unsigned char) x])
241
242 /* All non-digit non-letter characters that may occur in an operand.  */
243 static char operand_special_chars[] = "%$-+(,)*._~/<>|&^!:[@]";
244
245 /* md_assemble() always leaves the strings it's passed unaltered.  To
246    effect this we maintain a stack of saved characters that we've smashed
247    with '\0's (indicating end of strings for various sub-fields of the
248    assembler instruction).  */
249 static char save_stack[32];
250 static char *save_stack_p;
251 #define END_STRING_AND_SAVE(s) \
252         do { *save_stack_p++ = *(s); *(s) = '\0'; } while (0)
253 #define RESTORE_END_STRING(s) \
254         do { *(s) = *--save_stack_p; } while (0)
255
256 /* The instruction we're assembling.  */
257 static i386_insn i;
258
259 /* Possible templates for current insn.  */
260 static const templates *current_templates;
261
262 /* Per instruction expressionS buffers: max displacements & immediates.  */
263 static expressionS disp_expressions[MAX_MEMORY_OPERANDS];
264 static expressionS im_expressions[MAX_IMMEDIATE_OPERANDS];
265
266 /* Current operand we are working on.  */
267 static int this_operand;
268
269 /* We support four different modes.  FLAG_CODE variable is used to distinguish
270    these.  */
271
272 enum flag_code {
273         CODE_32BIT,
274         CODE_16BIT,
275         CODE_64BIT };
276 #define NUM_FLAG_CODE ((int) CODE_64BIT + 1)
277
278 static enum flag_code flag_code;
279 static unsigned int object_64bit;
280 static int use_rela_relocations = 0;
281
282 /* The names used to print error messages.  */
283 static const char *flag_code_names[] =
284   {
285     "32",
286     "16",
287     "64"
288   };
289
290 /* 1 for intel syntax,
291    0 if att syntax.  */
292 static int intel_syntax = 0;
293
294 /* 1 if register prefix % not required.  */
295 static int allow_naked_reg = 0;
296
297 /* Register prefix used for error message.  */
298 static const char *register_prefix = "%";
299
300 /* Used in 16 bit gcc mode to add an l suffix to call, ret, enter,
301    leave, push, and pop instructions so that gcc has the same stack
302    frame as in 32 bit mode.  */
303 static char stackop_size = '\0';
304
305 /* Non-zero to optimize code alignment.  */
306 int optimize_align_code = 1;
307
308 /* Non-zero to quieten some warnings.  */
309 static int quiet_warnings = 0;
310
311 /* CPU name.  */
312 static const char *cpu_arch_name = NULL;
313 static const char *cpu_sub_arch_name = NULL;
314
315 /* CPU feature flags.  */
316 static i386_cpu_flags cpu_arch_flags = CPU_UNKNOWN_FLAGS;
317
318 /* Bitwise NOT of cpu_arch_flags.  */
319 static i386_cpu_flags cpu_arch_flags_not;
320
321 /* If we have selected a cpu we are generating instructions for.  */
322 static int cpu_arch_tune_set = 0;
323
324 /* Cpu we are generating instructions for.  */
325 static enum processor_type cpu_arch_tune = PROCESSOR_UNKNOWN;
326
327 /* CPU feature flags of cpu we are generating instructions for.  */
328 static i386_cpu_flags cpu_arch_tune_flags;
329
330 /* CPU instruction set architecture used.  */
331 static enum processor_type cpu_arch_isa = PROCESSOR_UNKNOWN;
332
333 /* CPU feature flags of instruction set architecture used.  */
334 static i386_cpu_flags cpu_arch_isa_flags;
335
336 /* If set, conditional jumps are not automatically promoted to handle
337    larger than a byte offset.  */
338 static unsigned int no_cond_jump_promotion = 0;
339
340 /* Pre-defined "_GLOBAL_OFFSET_TABLE_".  */
341 static symbolS *GOT_symbol;
342
343 /* The dwarf2 return column, adjusted for 32 or 64 bit.  */
344 unsigned int x86_dwarf2_return_column;
345
346 /* The dwarf2 data alignment, adjusted for 32 or 64 bit.  */
347 int x86_cie_data_alignment;
348
349 /* Interface to relax_segment.
350    There are 3 major relax states for 386 jump insns because the
351    different types of jumps add different sizes to frags when we're
352    figuring out what sort of jump to choose to reach a given label.  */
353
354 /* Types.  */
355 #define UNCOND_JUMP 0
356 #define COND_JUMP 1
357 #define COND_JUMP86 2
358
359 /* Sizes.  */
360 #define CODE16  1
361 #define SMALL   0
362 #define SMALL16 (SMALL | CODE16)
363 #define BIG     2
364 #define BIG16   (BIG | CODE16)
365
366 #ifndef INLINE
367 #ifdef __GNUC__
368 #define INLINE __inline__
369 #else
370 #define INLINE
371 #endif
372 #endif
373
374 #define ENCODE_RELAX_STATE(type, size) \
375   ((relax_substateT) (((type) << 2) | (size)))
376 #define TYPE_FROM_RELAX_STATE(s) \
377   ((s) >> 2)
378 #define DISP_SIZE_FROM_RELAX_STATE(s) \
379     ((((s) & 3) == BIG ? 4 : (((s) & 3) == BIG16 ? 2 : 1)))
380
381 /* This table is used by relax_frag to promote short jumps to long
382    ones where necessary.  SMALL (short) jumps may be promoted to BIG
383    (32 bit long) ones, and SMALL16 jumps to BIG16 (16 bit long).  We
384    don't allow a short jump in a 32 bit code segment to be promoted to
385    a 16 bit offset jump because it's slower (requires data size
386    prefix), and doesn't work, unless the destination is in the bottom
387    64k of the code segment (The top 16 bits of eip are zeroed).  */
388
389 const relax_typeS md_relax_table[] =
390 {
391   /* The fields are:
392      1) most positive reach of this state,
393      2) most negative reach of this state,
394      3) how many bytes this mode will have in the variable part of the frag
395      4) which index into the table to try if we can't fit into this one.  */
396
397   /* UNCOND_JUMP states.  */
398   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (UNCOND_JUMP, BIG)},
399   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (UNCOND_JUMP, BIG16)},
400   /* dword jmp adds 4 bytes to frag:
401      0 extra opcode bytes, 4 displacement bytes.  */
402   {0, 0, 4, 0},
403   /* word jmp adds 2 byte2 to frag:
404      0 extra opcode bytes, 2 displacement bytes.  */
405   {0, 0, 2, 0},
406
407   /* COND_JUMP states.  */
408   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (COND_JUMP, BIG)},
409   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (COND_JUMP, BIG16)},
410   /* dword conditionals adds 5 bytes to frag:
411      1 extra opcode byte, 4 displacement bytes.  */
412   {0, 0, 5, 0},
413   /* word conditionals add 3 bytes to frag:
414      1 extra opcode byte, 2 displacement bytes.  */
415   {0, 0, 3, 0},
416
417   /* COND_JUMP86 states.  */
418   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (COND_JUMP86, BIG)},
419   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (COND_JUMP86, BIG16)},
420   /* dword conditionals adds 5 bytes to frag:
421      1 extra opcode byte, 4 displacement bytes.  */
422   {0, 0, 5, 0},
423   /* word conditionals add 4 bytes to frag:
424      1 displacement byte and a 3 byte long branch insn.  */
425   {0, 0, 4, 0}
426 };
427
428 static const arch_entry cpu_arch[] =
429 {
430   {"generic32", PROCESSOR_GENERIC32,
431    CPU_GENERIC32_FLAGS },
432   {"generic64", PROCESSOR_GENERIC64,
433    CPU_GENERIC64_FLAGS },
434   {"i8086", PROCESSOR_UNKNOWN,
435    CPU_NONE_FLAGS },
436   {"i186", PROCESSOR_UNKNOWN,
437    CPU_I186_FLAGS },
438   {"i286", PROCESSOR_UNKNOWN,
439    CPU_I286_FLAGS },
440   {"i386", PROCESSOR_I386,
441    CPU_I386_FLAGS },
442   {"i486", PROCESSOR_I486,
443    CPU_I486_FLAGS },
444   {"i586", PROCESSOR_PENTIUM,
445    CPU_I586_FLAGS },
446   {"i686", PROCESSOR_PENTIUMPRO,
447    CPU_I686_FLAGS },
448   {"pentium", PROCESSOR_PENTIUM,
449    CPU_I586_FLAGS },
450   {"pentiumpro",PROCESSOR_PENTIUMPRO,
451    CPU_I686_FLAGS },
452   {"pentiumii", PROCESSOR_PENTIUMPRO,
453    CPU_P2_FLAGS },
454   {"pentiumiii",PROCESSOR_PENTIUMPRO,
455    CPU_P3_FLAGS },
456   {"pentium4", PROCESSOR_PENTIUM4,
457    CPU_P4_FLAGS },
458   {"prescott", PROCESSOR_NOCONA,
459    CPU_CORE_FLAGS },
460   {"nocona", PROCESSOR_NOCONA,
461    CPU_NOCONA_FLAGS },
462   {"yonah", PROCESSOR_CORE,
463    CPU_CORE_FLAGS },
464   {"core", PROCESSOR_CORE,
465    CPU_CORE_FLAGS },
466   {"merom", PROCESSOR_CORE2,
467    CPU_CORE2_FLAGS },
468   {"core2", PROCESSOR_CORE2,
469    CPU_CORE2_FLAGS },
470   {"k6", PROCESSOR_K6,
471    CPU_K6_FLAGS },
472   {"k6_2", PROCESSOR_K6,
473    CPU_K6_2_FLAGS },
474   {"athlon", PROCESSOR_ATHLON,
475    CPU_ATHLON_FLAGS },
476   {"sledgehammer", PROCESSOR_K8,
477    CPU_K8_FLAGS },
478   {"opteron", PROCESSOR_K8,
479    CPU_K8_FLAGS },
480   {"k8", PROCESSOR_K8,
481    CPU_K8_FLAGS },
482   {"amdfam10", PROCESSOR_AMDFAM10,
483    CPU_AMDFAM10_FLAGS },
484   {".mmx", PROCESSOR_UNKNOWN,
485    CPU_MMX_FLAGS },
486   {".sse", PROCESSOR_UNKNOWN,
487    CPU_SSE_FLAGS },
488   {".sse2", PROCESSOR_UNKNOWN,
489    CPU_SSE2_FLAGS },
490   {".sse3", PROCESSOR_UNKNOWN,
491    CPU_SSE3_FLAGS },
492   {".ssse3", PROCESSOR_UNKNOWN,
493    CPU_SSSE3_FLAGS },
494   {".sse4.1", PROCESSOR_UNKNOWN,
495    CPU_SSE4_1_FLAGS },
496   {".sse4.2", PROCESSOR_UNKNOWN,
497    CPU_SSE4_2_FLAGS },
498   {".sse4", PROCESSOR_UNKNOWN,
499    CPU_SSE4_2_FLAGS },
500   {".3dnow", PROCESSOR_UNKNOWN,
501    CPU_3DNOW_FLAGS },
502   {".3dnowa", PROCESSOR_UNKNOWN,
503    CPU_3DNOWA_FLAGS },
504   {".padlock", PROCESSOR_UNKNOWN,
505    CPU_PADLOCK_FLAGS },
506   {".pacifica", PROCESSOR_UNKNOWN,
507    CPU_SVME_FLAGS },
508   {".svme", PROCESSOR_UNKNOWN,
509    CPU_SVME_FLAGS },
510   {".sse4a", PROCESSOR_UNKNOWN,
511    CPU_SSE4A_FLAGS },
512   {".abm", PROCESSOR_UNKNOWN,
513    CPU_ABM_FLAGS },
514   {".sse5", PROCESSOR_UNKNOWN,
515    CPU_SSE5_FLAGS },
516 };
517
518 const pseudo_typeS md_pseudo_table[] =
519 {
520 #if !defined(OBJ_AOUT) && !defined(USE_ALIGN_PTWO)
521   {"align", s_align_bytes, 0},
522 #else
523   {"align", s_align_ptwo, 0},
524 #endif
525   {"arch", set_cpu_arch, 0},
526 #ifndef I386COFF
527   {"bss", s_bss, 0},
528 #endif
529   {"ffloat", float_cons, 'f'},
530   {"dfloat", float_cons, 'd'},
531   {"tfloat", float_cons, 'x'},
532   {"value", cons, 2},
533   {"slong", signed_cons, 4},
534   {"noopt", s_ignore, 0},
535   {"optim", s_ignore, 0},
536   {"code16gcc", set_16bit_gcc_code_flag, CODE_16BIT},
537   {"code16", set_code_flag, CODE_16BIT},
538   {"code32", set_code_flag, CODE_32BIT},
539   {"code64", set_code_flag, CODE_64BIT},
540   {"intel_syntax", set_intel_syntax, 1},
541   {"att_syntax", set_intel_syntax, 0},
542 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
543   {"largecomm", handle_large_common, 0},
544 #else
545   {"file", (void (*) (int)) dwarf2_directive_file, 0},
546   {"loc", dwarf2_directive_loc, 0},
547   {"loc_mark_labels", dwarf2_directive_loc_mark_labels, 0},
548 #endif
549 #ifdef TE_PE
550   {"secrel32", pe_directive_secrel, 0},
551 #endif
552   {0, 0, 0}
553 };
554
555 /* For interface with expression ().  */
556 extern char *input_line_pointer;
557
558 /* Hash table for instruction mnemonic lookup.  */
559 static struct hash_control *op_hash;
560
561 /* Hash table for register lookup.  */
562 static struct hash_control *reg_hash;
563 \f
564 void
565 i386_align_code (fragS *fragP, int count)
566 {
567   /* Various efficient no-op patterns for aligning code labels.
568      Note: Don't try to assemble the instructions in the comments.
569      0L and 0w are not legal.  */
570   static const char f32_1[] =
571     {0x90};                                     /* nop                  */
572   static const char f32_2[] =
573     {0x66,0x90};                                /* xchg %ax,%ax */
574   static const char f32_3[] =
575     {0x8d,0x76,0x00};                           /* leal 0(%esi),%esi    */
576   static const char f32_4[] =
577     {0x8d,0x74,0x26,0x00};                      /* leal 0(%esi,1),%esi  */
578   static const char f32_5[] =
579     {0x90,                                      /* nop                  */
580      0x8d,0x74,0x26,0x00};                      /* leal 0(%esi,1),%esi  */
581   static const char f32_6[] =
582     {0x8d,0xb6,0x00,0x00,0x00,0x00};            /* leal 0L(%esi),%esi   */
583   static const char f32_7[] =
584     {0x8d,0xb4,0x26,0x00,0x00,0x00,0x00};       /* leal 0L(%esi,1),%esi */
585   static const char f32_8[] =
586     {0x90,                                      /* nop                  */
587      0x8d,0xb4,0x26,0x00,0x00,0x00,0x00};       /* leal 0L(%esi,1),%esi */
588   static const char f32_9[] =
589     {0x89,0xf6,                                 /* movl %esi,%esi       */
590      0x8d,0xbc,0x27,0x00,0x00,0x00,0x00};       /* leal 0L(%edi,1),%edi */
591   static const char f32_10[] =
592     {0x8d,0x76,0x00,                            /* leal 0(%esi),%esi    */
593      0x8d,0xbc,0x27,0x00,0x00,0x00,0x00};       /* leal 0L(%edi,1),%edi */
594   static const char f32_11[] =
595     {0x8d,0x74,0x26,0x00,                       /* leal 0(%esi,1),%esi  */
596      0x8d,0xbc,0x27,0x00,0x00,0x00,0x00};       /* leal 0L(%edi,1),%edi */
597   static const char f32_12[] =
598     {0x8d,0xb6,0x00,0x00,0x00,0x00,             /* leal 0L(%esi),%esi   */
599      0x8d,0xbf,0x00,0x00,0x00,0x00};            /* leal 0L(%edi),%edi   */
600   static const char f32_13[] =
601     {0x8d,0xb6,0x00,0x00,0x00,0x00,             /* leal 0L(%esi),%esi   */
602      0x8d,0xbc,0x27,0x00,0x00,0x00,0x00};       /* leal 0L(%edi,1),%edi */
603   static const char f32_14[] =
604     {0x8d,0xb4,0x26,0x00,0x00,0x00,0x00,        /* leal 0L(%esi,1),%esi */
605      0x8d,0xbc,0x27,0x00,0x00,0x00,0x00};       /* leal 0L(%edi,1),%edi */
606   static const char f16_3[] =
607     {0x8d,0x74,0x00};                           /* lea 0(%esi),%esi     */
608   static const char f16_4[] =
609     {0x8d,0xb4,0x00,0x00};                      /* lea 0w(%si),%si      */
610   static const char f16_5[] =
611     {0x90,                                      /* nop                  */
612      0x8d,0xb4,0x00,0x00};                      /* lea 0w(%si),%si      */
613   static const char f16_6[] =
614     {0x89,0xf6,                                 /* mov %si,%si          */
615      0x8d,0xbd,0x00,0x00};                      /* lea 0w(%di),%di      */
616   static const char f16_7[] =
617     {0x8d,0x74,0x00,                            /* lea 0(%si),%si       */
618      0x8d,0xbd,0x00,0x00};                      /* lea 0w(%di),%di      */
619   static const char f16_8[] =
620     {0x8d,0xb4,0x00,0x00,                       /* lea 0w(%si),%si      */
621      0x8d,0xbd,0x00,0x00};                      /* lea 0w(%di),%di      */
622   static const char jump_31[] =
623     {0xeb,0x1d,0x90,0x90,0x90,0x90,0x90,        /* jmp .+31; lotsa nops */
624      0x90,0x90,0x90,0x90,0x90,0x90,0x90,0x90,
625      0x90,0x90,0x90,0x90,0x90,0x90,0x90,0x90,
626      0x90,0x90,0x90,0x90,0x90,0x90,0x90,0x90};
627   static const char *const f32_patt[] = {
628     f32_1, f32_2, f32_3, f32_4, f32_5, f32_6, f32_7, f32_8,
629     f32_9, f32_10, f32_11, f32_12, f32_13, f32_14
630   };
631   static const char *const f16_patt[] = {
632     f32_1, f32_2, f16_3, f16_4, f16_5, f16_6, f16_7, f16_8
633   };
634   /* nopl (%[re]ax) */
635   static const char alt_3[] =
636     {0x0f,0x1f,0x00};
637   /* nopl 0(%[re]ax) */
638   static const char alt_4[] =
639     {0x0f,0x1f,0x40,0x00};
640   /* nopl 0(%[re]ax,%[re]ax,1) */
641   static const char alt_5[] =
642     {0x0f,0x1f,0x44,0x00,0x00};
643   /* nopw 0(%[re]ax,%[re]ax,1) */
644   static const char alt_6[] =
645     {0x66,0x0f,0x1f,0x44,0x00,0x00};
646   /* nopl 0L(%[re]ax) */
647   static const char alt_7[] =
648     {0x0f,0x1f,0x80,0x00,0x00,0x00,0x00};
649   /* nopl 0L(%[re]ax,%[re]ax,1) */
650   static const char alt_8[] =
651     {0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
652   /* nopw 0L(%[re]ax,%[re]ax,1) */
653   static const char alt_9[] =
654     {0x66,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
655   /* nopw %cs:0L(%[re]ax,%[re]ax,1) */
656   static const char alt_10[] =
657     {0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
658   /* data16
659      nopw %cs:0L(%[re]ax,%[re]ax,1) */
660   static const char alt_long_11[] =
661     {0x66,
662      0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
663   /* data16
664      data16
665      nopw %cs:0L(%[re]ax,%[re]ax,1) */
666   static const char alt_long_12[] =
667     {0x66,
668      0x66,
669      0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
670   /* data16
671      data16
672      data16
673      nopw %cs:0L(%[re]ax,%[re]ax,1) */
674   static const char alt_long_13[] =
675     {0x66,
676      0x66,
677      0x66,
678      0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
679   /* data16
680      data16
681      data16
682      data16
683      nopw %cs:0L(%[re]ax,%[re]ax,1) */
684   static const char alt_long_14[] =
685     {0x66,
686      0x66,
687      0x66,
688      0x66,
689      0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
690   /* data16
691      data16
692      data16
693      data16
694      data16
695      nopw %cs:0L(%[re]ax,%[re]ax,1) */
696   static const char alt_long_15[] =
697     {0x66,
698      0x66,
699      0x66,
700      0x66,
701      0x66,
702      0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
703   /* nopl 0(%[re]ax,%[re]ax,1)
704      nopw 0(%[re]ax,%[re]ax,1) */
705   static const char alt_short_11[] =
706     {0x0f,0x1f,0x44,0x00,0x00,
707      0x66,0x0f,0x1f,0x44,0x00,0x00};
708   /* nopw 0(%[re]ax,%[re]ax,1)
709      nopw 0(%[re]ax,%[re]ax,1) */
710   static const char alt_short_12[] =
711     {0x66,0x0f,0x1f,0x44,0x00,0x00,
712      0x66,0x0f,0x1f,0x44,0x00,0x00};
713   /* nopw 0(%[re]ax,%[re]ax,1)
714      nopl 0L(%[re]ax) */
715   static const char alt_short_13[] =
716     {0x66,0x0f,0x1f,0x44,0x00,0x00,
717      0x0f,0x1f,0x80,0x00,0x00,0x00,0x00};
718   /* nopl 0L(%[re]ax)
719      nopl 0L(%[re]ax) */
720   static const char alt_short_14[] =
721     {0x0f,0x1f,0x80,0x00,0x00,0x00,0x00,
722      0x0f,0x1f,0x80,0x00,0x00,0x00,0x00};
723   /* nopl 0L(%[re]ax)
724      nopl 0L(%[re]ax,%[re]ax,1) */
725   static const char alt_short_15[] =
726     {0x0f,0x1f,0x80,0x00,0x00,0x00,0x00,
727      0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
728   static const char *const alt_short_patt[] = {
729     f32_1, f32_2, alt_3, alt_4, alt_5, alt_6, alt_7, alt_8,
730     alt_9, alt_10, alt_short_11, alt_short_12, alt_short_13,
731     alt_short_14, alt_short_15
732   };
733   static const char *const alt_long_patt[] = {
734     f32_1, f32_2, alt_3, alt_4, alt_5, alt_6, alt_7, alt_8,
735     alt_9, alt_10, alt_long_11, alt_long_12, alt_long_13,
736     alt_long_14, alt_long_15
737   };
738
739   /* Only align for at least a positive non-zero boundary. */
740   if (count <= 0 || count > MAX_MEM_FOR_RS_ALIGN_CODE)
741     return;
742
743   /* We need to decide which NOP sequence to use for 32bit and
744      64bit. When -mtune= is used:
745
746      1. For PROCESSOR_I386, PROCESSOR_I486, PROCESSOR_PENTIUM and
747      PROCESSOR_GENERIC32, f32_patt will be used.
748      2. For PROCESSOR_PENTIUMPRO, PROCESSOR_PENTIUM4, PROCESSOR_NOCONA,
749      PROCESSOR_CORE, PROCESSOR_CORE2, and PROCESSOR_GENERIC64,
750      alt_long_patt will be used.
751      3. For PROCESSOR_ATHLON, PROCESSOR_K6, PROCESSOR_K8 and
752      PROCESSOR_AMDFAM10, alt_short_patt will be used.
753
754      When -mtune= isn't used, alt_long_patt will be used if
755      cpu_arch_isa_flags has Cpu686. Otherwise, f32_patt will
756      be used.
757
758      When -march= or .arch is used, we can't use anything beyond
759      cpu_arch_isa_flags.   */
760
761   if (flag_code == CODE_16BIT)
762     {
763       if (count > 8)
764         {
765           memcpy (fragP->fr_literal + fragP->fr_fix,
766                   jump_31, count);
767           /* Adjust jump offset.  */
768           fragP->fr_literal[fragP->fr_fix + 1] = count - 2;
769         }
770       else
771         memcpy (fragP->fr_literal + fragP->fr_fix,
772                 f16_patt[count - 1], count);
773     }
774   else
775     {
776       const char *const *patt = NULL;
777
778       if (cpu_arch_isa == PROCESSOR_UNKNOWN)
779         {
780           /* PROCESSOR_UNKNOWN means that all ISAs may be used.  */
781           switch (cpu_arch_tune)
782             {
783             case PROCESSOR_UNKNOWN:
784               /* We use cpu_arch_isa_flags to check if we SHOULD
785                  optimize for Cpu686.  */
786               if (cpu_arch_isa_flags.bitfield.cpui686)
787                 patt = alt_long_patt;
788               else
789                 patt = f32_patt;
790               break;
791             case PROCESSOR_PENTIUMPRO:
792             case PROCESSOR_PENTIUM4:
793             case PROCESSOR_NOCONA:
794             case PROCESSOR_CORE:
795             case PROCESSOR_CORE2:
796             case PROCESSOR_GENERIC64:
797               patt = alt_long_patt;
798               break;
799             case PROCESSOR_K6:
800             case PROCESSOR_ATHLON:
801             case PROCESSOR_K8:
802             case PROCESSOR_AMDFAM10:
803               patt = alt_short_patt;
804               break;
805             case PROCESSOR_I386:
806             case PROCESSOR_I486:
807             case PROCESSOR_PENTIUM:
808             case PROCESSOR_GENERIC32:
809               patt = f32_patt;
810               break;
811             }
812         }
813       else
814         {
815           switch (cpu_arch_tune)
816             {
817             case PROCESSOR_UNKNOWN:
818               /* When cpu_arch_isa is net, cpu_arch_tune shouldn't be
819                  PROCESSOR_UNKNOWN.  */
820               abort ();
821               break;
822
823             case PROCESSOR_I386:
824             case PROCESSOR_I486:
825             case PROCESSOR_PENTIUM:
826             case PROCESSOR_K6:
827             case PROCESSOR_ATHLON:
828             case PROCESSOR_K8:
829             case PROCESSOR_AMDFAM10:
830             case PROCESSOR_GENERIC32:
831               /* We use cpu_arch_isa_flags to check if we CAN optimize
832                  for Cpu686.  */
833               if (cpu_arch_isa_flags.bitfield.cpui686)
834                 patt = alt_short_patt;
835               else
836                 patt = f32_patt;
837               break;
838             case PROCESSOR_PENTIUMPRO:
839             case PROCESSOR_PENTIUM4:
840             case PROCESSOR_NOCONA:
841             case PROCESSOR_CORE:
842             case PROCESSOR_CORE2:
843               if (cpu_arch_isa_flags.bitfield.cpui686)
844                 patt = alt_long_patt;
845               else
846                 patt = f32_patt;
847               break;
848             case PROCESSOR_GENERIC64:
849               patt = alt_long_patt;
850               break;
851             }
852         }
853
854       if (patt == f32_patt)
855         {
856           /* If the padding is less than 15 bytes, we use the normal
857              ones.  Otherwise, we use a jump instruction and adjust
858              its offset.  */
859           if (count < 15)
860             memcpy (fragP->fr_literal + fragP->fr_fix,
861                     patt[count - 1], count);
862           else
863             {
864               memcpy (fragP->fr_literal + fragP->fr_fix,
865                       jump_31, count);
866               /* Adjust jump offset.  */
867               fragP->fr_literal[fragP->fr_fix + 1] = count - 2;
868             }
869         }
870       else
871         {
872           /* Maximum length of an instruction is 15 byte.  If the
873              padding is greater than 15 bytes and we don't use jump,
874              we have to break it into smaller pieces.  */
875           int padding = count;
876           while (padding > 15)
877             {
878               padding -= 15;
879               memcpy (fragP->fr_literal + fragP->fr_fix + padding,
880                       patt [14], 15);
881             }
882
883           if (padding)
884             memcpy (fragP->fr_literal + fragP->fr_fix,
885                     patt [padding - 1], padding);
886         }
887     }
888   fragP->fr_var = count;
889 }
890
891 static INLINE int
892 uints_all_zero (const unsigned int *x, unsigned int size)
893 {
894   switch (size)
895     {
896     case 3:
897       if (x[2])
898         return 0;
899     case 2:
900       if (x[1])
901         return 0;
902     case 1:
903       return !x[0];
904     default:
905       abort ();
906     }
907 }
908
909 static INLINE void
910 uints_set (unsigned int *x, unsigned int v, unsigned int size)
911 {
912   switch (size)
913     {
914     case 3:
915       x[2] = v;
916     case 2:
917       x[1] = v;
918     case 1:
919       x[0] = v;
920       break;
921     default:
922       abort ();
923     }
924 }
925
926 static INLINE int
927 uints_equal (const unsigned int *x, const unsigned int *y,
928              unsigned int size)
929 {
930   switch (size)
931     {
932     case 3:
933       if (x[2] != y [2])
934         return 0;
935     case 2:
936       if (x[1] != y [1])
937         return 0;
938     case 1:
939       return x[0] == y [0];
940       break;
941     default:
942       abort ();
943     }
944 }
945
946 #define UINTS_ALL_ZERO(x) \
947   uints_all_zero ((x).array, ARRAY_SIZE ((x).array))
948 #define UINTS_SET(x, v) \
949   uints_set ((x).array, v, ARRAY_SIZE ((x).array))
950 #define UINTS_CLEAR(x) \
951   uints_set ((x).array, 0, ARRAY_SIZE ((x).array))
952 #define UINTS_EQUAL(x, y) \
953   uints_equal ((x).array, (y).array, ARRAY_SIZE ((x).array))
954
955 static INLINE int
956 cpu_flags_check_cpu64 (i386_cpu_flags f)
957 {
958   return !((flag_code == CODE_64BIT && f.bitfield.cpuno64)
959            || (flag_code != CODE_64BIT && f.bitfield.cpu64));
960 }
961
962 static INLINE i386_cpu_flags
963 cpu_flags_not (i386_cpu_flags x)
964 {
965   switch (ARRAY_SIZE (x.array))
966     {
967     case 3:
968       x.array [2] = ~x.array [2];
969     case 2:
970       x.array [1] = ~x.array [1];
971     case 1:
972       x.array [0] = ~x.array [0];
973       break;
974     default:
975       abort ();
976     }
977
978 #ifdef CpuUnused
979   x.bitfield.unused = 0;
980 #endif
981
982   return x;
983 }
984
985 static INLINE i386_cpu_flags
986 cpu_flags_and (i386_cpu_flags x, i386_cpu_flags y)
987 {
988   switch (ARRAY_SIZE (x.array))
989     {
990     case 3:
991       x.array [2] &= y.array [2];
992     case 2:
993       x.array [1] &= y.array [1];
994     case 1:
995       x.array [0] &= y.array [0];
996       break;
997     default:
998       abort ();
999     }
1000   return x;
1001 }
1002
1003 static INLINE i386_cpu_flags
1004 cpu_flags_or (i386_cpu_flags x, i386_cpu_flags y)
1005 {
1006   switch (ARRAY_SIZE (x.array))
1007     {
1008     case 3:
1009       x.array [2] |= y.array [2];
1010     case 2:
1011       x.array [1] |= y.array [1];
1012     case 1:
1013       x.array [0] |= y.array [0];
1014       break;
1015     default:
1016       abort ();
1017     }
1018   return x;
1019 }
1020
1021 static int
1022 cpu_flags_match (i386_cpu_flags x)
1023 {
1024   i386_cpu_flags not = cpu_arch_flags_not;
1025
1026   not.bitfield.cpu64 = 1;
1027   not.bitfield.cpuno64 = 1;
1028
1029   x.bitfield.cpu64 = 0;
1030   x.bitfield.cpuno64 = 0;
1031
1032   not = cpu_flags_and (x, not);
1033   return UINTS_ALL_ZERO (not);
1034 }
1035
1036 static INLINE i386_operand_type
1037 operand_type_and (i386_operand_type x, i386_operand_type y)
1038 {
1039   switch (ARRAY_SIZE (x.array))
1040     {
1041     case 3:
1042       x.array [2] &= y.array [2];
1043     case 2:
1044       x.array [1] &= y.array [1];
1045     case 1:
1046       x.array [0] &= y.array [0];
1047       break;
1048     default:
1049       abort ();
1050     }
1051   return x;
1052 }
1053
1054 static INLINE i386_operand_type
1055 operand_type_or (i386_operand_type x, i386_operand_type y)
1056 {
1057   switch (ARRAY_SIZE (x.array))
1058     {
1059     case 3:
1060       x.array [2] |= y.array [2];
1061     case 2:
1062       x.array [1] |= y.array [1];
1063     case 1:
1064       x.array [0] |= y.array [0];
1065       break;
1066     default:
1067       abort ();
1068     }
1069   return x;
1070 }
1071
1072 static INLINE i386_operand_type
1073 operand_type_xor (i386_operand_type x, i386_operand_type y)
1074 {
1075   switch (ARRAY_SIZE (x.array))
1076     {
1077     case 3:
1078       x.array [2] ^= y.array [2];
1079     case 2:
1080       x.array [1] ^= y.array [1];
1081     case 1:
1082       x.array [0] ^= y.array [0];
1083       break;
1084     default:
1085       abort ();
1086     }
1087   return x;
1088 }
1089
1090 static const i386_operand_type acc32 = OPERAND_TYPE_ACC32;
1091 static const i386_operand_type acc64 = OPERAND_TYPE_ACC64;
1092 static const i386_operand_type control = OPERAND_TYPE_CONTROL;
1093 static const i386_operand_type reg16_inoutportreg
1094   = OPERAND_TYPE_REG16_INOUTPORTREG;
1095 static const i386_operand_type disp16 = OPERAND_TYPE_DISP16;
1096 static const i386_operand_type disp32 = OPERAND_TYPE_DISP32;
1097 static const i386_operand_type disp32s = OPERAND_TYPE_DISP32S;
1098 static const i386_operand_type disp16_32 = OPERAND_TYPE_DISP16_32;
1099 static const i386_operand_type anydisp
1100   = OPERAND_TYPE_ANYDISP;
1101 static const i386_operand_type baseindex = OPERAND_TYPE_BASEINDEX;
1102 static const i386_operand_type regxmm = OPERAND_TYPE_REGXMM;
1103 static const i386_operand_type imm8 = OPERAND_TYPE_IMM8;
1104 static const i386_operand_type imm8s = OPERAND_TYPE_IMM8S;
1105 static const i386_operand_type imm16 = OPERAND_TYPE_IMM16;
1106 static const i386_operand_type imm32 = OPERAND_TYPE_IMM32;
1107 static const i386_operand_type imm32s = OPERAND_TYPE_IMM32S;
1108 static const i386_operand_type imm64 = OPERAND_TYPE_IMM64;
1109 static const i386_operand_type imm16_32 = OPERAND_TYPE_IMM16_32;
1110 static const i386_operand_type imm16_32s = OPERAND_TYPE_IMM16_32S;
1111 static const i386_operand_type imm16_32_32s = OPERAND_TYPE_IMM16_32_32S;
1112
1113 enum operand_type
1114 {
1115   reg,
1116   imm,
1117   disp,
1118   anymem
1119 };
1120
1121 static INLINE int
1122 operand_type_check (i386_operand_type t, enum operand_type c)
1123 {
1124   switch (c)
1125     {
1126     case reg:
1127       return (t.bitfield.reg8
1128               || t.bitfield.reg16
1129               || t.bitfield.reg32
1130               || t.bitfield.reg64);
1131
1132     case imm:
1133       return (t.bitfield.imm8
1134               || t.bitfield.imm8s
1135               || t.bitfield.imm16
1136               || t.bitfield.imm32
1137               || t.bitfield.imm32s
1138               || t.bitfield.imm64);
1139
1140     case disp:
1141       return (t.bitfield.disp8
1142               || t.bitfield.disp16
1143               || t.bitfield.disp32
1144               || t.bitfield.disp32s
1145               || t.bitfield.disp64);
1146
1147     case anymem:
1148       return (t.bitfield.disp8
1149               || t.bitfield.disp16
1150               || t.bitfield.disp32
1151               || t.bitfield.disp32s
1152               || t.bitfield.disp64
1153               || t.bitfield.baseindex);
1154
1155     default:
1156       abort ();
1157     }
1158 }
1159
1160 static INLINE int
1161 operand_type_match (i386_operand_type overlap,
1162                     i386_operand_type given)
1163 {
1164   i386_operand_type temp = overlap;
1165
1166   temp.bitfield.jumpabsolute = 0;
1167   if (UINTS_ALL_ZERO (temp))
1168     return 0;
1169
1170   return (given.bitfield.baseindex == overlap.bitfield.baseindex
1171           && given.bitfield.jumpabsolute == overlap.bitfield.jumpabsolute);
1172 }
1173
1174 /* If given types r0 and r1 are registers they must be of the same type
1175    unless the expected operand type register overlap is null.
1176    Note that Acc in a template matches every size of reg.  */
1177
1178 static INLINE int
1179 operand_type_register_match (i386_operand_type m0,
1180                              i386_operand_type g0,
1181                              i386_operand_type t0,
1182                              i386_operand_type m1,
1183                              i386_operand_type g1,
1184                              i386_operand_type t1)
1185 {
1186   if (!operand_type_check (g0, reg))
1187     return 1;
1188
1189   if (!operand_type_check (g1, reg))
1190     return 1;
1191
1192   if (g0.bitfield.reg8 == g1.bitfield.reg8
1193       && g0.bitfield.reg16 == g1.bitfield.reg16
1194       && g0.bitfield.reg32 == g1.bitfield.reg32
1195       && g0.bitfield.reg64 == g1.bitfield.reg64)
1196     return 1;
1197
1198   if (m0.bitfield.acc)
1199     {
1200       t0.bitfield.reg8 = 1;
1201       t0.bitfield.reg16 = 1;
1202       t0.bitfield.reg32 = 1;
1203       t0.bitfield.reg64 = 1;
1204     }
1205
1206   if (m1.bitfield.acc)
1207     {
1208       t1.bitfield.reg8 = 1;
1209       t1.bitfield.reg16 = 1;
1210       t1.bitfield.reg32 = 1;
1211       t1.bitfield.reg64 = 1;
1212     }
1213
1214   return (!(t0.bitfield.reg8 & t1.bitfield.reg8)
1215           && !(t0.bitfield.reg16 & t1.bitfield.reg16)
1216           && !(t0.bitfield.reg32 & t1.bitfield.reg32)
1217           && !(t0.bitfield.reg64 & t1.bitfield.reg64));
1218 }
1219
1220 static INLINE unsigned int
1221 mode_from_disp_size (i386_operand_type t)
1222 {
1223   if (t.bitfield.disp8)
1224     return 1;
1225   else if (t.bitfield.disp16
1226            || t.bitfield.disp32
1227            || t.bitfield.disp32s)
1228     return 2;
1229   else
1230     return 0;
1231 }
1232
1233 static INLINE int
1234 fits_in_signed_byte (offsetT num)
1235 {
1236   return (num >= -128) && (num <= 127);
1237 }
1238
1239 static INLINE int
1240 fits_in_unsigned_byte (offsetT num)
1241 {
1242   return (num & 0xff) == num;
1243 }
1244
1245 static INLINE int
1246 fits_in_unsigned_word (offsetT num)
1247 {
1248   return (num & 0xffff) == num;
1249 }
1250
1251 static INLINE int
1252 fits_in_signed_word (offsetT num)
1253 {
1254   return (-32768 <= num) && (num <= 32767);
1255 }
1256
1257 static INLINE int
1258 fits_in_signed_long (offsetT num ATTRIBUTE_UNUSED)
1259 {
1260 #ifndef BFD64
1261   return 1;
1262 #else
1263   return (!(((offsetT) -1 << 31) & num)
1264           || (((offsetT) -1 << 31) & num) == ((offsetT) -1 << 31));
1265 #endif
1266 }                               /* fits_in_signed_long() */
1267
1268 static INLINE int
1269 fits_in_unsigned_long (offsetT num ATTRIBUTE_UNUSED)
1270 {
1271 #ifndef BFD64
1272   return 1;
1273 #else
1274   return (num & (((offsetT) 2 << 31) - 1)) == num;
1275 #endif
1276 }                               /* fits_in_unsigned_long() */
1277
1278 static i386_operand_type
1279 smallest_imm_type (offsetT num)
1280 {
1281   i386_operand_type t;
1282  
1283   UINTS_CLEAR (t);
1284   t.bitfield.imm64 = 1;
1285
1286   if (cpu_arch_tune != PROCESSOR_I486 && num == 1)
1287     {
1288       /* This code is disabled on the 486 because all the Imm1 forms
1289          in the opcode table are slower on the i486.  They're the
1290          versions with the implicitly specified single-position
1291          displacement, which has another syntax if you really want to
1292          use that form.  */
1293       t.bitfield.imm1 = 1;
1294       t.bitfield.imm8 = 1;
1295       t.bitfield.imm8s = 1;
1296       t.bitfield.imm16 = 1;
1297       t.bitfield.imm32 = 1;
1298       t.bitfield.imm32s = 1;
1299     }
1300   else if (fits_in_signed_byte (num))
1301     {
1302       t.bitfield.imm8 = 1;
1303       t.bitfield.imm8s = 1;
1304       t.bitfield.imm16 = 1;
1305       t.bitfield.imm32 = 1;
1306       t.bitfield.imm32s = 1;
1307     }
1308   else if (fits_in_unsigned_byte (num))
1309     {
1310       t.bitfield.imm8 = 1;
1311       t.bitfield.imm16 = 1;
1312       t.bitfield.imm32 = 1;
1313       t.bitfield.imm32s = 1;
1314     }
1315   else if (fits_in_signed_word (num) || fits_in_unsigned_word (num))
1316     {
1317       t.bitfield.imm16 = 1;
1318       t.bitfield.imm32 = 1;
1319       t.bitfield.imm32s = 1;
1320     }
1321   else if (fits_in_signed_long (num))
1322     {
1323       t.bitfield.imm32 = 1;
1324       t.bitfield.imm32s = 1;
1325     }
1326   else if (fits_in_unsigned_long (num))
1327     t.bitfield.imm32 = 1;
1328
1329   return t;
1330 }
1331
1332 static offsetT
1333 offset_in_range (offsetT val, int size)
1334 {
1335   addressT mask;
1336
1337   switch (size)
1338     {
1339     case 1: mask = ((addressT) 1 <<  8) - 1; break;
1340     case 2: mask = ((addressT) 1 << 16) - 1; break;
1341     case 4: mask = ((addressT) 2 << 31) - 1; break;
1342 #ifdef BFD64
1343     case 8: mask = ((addressT) 2 << 63) - 1; break;
1344 #endif
1345     default: abort ();
1346     }
1347
1348   /* If BFD64, sign extend val.  */
1349   if (!use_rela_relocations)
1350     if ((val & ~(((addressT) 2 << 31) - 1)) == 0)
1351       val = (val ^ ((addressT) 1 << 31)) - ((addressT) 1 << 31);
1352
1353   if ((val & ~mask) != 0 && (val & ~mask) != ~mask)
1354     {
1355       char buf1[40], buf2[40];
1356
1357       sprint_value (buf1, val);
1358       sprint_value (buf2, val & mask);
1359       as_warn (_("%s shortened to %s"), buf1, buf2);
1360     }
1361   return val & mask;
1362 }
1363
1364 /* Returns 0 if attempting to add a prefix where one from the same
1365    class already exists, 1 if non rep/repne added, 2 if rep/repne
1366    added.  */
1367 static int
1368 add_prefix (unsigned int prefix)
1369 {
1370   int ret = 1;
1371   unsigned int q;
1372
1373   if (prefix >= REX_OPCODE && prefix < REX_OPCODE + 16
1374       && flag_code == CODE_64BIT)
1375     {
1376       if ((i.prefix[REX_PREFIX] & prefix & REX_W)
1377           || ((i.prefix[REX_PREFIX] & (REX_R | REX_X | REX_B))
1378               && (prefix & (REX_R | REX_X | REX_B))))
1379         ret = 0;
1380       q = REX_PREFIX;
1381     }
1382   else
1383     {
1384       switch (prefix)
1385         {
1386         default:
1387           abort ();
1388
1389         case CS_PREFIX_OPCODE:
1390         case DS_PREFIX_OPCODE:
1391         case ES_PREFIX_OPCODE:
1392         case FS_PREFIX_OPCODE:
1393         case GS_PREFIX_OPCODE:
1394         case SS_PREFIX_OPCODE:
1395           q = SEG_PREFIX;
1396           break;
1397
1398         case REPNE_PREFIX_OPCODE:
1399         case REPE_PREFIX_OPCODE:
1400           ret = 2;
1401           /* fall thru */
1402         case LOCK_PREFIX_OPCODE:
1403           q = LOCKREP_PREFIX;
1404           break;
1405
1406         case FWAIT_OPCODE:
1407           q = WAIT_PREFIX;
1408           break;
1409
1410         case ADDR_PREFIX_OPCODE:
1411           q = ADDR_PREFIX;
1412           break;
1413
1414         case DATA_PREFIX_OPCODE:
1415           q = DATA_PREFIX;
1416           break;
1417         }
1418       if (i.prefix[q] != 0)
1419         ret = 0;
1420     }
1421
1422   if (ret)
1423     {
1424       if (!i.prefix[q])
1425         ++i.prefixes;
1426       i.prefix[q] |= prefix;
1427     }
1428   else
1429     as_bad (_("same type of prefix used twice"));
1430
1431   return ret;
1432 }
1433
1434 static void
1435 set_code_flag (int value)
1436 {
1437   flag_code = value;
1438   if (flag_code == CODE_64BIT)
1439     {
1440       cpu_arch_flags.bitfield.cpu64 = 1;
1441       cpu_arch_flags.bitfield.cpuno64 = 0;
1442       cpu_arch_flags_not.bitfield.cpu64 = 0;
1443       cpu_arch_flags_not.bitfield.cpuno64 = 1;
1444     }
1445   else
1446     {
1447       cpu_arch_flags.bitfield.cpu64 = 0;
1448       cpu_arch_flags.bitfield.cpuno64 = 1;
1449       cpu_arch_flags_not.bitfield.cpu64 = 1;
1450       cpu_arch_flags_not.bitfield.cpuno64 = 0;
1451     }
1452   if (value == CODE_64BIT && !cpu_arch_flags.bitfield.cpulm )
1453     {
1454       as_bad (_("64bit mode not supported on this CPU."));
1455     }
1456   if (value == CODE_32BIT && !cpu_arch_flags.bitfield.cpui386)
1457     {
1458       as_bad (_("32bit mode not supported on this CPU."));
1459     }
1460   stackop_size = '\0';
1461 }
1462
1463 static void
1464 set_16bit_gcc_code_flag (int new_code_flag)
1465 {
1466   flag_code = new_code_flag;
1467   if (flag_code != CODE_16BIT)
1468     abort ();
1469   cpu_arch_flags.bitfield.cpu64 = 0;
1470   cpu_arch_flags.bitfield.cpuno64 = 1;
1471   cpu_arch_flags_not.bitfield.cpu64 = 1;
1472   cpu_arch_flags_not.bitfield.cpuno64 = 0;
1473   stackop_size = LONG_MNEM_SUFFIX;
1474 }
1475
1476 static void
1477 set_intel_syntax (int syntax_flag)
1478 {
1479   /* Find out if register prefixing is specified.  */
1480   int ask_naked_reg = 0;
1481
1482   SKIP_WHITESPACE ();
1483   if (!is_end_of_line[(unsigned char) *input_line_pointer])
1484     {
1485       char *string = input_line_pointer;
1486       int e = get_symbol_end ();
1487
1488       if (strcmp (string, "prefix") == 0)
1489         ask_naked_reg = 1;
1490       else if (strcmp (string, "noprefix") == 0)
1491         ask_naked_reg = -1;
1492       else
1493         as_bad (_("bad argument to syntax directive."));
1494       *input_line_pointer = e;
1495     }
1496   demand_empty_rest_of_line ();
1497
1498   intel_syntax = syntax_flag;
1499
1500   if (ask_naked_reg == 0)
1501     allow_naked_reg = (intel_syntax
1502                        && (bfd_get_symbol_leading_char (stdoutput) != '\0'));
1503   else
1504     allow_naked_reg = (ask_naked_reg < 0);
1505
1506   identifier_chars['%'] = intel_syntax && allow_naked_reg ? '%' : 0;
1507   identifier_chars['$'] = intel_syntax ? '$' : 0;
1508   register_prefix = allow_naked_reg ? "" : "%";
1509 }
1510
1511 static void
1512 set_cpu_arch (int dummy ATTRIBUTE_UNUSED)
1513 {
1514   SKIP_WHITESPACE ();
1515
1516   if (!is_end_of_line[(unsigned char) *input_line_pointer])
1517     {
1518       char *string = input_line_pointer;
1519       int e = get_symbol_end ();
1520       unsigned int i;
1521       i386_cpu_flags flags;
1522
1523       for (i = 0; i < ARRAY_SIZE (cpu_arch); i++)
1524         {
1525           if (strcmp (string, cpu_arch[i].name) == 0)
1526             {
1527               if (*string != '.')
1528                 {
1529                   cpu_arch_name = cpu_arch[i].name;
1530                   cpu_sub_arch_name = NULL;
1531                   cpu_arch_flags = cpu_arch[i].flags;
1532                   if (flag_code == CODE_64BIT)
1533                     {
1534                       cpu_arch_flags.bitfield.cpu64 = 1;
1535                       cpu_arch_flags.bitfield.cpuno64 = 0;
1536                     }
1537                   else
1538                     {
1539                       cpu_arch_flags.bitfield.cpu64 = 0;
1540                       cpu_arch_flags.bitfield.cpuno64 = 1;
1541                     }
1542                   cpu_arch_flags_not = cpu_flags_not (cpu_arch_flags);
1543                   cpu_arch_isa = cpu_arch[i].type;
1544                   cpu_arch_isa_flags = cpu_arch[i].flags;
1545                   if (!cpu_arch_tune_set)
1546                     {
1547                       cpu_arch_tune = cpu_arch_isa;
1548                       cpu_arch_tune_flags = cpu_arch_isa_flags;
1549                     }
1550                   break;
1551                 }
1552
1553               flags = cpu_flags_or (cpu_arch_flags,
1554                                     cpu_arch[i].flags);
1555               if (!UINTS_EQUAL (flags, cpu_arch_flags))
1556                 {
1557                   cpu_sub_arch_name = cpu_arch[i].name;
1558                   cpu_arch_flags = flags;
1559                   cpu_arch_flags_not = cpu_flags_not (cpu_arch_flags);
1560                 }
1561               *input_line_pointer = e;
1562               demand_empty_rest_of_line ();
1563               return;
1564             }
1565         }
1566       if (i >= ARRAY_SIZE (cpu_arch))
1567         as_bad (_("no such architecture: `%s'"), string);
1568
1569       *input_line_pointer = e;
1570     }
1571   else
1572     as_bad (_("missing cpu architecture"));
1573
1574   no_cond_jump_promotion = 0;
1575   if (*input_line_pointer == ','
1576       && !is_end_of_line[(unsigned char) input_line_pointer[1]])
1577     {
1578       char *string = ++input_line_pointer;
1579       int e = get_symbol_end ();
1580
1581       if (strcmp (string, "nojumps") == 0)
1582         no_cond_jump_promotion = 1;
1583       else if (strcmp (string, "jumps") == 0)
1584         ;
1585       else
1586         as_bad (_("no such architecture modifier: `%s'"), string);
1587
1588       *input_line_pointer = e;
1589     }
1590
1591   demand_empty_rest_of_line ();
1592 }
1593
1594 unsigned long
1595 i386_mach ()
1596 {
1597   if (!strcmp (default_arch, "x86_64"))
1598     return bfd_mach_x86_64;
1599   else if (!strcmp (default_arch, "i386"))
1600     return bfd_mach_i386_i386;
1601   else
1602     as_fatal (_("Unknown architecture"));
1603 }
1604 \f
1605 void
1606 md_begin ()
1607 {
1608   const char *hash_err;
1609
1610   cpu_arch_flags_not = cpu_flags_not (cpu_arch_flags);
1611
1612   /* Initialize op_hash hash table.  */
1613   op_hash = hash_new ();
1614
1615   {
1616     const template *optab;
1617     templates *core_optab;
1618
1619     /* Setup for loop.  */
1620     optab = i386_optab;
1621     core_optab = (templates *) xmalloc (sizeof (templates));
1622     core_optab->start = optab;
1623
1624     while (1)
1625       {
1626         ++optab;
1627         if (optab->name == NULL
1628             || strcmp (optab->name, (optab - 1)->name) != 0)
1629           {
1630             /* different name --> ship out current template list;
1631                add to hash table; & begin anew.  */
1632             core_optab->end = optab;
1633             hash_err = hash_insert (op_hash,
1634                                     (optab - 1)->name,
1635                                     (PTR) core_optab);
1636             if (hash_err)
1637               {
1638                 as_fatal (_("Internal Error:  Can't hash %s: %s"),
1639                           (optab - 1)->name,
1640                           hash_err);
1641               }
1642             if (optab->name == NULL)
1643               break;
1644             core_optab = (templates *) xmalloc (sizeof (templates));
1645             core_optab->start = optab;
1646           }
1647       }
1648   }
1649
1650   /* Initialize reg_hash hash table.  */
1651   reg_hash = hash_new ();
1652   {
1653     const reg_entry *regtab;
1654     unsigned int regtab_size = i386_regtab_size;
1655
1656     for (regtab = i386_regtab; regtab_size--; regtab++)
1657       {
1658         hash_err = hash_insert (reg_hash, regtab->reg_name, (PTR) regtab);
1659         if (hash_err)
1660           as_fatal (_("Internal Error:  Can't hash %s: %s"),
1661                     regtab->reg_name,
1662                     hash_err);
1663       }
1664   }
1665
1666   /* Fill in lexical tables:  mnemonic_chars, operand_chars.  */
1667   {
1668     int c;
1669     char *p;
1670
1671     for (c = 0; c < 256; c++)
1672       {
1673         if (ISDIGIT (c))
1674           {
1675             digit_chars[c] = c;
1676             mnemonic_chars[c] = c;
1677             register_chars[c] = c;
1678             operand_chars[c] = c;
1679           }
1680         else if (ISLOWER (c))
1681           {
1682             mnemonic_chars[c] = c;
1683             register_chars[c] = c;
1684             operand_chars[c] = c;
1685           }
1686         else if (ISUPPER (c))
1687           {
1688             mnemonic_chars[c] = TOLOWER (c);
1689             register_chars[c] = mnemonic_chars[c];
1690             operand_chars[c] = c;
1691           }
1692
1693         if (ISALPHA (c) || ISDIGIT (c))
1694           identifier_chars[c] = c;
1695         else if (c >= 128)
1696           {
1697             identifier_chars[c] = c;
1698             operand_chars[c] = c;
1699           }
1700       }
1701
1702 #ifdef LEX_AT
1703     identifier_chars['@'] = '@';
1704 #endif
1705 #ifdef LEX_QM
1706     identifier_chars['?'] = '?';
1707     operand_chars['?'] = '?';
1708 #endif
1709     digit_chars['-'] = '-';
1710     mnemonic_chars['-'] = '-';
1711     mnemonic_chars['.'] = '.';
1712     identifier_chars['_'] = '_';
1713     identifier_chars['.'] = '.';
1714
1715     for (p = operand_special_chars; *p != '\0'; p++)
1716       operand_chars[(unsigned char) *p] = *p;
1717   }
1718
1719 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
1720   if (IS_ELF)
1721     {
1722       record_alignment (text_section, 2);
1723       record_alignment (data_section, 2);
1724       record_alignment (bss_section, 2);
1725     }
1726 #endif
1727
1728   if (flag_code == CODE_64BIT)
1729     {
1730       x86_dwarf2_return_column = 16;
1731       x86_cie_data_alignment = -8;
1732     }
1733   else
1734     {
1735       x86_dwarf2_return_column = 8;
1736       x86_cie_data_alignment = -4;
1737     }
1738 }
1739
1740 void
1741 i386_print_statistics (FILE *file)
1742 {
1743   hash_print_statistics (file, "i386 opcode", op_hash);
1744   hash_print_statistics (file, "i386 register", reg_hash);
1745 }
1746 \f
1747 #ifdef DEBUG386
1748
1749 /* Debugging routines for md_assemble.  */
1750 static void pte (template *);
1751 static void pt (i386_operand_type);
1752 static void pe (expressionS *);
1753 static void ps (symbolS *);
1754
1755 static void
1756 pi (char *line, i386_insn *x)
1757 {
1758   unsigned int i;
1759
1760   fprintf (stdout, "%s: template ", line);
1761   pte (&x->tm);
1762   fprintf (stdout, "  address: base %s  index %s  scale %x\n",
1763            x->base_reg ? x->base_reg->reg_name : "none",
1764            x->index_reg ? x->index_reg->reg_name : "none",
1765            x->log2_scale_factor);
1766   fprintf (stdout, "  modrm:  mode %x  reg %x  reg/mem %x\n",
1767            x->rm.mode, x->rm.reg, x->rm.regmem);
1768   fprintf (stdout, "  sib:  base %x  index %x  scale %x\n",
1769            x->sib.base, x->sib.index, x->sib.scale);
1770   fprintf (stdout, "  rex: 64bit %x  extX %x  extY %x  extZ %x\n",
1771            (x->rex & REX_W) != 0,
1772            (x->rex & REX_R) != 0,
1773            (x->rex & REX_X) != 0,
1774            (x->rex & REX_B) != 0);
1775   fprintf (stdout, "  drex:  reg %d rex 0x%x\n", 
1776            x->drex.reg, x->drex.rex);
1777   for (i = 0; i < x->operands; i++)
1778     {
1779       fprintf (stdout, "    #%d:  ", i + 1);
1780       pt (x->types[i]);
1781       fprintf (stdout, "\n");
1782       if (x->types[i].bitfield.reg8
1783           || x->types[i].bitfield.reg16
1784           || x->types[i].bitfield.reg32
1785           || x->types[i].bitfield.reg64
1786           || x->types[i].bitfield.regmmx
1787           || x->types[i].bitfield.regxmm
1788           || x->types[i].bitfield.sreg2
1789           || x->types[i].bitfield.sreg3
1790           || x->types[i].bitfield.control
1791           || x->types[i].bitfield.debug
1792           || x->types[i].bitfield.test)
1793         fprintf (stdout, "%s\n", x->op[i].regs->reg_name);
1794       if (operand_type_check (x->types[i], imm))
1795         pe (x->op[i].imms);
1796       if (operand_type_check (x->types[i], disp))
1797         pe (x->op[i].disps);
1798     }
1799 }
1800
1801 static void
1802 pte (template *t)
1803 {
1804   unsigned int i;
1805   fprintf (stdout, " %d operands ", t->operands);
1806   fprintf (stdout, "opcode %x ", t->base_opcode);
1807   if (t->extension_opcode != None)
1808     fprintf (stdout, "ext %x ", t->extension_opcode);
1809   if (t->opcode_modifier.d)
1810     fprintf (stdout, "D");
1811   if (t->opcode_modifier.w)
1812     fprintf (stdout, "W");
1813   fprintf (stdout, "\n");
1814   for (i = 0; i < t->operands; i++)
1815     {
1816       fprintf (stdout, "    #%d type ", i + 1);
1817       pt (t->operand_types[i]);
1818       fprintf (stdout, "\n");
1819     }
1820 }
1821
1822 static void
1823 pe (expressionS *e)
1824 {
1825   fprintf (stdout, "    operation     %d\n", e->X_op);
1826   fprintf (stdout, "    add_number    %ld (%lx)\n",
1827            (long) e->X_add_number, (long) e->X_add_number);
1828   if (e->X_add_symbol)
1829     {
1830       fprintf (stdout, "    add_symbol    ");
1831       ps (e->X_add_symbol);
1832       fprintf (stdout, "\n");
1833     }
1834   if (e->X_op_symbol)
1835     {
1836       fprintf (stdout, "    op_symbol    ");
1837       ps (e->X_op_symbol);
1838       fprintf (stdout, "\n");
1839     }
1840 }
1841
1842 static void
1843 ps (symbolS *s)
1844 {
1845   fprintf (stdout, "%s type %s%s",
1846            S_GET_NAME (s),
1847            S_IS_EXTERNAL (s) ? "EXTERNAL " : "",
1848            segment_name (S_GET_SEGMENT (s)));
1849 }
1850
1851 static struct type_name
1852   {
1853     i386_operand_type mask;
1854     const char *name;
1855   }
1856 const type_names[] =
1857 {
1858   { OPERAND_TYPE_REG8, "r8" },
1859   { OPERAND_TYPE_REG16, "r16" },
1860   { OPERAND_TYPE_REG32, "r32" },
1861   { OPERAND_TYPE_REG64, "r64" },
1862   { OPERAND_TYPE_IMM8, "i8" },
1863   { OPERAND_TYPE_IMM8, "i8s" },
1864   { OPERAND_TYPE_IMM16, "i16" },
1865   { OPERAND_TYPE_IMM32, "i32" },
1866   { OPERAND_TYPE_IMM32S, "i32s" },
1867   { OPERAND_TYPE_IMM64, "i64" },
1868   { OPERAND_TYPE_IMM1, "i1" },
1869   { OPERAND_TYPE_BASEINDEX, "BaseIndex" },
1870   { OPERAND_TYPE_DISP8, "d8" },
1871   { OPERAND_TYPE_DISP16, "d16" },
1872   { OPERAND_TYPE_DISP32, "d32" },
1873   { OPERAND_TYPE_DISP32S, "d32s" },
1874   { OPERAND_TYPE_DISP64, "d64" },
1875   { OPERAND_TYPE_INOUTPORTREG, "InOutPortReg" },
1876   { OPERAND_TYPE_SHIFTCOUNT, "ShiftCount" },
1877   { OPERAND_TYPE_CONTROL, "control reg" },
1878   { OPERAND_TYPE_TEST, "test reg" },
1879   { OPERAND_TYPE_DEBUG, "debug reg" },
1880   { OPERAND_TYPE_FLOATREG, "FReg" },
1881   { OPERAND_TYPE_FLOATACC, "FAcc" },
1882   { OPERAND_TYPE_SREG2, "SReg2" },
1883   { OPERAND_TYPE_SREG3, "SReg3" },
1884   { OPERAND_TYPE_ACC, "Acc" },
1885   { OPERAND_TYPE_JUMPABSOLUTE, "Jump Absolute" },
1886   { OPERAND_TYPE_REGMMX, "rMMX" },
1887   { OPERAND_TYPE_REGXMM, "rXMM" },
1888   { OPERAND_TYPE_ESSEG, "es" },
1889 };
1890
1891 static void
1892 pt (i386_operand_type t)
1893 {
1894   unsigned int j;
1895   i386_operand_type a;
1896
1897   for (j = 0; j < ARRAY_SIZE (type_names); j++)
1898     {
1899       a = operand_type_and (t, type_names[j].mask);
1900       if (!UINTS_ALL_ZERO (a))
1901         fprintf (stdout, "%s, ",  type_names[j].name);
1902     }
1903   fflush (stdout);
1904 }
1905
1906 #endif /* DEBUG386 */
1907 \f
1908 static bfd_reloc_code_real_type
1909 reloc (unsigned int size,
1910        int pcrel,
1911        int sign,
1912        bfd_reloc_code_real_type other)
1913 {
1914   if (other != NO_RELOC)
1915     {
1916       reloc_howto_type *reloc;
1917
1918       if (size == 8)
1919         switch (other)
1920           {
1921           case BFD_RELOC_X86_64_GOT32:
1922             return BFD_RELOC_X86_64_GOT64;
1923             break;
1924           case BFD_RELOC_X86_64_PLTOFF64:
1925             return BFD_RELOC_X86_64_PLTOFF64;
1926             break;
1927           case BFD_RELOC_X86_64_GOTPC32:
1928             other = BFD_RELOC_X86_64_GOTPC64;
1929             break;
1930           case BFD_RELOC_X86_64_GOTPCREL:
1931             other = BFD_RELOC_X86_64_GOTPCREL64;
1932             break;
1933           case BFD_RELOC_X86_64_TPOFF32:
1934             other = BFD_RELOC_X86_64_TPOFF64;
1935             break;
1936           case BFD_RELOC_X86_64_DTPOFF32:
1937             other = BFD_RELOC_X86_64_DTPOFF64;
1938             break;
1939           default:
1940             break;
1941           }
1942
1943       /* Sign-checking 4-byte relocations in 16-/32-bit code is pointless.  */
1944       if (size == 4 && flag_code != CODE_64BIT)
1945         sign = -1;
1946
1947       reloc = bfd_reloc_type_lookup (stdoutput, other);
1948       if (!reloc)
1949         as_bad (_("unknown relocation (%u)"), other);
1950       else if (size != bfd_get_reloc_size (reloc))
1951         as_bad (_("%u-byte relocation cannot be applied to %u-byte field"),
1952                 bfd_get_reloc_size (reloc),
1953                 size);
1954       else if (pcrel && !reloc->pc_relative)
1955         as_bad (_("non-pc-relative relocation for pc-relative field"));
1956       else if ((reloc->complain_on_overflow == complain_overflow_signed
1957                 && !sign)
1958                || (reloc->complain_on_overflow == complain_overflow_unsigned
1959                    && sign > 0))
1960         as_bad (_("relocated field and relocation type differ in signedness"));
1961       else
1962         return other;
1963       return NO_RELOC;
1964     }
1965
1966   if (pcrel)
1967     {
1968       if (!sign)
1969         as_bad (_("there are no unsigned pc-relative relocations"));
1970       switch (size)
1971         {
1972         case 1: return BFD_RELOC_8_PCREL;
1973         case 2: return BFD_RELOC_16_PCREL;
1974         case 4: return BFD_RELOC_32_PCREL;
1975         case 8: return BFD_RELOC_64_PCREL;
1976         }
1977       as_bad (_("cannot do %u byte pc-relative relocation"), size);
1978     }
1979   else
1980     {
1981       if (sign > 0)
1982         switch (size)
1983           {
1984           case 4: return BFD_RELOC_X86_64_32S;
1985           }
1986       else
1987         switch (size)
1988           {
1989           case 1: return BFD_RELOC_8;
1990           case 2: return BFD_RELOC_16;
1991           case 4: return BFD_RELOC_32;
1992           case 8: return BFD_RELOC_64;
1993           }
1994       as_bad (_("cannot do %s %u byte relocation"),
1995               sign > 0 ? "signed" : "unsigned", size);
1996     }
1997
1998   abort ();
1999   return BFD_RELOC_NONE;
2000 }
2001
2002 /* Here we decide which fixups can be adjusted to make them relative to
2003    the beginning of the section instead of the symbol.  Basically we need
2004    to make sure that the dynamic relocations are done correctly, so in
2005    some cases we force the original symbol to be used.  */
2006
2007 int
2008 tc_i386_fix_adjustable (fixS *fixP ATTRIBUTE_UNUSED)
2009 {
2010 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
2011   if (!IS_ELF)
2012     return 1;
2013
2014   /* Don't adjust pc-relative references to merge sections in 64-bit
2015      mode.  */
2016   if (use_rela_relocations
2017       && (S_GET_SEGMENT (fixP->fx_addsy)->flags & SEC_MERGE) != 0
2018       && fixP->fx_pcrel)
2019     return 0;
2020
2021   /* The x86_64 GOTPCREL are represented as 32bit PCrel relocations
2022      and changed later by validate_fix.  */
2023   if (GOT_symbol && fixP->fx_subsy == GOT_symbol
2024       && fixP->fx_r_type == BFD_RELOC_32_PCREL)
2025     return 0;
2026
2027   /* adjust_reloc_syms doesn't know about the GOT.  */
2028   if (fixP->fx_r_type == BFD_RELOC_386_GOTOFF
2029       || fixP->fx_r_type == BFD_RELOC_386_PLT32
2030       || fixP->fx_r_type == BFD_RELOC_386_GOT32
2031       || fixP->fx_r_type == BFD_RELOC_386_TLS_GD
2032       || fixP->fx_r_type == BFD_RELOC_386_TLS_LDM
2033       || fixP->fx_r_type == BFD_RELOC_386_TLS_LDO_32
2034       || fixP->fx_r_type == BFD_RELOC_386_TLS_IE_32
2035       || fixP->fx_r_type == BFD_RELOC_386_TLS_IE
2036       || fixP->fx_r_type == BFD_RELOC_386_TLS_GOTIE
2037       || fixP->fx_r_type == BFD_RELOC_386_TLS_LE_32
2038       || fixP->fx_r_type == BFD_RELOC_386_TLS_LE
2039       || fixP->fx_r_type == BFD_RELOC_386_TLS_GOTDESC
2040       || fixP->fx_r_type == BFD_RELOC_386_TLS_DESC_CALL
2041       || fixP->fx_r_type == BFD_RELOC_X86_64_PLT32
2042       || fixP->fx_r_type == BFD_RELOC_X86_64_GOT32
2043       || fixP->fx_r_type == BFD_RELOC_X86_64_GOTPCREL
2044       || fixP->fx_r_type == BFD_RELOC_X86_64_TLSGD
2045       || fixP->fx_r_type == BFD_RELOC_X86_64_TLSLD
2046       || fixP->fx_r_type == BFD_RELOC_X86_64_DTPOFF32
2047       || fixP->fx_r_type == BFD_RELOC_X86_64_DTPOFF64
2048       || fixP->fx_r_type == BFD_RELOC_X86_64_GOTTPOFF
2049       || fixP->fx_r_type == BFD_RELOC_X86_64_TPOFF32
2050       || fixP->fx_r_type == BFD_RELOC_X86_64_TPOFF64
2051       || fixP->fx_r_type == BFD_RELOC_X86_64_GOTOFF64
2052       || fixP->fx_r_type == BFD_RELOC_X86_64_GOTPC32_TLSDESC
2053       || fixP->fx_r_type == BFD_RELOC_X86_64_TLSDESC_CALL
2054       || fixP->fx_r_type == BFD_RELOC_VTABLE_INHERIT
2055       || fixP->fx_r_type == BFD_RELOC_VTABLE_ENTRY)
2056     return 0;
2057 #endif
2058   return 1;
2059 }
2060
2061 static int
2062 intel_float_operand (const char *mnemonic)
2063 {
2064   /* Note that the value returned is meaningful only for opcodes with (memory)
2065      operands, hence the code here is free to improperly handle opcodes that
2066      have no operands (for better performance and smaller code). */
2067
2068   if (mnemonic[0] != 'f')
2069     return 0; /* non-math */
2070
2071   switch (mnemonic[1])
2072     {
2073     /* fclex, fdecstp, fdisi, femms, feni, fincstp, finit, fsetpm, and
2074        the fs segment override prefix not currently handled because no
2075        call path can make opcodes without operands get here */
2076     case 'i':
2077       return 2 /* integer op */;
2078     case 'l':
2079       if (mnemonic[2] == 'd' && (mnemonic[3] == 'c' || mnemonic[3] == 'e'))
2080         return 3; /* fldcw/fldenv */
2081       break;
2082     case 'n':
2083       if (mnemonic[2] != 'o' /* fnop */)
2084         return 3; /* non-waiting control op */
2085       break;
2086     case 'r':
2087       if (mnemonic[2] == 's')
2088         return 3; /* frstor/frstpm */
2089       break;
2090     case 's':
2091       if (mnemonic[2] == 'a')
2092         return 3; /* fsave */
2093       if (mnemonic[2] == 't')
2094         {
2095           switch (mnemonic[3])
2096             {
2097             case 'c': /* fstcw */
2098             case 'd': /* fstdw */
2099             case 'e': /* fstenv */
2100             case 's': /* fsts[gw] */
2101               return 3;
2102             }
2103         }
2104       break;
2105     case 'x':
2106       if (mnemonic[2] == 'r' || mnemonic[2] == 's')
2107         return 0; /* fxsave/fxrstor are not really math ops */
2108       break;
2109     }
2110
2111   return 1;
2112 }
2113
2114 /* This is the guts of the machine-dependent assembler.  LINE points to a
2115    machine dependent instruction.  This function is supposed to emit
2116    the frags/bytes it assembles to.  */
2117
2118 void
2119 md_assemble (line)
2120      char *line;
2121 {
2122   unsigned int j;
2123   char mnemonic[MAX_MNEM_SIZE];
2124
2125   /* Initialize globals.  */
2126   memset (&i, '\0', sizeof (i));
2127   for (j = 0; j < MAX_OPERANDS; j++)
2128     i.reloc[j] = NO_RELOC;
2129   memset (disp_expressions, '\0', sizeof (disp_expressions));
2130   memset (im_expressions, '\0', sizeof (im_expressions));
2131   save_stack_p = save_stack;
2132
2133   /* First parse an instruction mnemonic & call i386_operand for the operands.
2134      We assume that the scrubber has arranged it so that line[0] is the valid
2135      start of a (possibly prefixed) mnemonic.  */
2136
2137   line = parse_insn (line, mnemonic);
2138   if (line == NULL)
2139     return;
2140
2141   line = parse_operands (line, mnemonic);
2142   if (line == NULL)
2143     return;
2144
2145   /* Now we've parsed the mnemonic into a set of templates, and have the
2146      operands at hand.  */
2147
2148   /* All intel opcodes have reversed operands except for "bound" and
2149      "enter".  We also don't reverse intersegment "jmp" and "call"
2150      instructions with 2 immediate operands so that the immediate segment
2151      precedes the offset, as it does when in AT&T mode. */
2152   if (intel_syntax
2153       && i.operands > 1
2154       && (strcmp (mnemonic, "bound") != 0)
2155       && (strcmp (mnemonic, "invlpga") != 0)
2156       && !(operand_type_check (i.types[0], imm)
2157            && operand_type_check (i.types[1], imm)))
2158     swap_operands ();
2159
2160   /* The order of the immediates should be reversed
2161      for 2 immediates extrq and insertq instructions */
2162   if (i.imm_operands == 2
2163       && (strcmp (mnemonic, "extrq") == 0
2164           || strcmp (mnemonic, "insertq") == 0))
2165       swap_2_operands (0, 1);
2166
2167   if (i.imm_operands)
2168     optimize_imm ();
2169
2170   /* Don't optimize displacement for movabs since it only takes 64bit
2171      displacement.  */
2172   if (i.disp_operands
2173       && (flag_code != CODE_64BIT
2174           || strcmp (mnemonic, "movabs") != 0))
2175     optimize_disp ();
2176
2177   /* Next, we find a template that matches the given insn,
2178      making sure the overlap of the given operands types is consistent
2179      with the template operand types.  */
2180
2181   if (!match_template ())
2182     return;
2183
2184   if (intel_syntax)
2185     {
2186       /* Undo SYSV386_COMPAT brokenness when in Intel mode.  See i386.h  */
2187       if (SYSV386_COMPAT
2188           && (i.tm.base_opcode & 0xfffffde0) == 0xdce0)
2189         i.tm.base_opcode ^= Opcode_FloatR;
2190
2191       /* Zap movzx and movsx suffix.  The suffix may have been set from
2192          "word ptr" or "byte ptr" on the source operand, but we'll use
2193          the suffix later to choose the destination register.  */
2194       if ((i.tm.base_opcode & ~9) == 0x0fb6)
2195         {
2196           if (i.reg_operands < 2
2197               && !i.suffix
2198               && (!i.tm.opcode_modifier.no_bsuf
2199                   || !i.tm.opcode_modifier.no_wsuf
2200                   || !i.tm.opcode_modifier.no_lsuf
2201                   || !i.tm.opcode_modifier.no_ssuf
2202                   || !i.tm.opcode_modifier.no_xsuf
2203                   || !i.tm.opcode_modifier.no_qsuf))
2204             as_bad (_("ambiguous operand size for `%s'"), i.tm.name);
2205
2206           i.suffix = 0;
2207         }
2208     }
2209
2210   if (i.tm.opcode_modifier.fwait)
2211     if (!add_prefix (FWAIT_OPCODE))
2212       return;
2213
2214   /* Check string instruction segment overrides.  */
2215   if (i.tm.opcode_modifier.isstring && i.mem_operands != 0)
2216     {
2217       if (!check_string ())
2218         return;
2219     }
2220
2221   if (!process_suffix ())
2222     return;
2223
2224   /* Make still unresolved immediate matches conform to size of immediate
2225      given in i.suffix.  */
2226   if (!finalize_imm ())
2227     return;
2228
2229   if (i.types[0].bitfield.imm1)
2230     i.imm_operands = 0; /* kludge for shift insns.  */
2231
2232   for (j = 0; j < 3; j++)
2233     if (i.types[j].bitfield.inoutportreg
2234         || i.types[j].bitfield.shiftcount
2235         || i.types[j].bitfield.acc
2236         || i.types[j].bitfield.floatacc)
2237       i.reg_operands--;
2238
2239   if (i.tm.opcode_modifier.immext)
2240     {
2241       expressionS *exp;
2242
2243       if (i.tm.cpu_flags.bitfield.cpusse3 && i.operands > 0)
2244         {
2245           /* Streaming SIMD extensions 3 Instructions have the fixed
2246              operands with an opcode suffix which is coded in the same
2247              place as an 8-bit immediate field would be. Here we check
2248              those operands and remove them afterwards.  */
2249           unsigned int x;
2250
2251           for (x = 0; x < i.operands; x++)
2252             if (i.op[x].regs->reg_num != x)
2253               as_bad (_("can't use register '%s%s' as operand %d in '%s'."),
2254                       register_prefix,
2255                       i.op[x].regs->reg_name,
2256                       x + 1,
2257                       i.tm.name);
2258           i.operands = 0;
2259         }
2260
2261       /* These AMD 3DNow! and Intel Katmai New Instructions have an
2262          opcode suffix which is coded in the same place as an 8-bit
2263          immediate field would be.  Here we fake an 8-bit immediate
2264          operand from the opcode suffix stored in tm.extension_opcode.
2265          SSE5 also uses this encoding, for some of its 3 argument
2266          instructions.  */
2267
2268       assert (i.imm_operands == 0
2269               && (i.operands <= 2
2270                   || (i.tm.cpu_flags.bitfield.cpusse5
2271                       && i.operands <= 3)));
2272
2273       exp = &im_expressions[i.imm_operands++];
2274       i.op[i.operands].imms = exp;
2275       UINTS_CLEAR (i.types[i.operands]);
2276       i.types[i.operands].bitfield.imm8 = 1;
2277       i.operands++;
2278       exp->X_op = O_constant;
2279       exp->X_add_number = i.tm.extension_opcode;
2280       i.tm.extension_opcode = None;
2281     }
2282
2283   /* For insns with operands there are more diddles to do to the opcode.  */
2284   if (i.operands)
2285     {
2286       if (!process_operands ())
2287         return;
2288     }
2289   else if (!quiet_warnings && i.tm.opcode_modifier.ugh)
2290     {
2291       /* UnixWare fsub no args is alias for fsubp, fadd -> faddp, etc.  */
2292       as_warn (_("translating to `%sp'"), i.tm.name);
2293     }
2294
2295   /* Handle conversion of 'int $3' --> special int3 insn.  */
2296   if (i.tm.base_opcode == INT_OPCODE && i.op[0].imms->X_add_number == 3)
2297     {
2298       i.tm.base_opcode = INT3_OPCODE;
2299       i.imm_operands = 0;
2300     }
2301
2302   if ((i.tm.opcode_modifier.jump
2303        || i.tm.opcode_modifier.jumpbyte
2304        || i.tm.opcode_modifier.jumpdword)
2305       && i.op[0].disps->X_op == O_constant)
2306     {
2307       /* Convert "jmp constant" (and "call constant") to a jump (call) to
2308          the absolute address given by the constant.  Since ix86 jumps and
2309          calls are pc relative, we need to generate a reloc.  */
2310       i.op[0].disps->X_add_symbol = &abs_symbol;
2311       i.op[0].disps->X_op = O_symbol;
2312     }
2313
2314   if (i.tm.opcode_modifier.rex64)
2315     i.rex |= REX_W;
2316
2317   /* For 8 bit registers we need an empty rex prefix.  Also if the
2318      instruction already has a prefix, we need to convert old
2319      registers to new ones.  */
2320
2321   if ((i.types[0].bitfield.reg8
2322        && (i.op[0].regs->reg_flags & RegRex64) != 0)
2323       || (i.types[1].bitfield.reg8
2324           && (i.op[1].regs->reg_flags & RegRex64) != 0)
2325       || ((i.types[0].bitfield.reg8
2326            || i.types[1].bitfield.reg8)
2327           && i.rex != 0))
2328     {
2329       int x;
2330
2331       i.rex |= REX_OPCODE;
2332       for (x = 0; x < 2; x++)
2333         {
2334           /* Look for 8 bit operand that uses old registers.  */
2335           if (i.types[x].bitfield.reg8
2336               && (i.op[x].regs->reg_flags & RegRex64) == 0)
2337             {
2338               /* In case it is "hi" register, give up.  */
2339               if (i.op[x].regs->reg_num > 3)
2340                 as_bad (_("can't encode register '%s%s' in an "
2341                           "instruction requiring REX prefix."),
2342                         register_prefix, i.op[x].regs->reg_name);
2343
2344               /* Otherwise it is equivalent to the extended register.
2345                  Since the encoding doesn't change this is merely
2346                  cosmetic cleanup for debug output.  */
2347
2348               i.op[x].regs = i.op[x].regs + 8;
2349             }
2350         }
2351     }
2352
2353   /* If the instruction has the DREX attribute (aka SSE5), don't emit a
2354      REX prefix.  */
2355   if (i.tm.opcode_modifier.drex || i.tm.opcode_modifier.drexc)
2356     {
2357       i.drex.rex = i.rex;
2358       i.rex = 0;
2359     }
2360   else if (i.rex != 0)
2361     add_prefix (REX_OPCODE | i.rex);
2362
2363   /* We are ready to output the insn.  */
2364   output_insn ();
2365 }
2366
2367 static char *
2368 parse_insn (char *line, char *mnemonic)
2369 {
2370   char *l = line;
2371   char *token_start = l;
2372   char *mnem_p;
2373   int supported;
2374   const template *t;
2375
2376   /* Non-zero if we found a prefix only acceptable with string insns.  */
2377   const char *expecting_string_instruction = NULL;
2378
2379   while (1)
2380     {
2381       mnem_p = mnemonic;
2382       while ((*mnem_p = mnemonic_chars[(unsigned char) *l]) != 0)
2383         {
2384           mnem_p++;
2385           if (mnem_p >= mnemonic + MAX_MNEM_SIZE)
2386             {
2387               as_bad (_("no such instruction: `%s'"), token_start);
2388               return NULL;
2389             }
2390           l++;
2391         }
2392       if (!is_space_char (*l)
2393           && *l != END_OF_INSN
2394           && (intel_syntax
2395               || (*l != PREFIX_SEPARATOR
2396                   && *l != ',')))
2397         {
2398           as_bad (_("invalid character %s in mnemonic"),
2399                   output_invalid (*l));
2400           return NULL;
2401         }
2402       if (token_start == l)
2403         {
2404           if (!intel_syntax && *l == PREFIX_SEPARATOR)
2405             as_bad (_("expecting prefix; got nothing"));
2406           else
2407             as_bad (_("expecting mnemonic; got nothing"));
2408           return NULL;
2409         }
2410
2411       /* Look up instruction (or prefix) via hash table.  */
2412       current_templates = hash_find (op_hash, mnemonic);
2413
2414       if (*l != END_OF_INSN
2415           && (!is_space_char (*l) || l[1] != END_OF_INSN)
2416           && current_templates
2417           && current_templates->start->opcode_modifier.isprefix)
2418         {
2419           if (!cpu_flags_check_cpu64 (current_templates->start->cpu_flags))
2420             {
2421               as_bad ((flag_code != CODE_64BIT
2422                        ? _("`%s' is only supported in 64-bit mode")
2423                        : _("`%s' is not supported in 64-bit mode")),
2424                       current_templates->start->name);
2425               return NULL;
2426             }
2427           /* If we are in 16-bit mode, do not allow addr16 or data16.
2428              Similarly, in 32-bit mode, do not allow addr32 or data32.  */
2429           if ((current_templates->start->opcode_modifier.size16
2430                || current_templates->start->opcode_modifier.size32)
2431               && flag_code != CODE_64BIT
2432               && (current_templates->start->opcode_modifier.size32
2433                   ^ (flag_code == CODE_16BIT)))
2434             {
2435               as_bad (_("redundant %s prefix"),
2436                       current_templates->start->name);
2437               return NULL;
2438             }
2439           /* Add prefix, checking for repeated prefixes.  */
2440           switch (add_prefix (current_templates->start->base_opcode))
2441             {
2442             case 0:
2443               return NULL;
2444             case 2:
2445               expecting_string_instruction = current_templates->start->name;
2446               break;
2447             }
2448           /* Skip past PREFIX_SEPARATOR and reset token_start.  */
2449           token_start = ++l;
2450         }
2451       else
2452         break;
2453     }
2454
2455   if (!current_templates)
2456     {
2457       /* See if we can get a match by trimming off a suffix.  */
2458       switch (mnem_p[-1])
2459         {
2460         case WORD_MNEM_SUFFIX:
2461           if (intel_syntax && (intel_float_operand (mnemonic) & 2))
2462             i.suffix = SHORT_MNEM_SUFFIX;
2463           else
2464         case BYTE_MNEM_SUFFIX:
2465         case QWORD_MNEM_SUFFIX:
2466           i.suffix = mnem_p[-1];
2467           mnem_p[-1] = '\0';
2468           current_templates = hash_find (op_hash, mnemonic);
2469           break;
2470         case SHORT_MNEM_SUFFIX:
2471         case LONG_MNEM_SUFFIX:
2472           if (!intel_syntax)
2473             {
2474               i.suffix = mnem_p[-1];
2475               mnem_p[-1] = '\0';
2476               current_templates = hash_find (op_hash, mnemonic);
2477             }
2478           break;
2479
2480           /* Intel Syntax.  */
2481         case 'd':
2482           if (intel_syntax)
2483             {
2484               if (intel_float_operand (mnemonic) == 1)
2485                 i.suffix = SHORT_MNEM_SUFFIX;
2486               else
2487                 i.suffix = LONG_MNEM_SUFFIX;
2488               mnem_p[-1] = '\0';
2489               current_templates = hash_find (op_hash, mnemonic);
2490             }
2491           break;
2492         }
2493       if (!current_templates)
2494         {
2495           as_bad (_("no such instruction: `%s'"), token_start);
2496           return NULL;
2497         }
2498     }
2499
2500   if (current_templates->start->opcode_modifier.jump
2501       || current_templates->start->opcode_modifier.jumpbyte)
2502     {
2503       /* Check for a branch hint.  We allow ",pt" and ",pn" for
2504          predict taken and predict not taken respectively.
2505          I'm not sure that branch hints actually do anything on loop
2506          and jcxz insns (JumpByte) for current Pentium4 chips.  They
2507          may work in the future and it doesn't hurt to accept them
2508          now.  */
2509       if (l[0] == ',' && l[1] == 'p')
2510         {
2511           if (l[2] == 't')
2512             {
2513               if (!add_prefix (DS_PREFIX_OPCODE))
2514                 return NULL;
2515               l += 3;
2516             }
2517           else if (l[2] == 'n')
2518             {
2519               if (!add_prefix (CS_PREFIX_OPCODE))
2520                 return NULL;
2521               l += 3;
2522             }
2523         }
2524     }
2525   /* Any other comma loses.  */
2526   if (*l == ',')
2527     {
2528       as_bad (_("invalid character %s in mnemonic"),
2529               output_invalid (*l));
2530       return NULL;
2531     }
2532
2533   /* Check if instruction is supported on specified architecture.  */
2534   supported = 0;
2535   for (t = current_templates->start; t < current_templates->end; ++t)
2536     {
2537       if (cpu_flags_match (t->cpu_flags))
2538         supported |= 1;
2539       if (cpu_flags_check_cpu64 (t->cpu_flags))
2540         supported |= 2;
2541     }
2542   if (!(supported & 2))
2543     {
2544       as_bad (flag_code == CODE_64BIT
2545               ? _("`%s' is not supported in 64-bit mode")
2546               : _("`%s' is only supported in 64-bit mode"),
2547               current_templates->start->name);
2548       return NULL;
2549     }
2550   if (!(supported & 1))
2551     {
2552       as_warn (_("`%s' is not supported on `%s%s'"),
2553                current_templates->start->name,
2554                cpu_arch_name,
2555                cpu_sub_arch_name ? cpu_sub_arch_name : "");
2556     }
2557   else if (!cpu_arch_flags.bitfield.cpui386
2558            && (flag_code != CODE_16BIT))
2559     {
2560       as_warn (_("use .code16 to ensure correct addressing mode"));
2561     }
2562
2563   /* Check for rep/repne without a string instruction.  */
2564   if (expecting_string_instruction)
2565     {
2566       static templates override;
2567
2568       for (t = current_templates->start; t < current_templates->end; ++t)
2569         if (t->opcode_modifier.isstring)
2570           break;
2571       if (t >= current_templates->end)
2572         {
2573           as_bad (_("expecting string instruction after `%s'"),
2574                   expecting_string_instruction);
2575           return NULL;
2576         }
2577       for (override.start = t; t < current_templates->end; ++t)
2578         if (!t->opcode_modifier.isstring)
2579           break;
2580       override.end = t;
2581       current_templates = &override;
2582     }
2583
2584   return l;
2585 }
2586
2587 static char *
2588 parse_operands (char *l, const char *mnemonic)
2589 {
2590   char *token_start;
2591
2592   /* 1 if operand is pending after ','.  */
2593   unsigned int expecting_operand = 0;
2594
2595   /* Non-zero if operand parens not balanced.  */
2596   unsigned int paren_not_balanced;
2597
2598   while (*l != END_OF_INSN)
2599     {
2600       /* Skip optional white space before operand.  */
2601       if (is_space_char (*l))
2602         ++l;
2603       if (!is_operand_char (*l) && *l != END_OF_INSN)
2604         {
2605           as_bad (_("invalid character %s before operand %d"),
2606                   output_invalid (*l),
2607                   i.operands + 1);
2608           return NULL;
2609         }
2610       token_start = l;  /* after white space */
2611       paren_not_balanced = 0;
2612       while (paren_not_balanced || *l != ',')
2613         {
2614           if (*l == END_OF_INSN)
2615             {
2616               if (paren_not_balanced)
2617                 {
2618                   if (!intel_syntax)
2619                     as_bad (_("unbalanced parenthesis in operand %d."),
2620                             i.operands + 1);
2621                   else
2622                     as_bad (_("unbalanced brackets in operand %d."),
2623                             i.operands + 1);
2624                   return NULL;
2625                 }
2626               else
2627                 break;  /* we are done */
2628             }
2629           else if (!is_operand_char (*l) && !is_space_char (*l))
2630             {
2631               as_bad (_("invalid character %s in operand %d"),
2632                       output_invalid (*l),
2633                       i.operands + 1);
2634               return NULL;
2635             }
2636           if (!intel_syntax)
2637             {
2638               if (*l == '(')
2639                 ++paren_not_balanced;
2640               if (*l == ')')
2641                 --paren_not_balanced;
2642             }
2643           else
2644             {
2645               if (*l == '[')
2646                 ++paren_not_balanced;
2647               if (*l == ']')
2648                 --paren_not_balanced;
2649             }
2650           l++;
2651         }
2652       if (l != token_start)
2653         {                       /* Yes, we've read in another operand.  */
2654           unsigned int operand_ok;
2655           this_operand = i.operands++;
2656           if (i.operands > MAX_OPERANDS)
2657             {
2658               as_bad (_("spurious operands; (%d operands/instruction max)"),
2659                       MAX_OPERANDS);
2660               return NULL;
2661             }
2662           /* Now parse operand adding info to 'i' as we go along.  */
2663           END_STRING_AND_SAVE (l);
2664
2665           if (intel_syntax)
2666             operand_ok =
2667               i386_intel_operand (token_start,
2668                                   intel_float_operand (mnemonic));
2669           else
2670             operand_ok = i386_operand (token_start);
2671
2672           RESTORE_END_STRING (l);
2673           if (!operand_ok)
2674             return NULL;
2675         }
2676       else
2677         {
2678           if (expecting_operand)
2679             {
2680             expecting_operand_after_comma:
2681               as_bad (_("expecting operand after ','; got nothing"));
2682               return NULL;
2683             }
2684           if (*l == ',')
2685             {
2686               as_bad (_("expecting operand before ','; got nothing"));
2687               return NULL;
2688             }
2689         }
2690
2691       /* Now *l must be either ',' or END_OF_INSN.  */
2692       if (*l == ',')
2693         {
2694           if (*++l == END_OF_INSN)
2695             {
2696               /* Just skip it, if it's \n complain.  */
2697               goto expecting_operand_after_comma;
2698             }
2699           expecting_operand = 1;
2700         }
2701     }
2702   return l;
2703 }
2704
2705 static void
2706 swap_2_operands (int xchg1, int xchg2)
2707 {
2708   union i386_op temp_op;
2709   i386_operand_type temp_type;
2710   enum bfd_reloc_code_real temp_reloc;
2711
2712   temp_type = i.types[xchg2];
2713   i.types[xchg2] = i.types[xchg1];
2714   i.types[xchg1] = temp_type;
2715   temp_op = i.op[xchg2];
2716   i.op[xchg2] = i.op[xchg1];
2717   i.op[xchg1] = temp_op;
2718   temp_reloc = i.reloc[xchg2];
2719   i.reloc[xchg2] = i.reloc[xchg1];
2720   i.reloc[xchg1] = temp_reloc;
2721 }
2722
2723 static void
2724 swap_operands (void)
2725 {
2726   switch (i.operands)
2727     {
2728     case 4:
2729       swap_2_operands (1, i.operands - 2);
2730     case 3:
2731     case 2:
2732       swap_2_operands (0, i.operands - 1);
2733       break;
2734     default:
2735       abort ();
2736     }
2737
2738   if (i.mem_operands == 2)
2739     {
2740       const seg_entry *temp_seg;
2741       temp_seg = i.seg[0];
2742       i.seg[0] = i.seg[1];
2743       i.seg[1] = temp_seg;
2744     }
2745 }
2746
2747 /* Try to ensure constant immediates are represented in the smallest
2748    opcode possible.  */
2749 static void
2750 optimize_imm (void)
2751 {
2752   char guess_suffix = 0;
2753   int op;
2754
2755   if (i.suffix)
2756     guess_suffix = i.suffix;
2757   else if (i.reg_operands)
2758     {
2759       /* Figure out a suffix from the last register operand specified.
2760          We can't do this properly yet, ie. excluding InOutPortReg,
2761          but the following works for instructions with immediates.
2762          In any case, we can't set i.suffix yet.  */
2763       for (op = i.operands; --op >= 0;)
2764         if (i.types[op].bitfield.reg8)
2765           { 
2766             guess_suffix = BYTE_MNEM_SUFFIX;
2767             break;
2768           }
2769         else if (i.types[op].bitfield.reg16)
2770           {
2771             guess_suffix = WORD_MNEM_SUFFIX;
2772             break;
2773           }
2774         else if (i.types[op].bitfield.reg32)
2775           {
2776             guess_suffix = LONG_MNEM_SUFFIX;
2777             break;
2778           }
2779         else if (i.types[op].bitfield.reg64)
2780           {
2781             guess_suffix = QWORD_MNEM_SUFFIX;
2782             break;
2783           }
2784     }
2785   else if ((flag_code == CODE_16BIT) ^ (i.prefix[DATA_PREFIX] != 0))
2786     guess_suffix = WORD_MNEM_SUFFIX;
2787
2788   for (op = i.operands; --op >= 0;)
2789     if (operand_type_check (i.types[op], imm))
2790       {
2791         switch (i.op[op].imms->X_op)
2792           {
2793           case O_constant:
2794             /* If a suffix is given, this operand may be shortened.  */
2795             switch (guess_suffix)
2796               {
2797               case LONG_MNEM_SUFFIX:
2798                 i.types[op].bitfield.imm32 = 1;
2799                 i.types[op].bitfield.imm64 = 1;
2800                 break;
2801               case WORD_MNEM_SUFFIX:
2802                 i.types[op].bitfield.imm16 = 1;
2803                 i.types[op].bitfield.imm32 = 1;
2804                 i.types[op].bitfield.imm32s = 1;
2805                 i.types[op].bitfield.imm64 = 1;
2806                 break;
2807               case BYTE_MNEM_SUFFIX:
2808                 i.types[op].bitfield.imm8 = 1;
2809                 i.types[op].bitfield.imm8s = 1;
2810                 i.types[op].bitfield.imm16 = 1;
2811                 i.types[op].bitfield.imm32 = 1;
2812                 i.types[op].bitfield.imm32s = 1;
2813                 i.types[op].bitfield.imm64 = 1;
2814                 break;
2815               }
2816
2817             /* If this operand is at most 16 bits, convert it
2818                to a signed 16 bit number before trying to see
2819                whether it will fit in an even smaller size.
2820                This allows a 16-bit operand such as $0xffe0 to
2821                be recognised as within Imm8S range.  */
2822             if ((i.types[op].bitfield.imm16)
2823                 && (i.op[op].imms->X_add_number & ~(offsetT) 0xffff) == 0)
2824               {
2825                 i.op[op].imms->X_add_number =
2826                   (((i.op[op].imms->X_add_number & 0xffff) ^ 0x8000) - 0x8000);
2827               }
2828             if ((i.types[op].bitfield.imm32)
2829                 && ((i.op[op].imms->X_add_number & ~(((offsetT) 2 << 31) - 1))
2830                     == 0))
2831               {
2832                 i.op[op].imms->X_add_number = ((i.op[op].imms->X_add_number
2833                                                 ^ ((offsetT) 1 << 31))
2834                                                - ((offsetT) 1 << 31));
2835               }
2836             i.types[op]
2837               = operand_type_or (i.types[op],
2838                                  smallest_imm_type (i.op[op].imms->X_add_number));
2839
2840             /* We must avoid matching of Imm32 templates when 64bit
2841                only immediate is available.  */
2842             if (guess_suffix == QWORD_MNEM_SUFFIX)
2843               i.types[op].bitfield.imm32 = 0;
2844             break;
2845
2846           case O_absent:
2847           case O_register:
2848             abort ();
2849
2850             /* Symbols and expressions.  */
2851           default:
2852             /* Convert symbolic operand to proper sizes for matching, but don't
2853                prevent matching a set of insns that only supports sizes other
2854                than those matching the insn suffix.  */
2855             {
2856               i386_operand_type mask, allowed;
2857               const template *t;
2858
2859               UINTS_CLEAR (mask);
2860               UINTS_CLEAR (allowed);
2861
2862               for (t = current_templates->start;
2863                    t < current_templates->end;
2864                    ++t)
2865                 allowed = operand_type_or (allowed,
2866                                            t->operand_types[op]);
2867               switch (guess_suffix)
2868                 {
2869                 case QWORD_MNEM_SUFFIX:
2870                   mask.bitfield.imm64 = 1;
2871                   mask.bitfield.imm32s = 1;
2872                   break;
2873                 case LONG_MNEM_SUFFIX:
2874                   mask.bitfield.imm32 = 1;
2875                   break;
2876                 case WORD_MNEM_SUFFIX:
2877                   mask.bitfield.imm16 = 1;
2878                   break;
2879                 case BYTE_MNEM_SUFFIX:
2880                   mask.bitfield.imm8 = 1;
2881                   break;
2882                 default:
2883                   break;
2884                 }
2885               allowed = operand_type_and (mask, allowed);
2886               if (!UINTS_ALL_ZERO (allowed))
2887                 i.types[op] = operand_type_and (i.types[op], mask);
2888             }
2889             break;
2890           }
2891       }
2892 }
2893
2894 /* Try to use the smallest displacement type too.  */
2895 static void
2896 optimize_disp (void)
2897 {
2898   int op;
2899
2900   for (op = i.operands; --op >= 0;)
2901     if (operand_type_check (i.types[op], disp))
2902       {
2903         if (i.op[op].disps->X_op == O_constant)
2904           {
2905             offsetT disp = i.op[op].disps->X_add_number;
2906
2907             if (i.types[op].bitfield.disp16
2908                 && (disp & ~(offsetT) 0xffff) == 0)
2909               {
2910                 /* If this operand is at most 16 bits, convert
2911                    to a signed 16 bit number and don't use 64bit
2912                    displacement.  */
2913                 disp = (((disp & 0xffff) ^ 0x8000) - 0x8000);
2914                 i.types[op].bitfield.disp64 = 0;
2915               }
2916             if (i.types[op].bitfield.disp32
2917                 && (disp & ~(((offsetT) 2 << 31) - 1)) == 0)
2918               {
2919                 /* If this operand is at most 32 bits, convert
2920                    to a signed 32 bit number and don't use 64bit
2921                    displacement.  */
2922                 disp &= (((offsetT) 2 << 31) - 1);
2923                 disp = (disp ^ ((offsetT) 1 << 31)) - ((addressT) 1 << 31);
2924                 i.types[op].bitfield.disp64 = 0;
2925               }
2926             if (!disp && i.types[op].bitfield.baseindex)
2927               {
2928                 i.types[op].bitfield.disp8 = 0;
2929                 i.types[op].bitfield.disp16 = 0;
2930                 i.types[op].bitfield.disp32 = 0;
2931                 i.types[op].bitfield.disp32s = 0;
2932                 i.types[op].bitfield.disp64 = 0;
2933                 i.op[op].disps = 0;
2934                 i.disp_operands--;
2935               }
2936             else if (flag_code == CODE_64BIT)
2937               {
2938                 if (fits_in_signed_long (disp))
2939                   {
2940                     i.types[op].bitfield.disp64 = 0;
2941                     i.types[op].bitfield.disp32s = 1;
2942                   }
2943                 if (fits_in_unsigned_long (disp))
2944                   i.types[op].bitfield.disp32 = 1;
2945               }
2946             if ((i.types[op].bitfield.disp32
2947                  || i.types[op].bitfield.disp32s
2948                  || i.types[op].bitfield.disp16)
2949                 && fits_in_signed_byte (disp))
2950               i.types[op].bitfield.disp8 = 1;
2951           }
2952         else if (i.reloc[op] == BFD_RELOC_386_TLS_DESC_CALL
2953                  || i.reloc[op] == BFD_RELOC_X86_64_TLSDESC_CALL)
2954           {
2955             fix_new_exp (frag_now, frag_more (0) - frag_now->fr_literal, 0,
2956                          i.op[op].disps, 0, i.reloc[op]);
2957             i.types[op].bitfield.disp8 = 0;
2958             i.types[op].bitfield.disp16 = 0;
2959             i.types[op].bitfield.disp32 = 0;
2960             i.types[op].bitfield.disp32s = 0;
2961             i.types[op].bitfield.disp64 = 0;
2962           }
2963         else
2964           /* We only support 64bit displacement on constants.  */
2965           i.types[op].bitfield.disp64 = 0;
2966       }
2967 }
2968
2969 static int
2970 match_template (void)
2971 {
2972   /* Points to template once we've found it.  */
2973   const template *t;
2974   i386_operand_type overlap0, overlap1, overlap2, overlap3;
2975   unsigned int found_reverse_match;
2976   i386_opcode_modifier suffix_check;
2977   i386_operand_type operand_types [MAX_OPERANDS];
2978   int addr_prefix_disp;
2979   unsigned int j;
2980   i386_cpu_flags overlap;
2981
2982 #if MAX_OPERANDS != 4
2983 # error "MAX_OPERANDS must be 4."
2984 #endif
2985
2986   found_reverse_match = 0;
2987   addr_prefix_disp = -1;
2988
2989   memset (&suffix_check, 0, sizeof (suffix_check));
2990   if (i.suffix == BYTE_MNEM_SUFFIX)
2991     suffix_check.no_bsuf = 1;
2992   else if (i.suffix == WORD_MNEM_SUFFIX)
2993     suffix_check.no_wsuf = 1;
2994   else if (i.suffix == SHORT_MNEM_SUFFIX)
2995     suffix_check.no_ssuf = 1;
2996   else if (i.suffix == LONG_MNEM_SUFFIX)
2997     suffix_check.no_lsuf = 1;
2998   else if (i.suffix == QWORD_MNEM_SUFFIX)
2999     suffix_check.no_qsuf = 1;
3000   else if (i.suffix == LONG_DOUBLE_MNEM_SUFFIX)
3001     suffix_check.no_xsuf = 1;
3002
3003   for (t = current_templates->start; t < current_templates->end; t++)
3004     {
3005       addr_prefix_disp = -1;
3006
3007       /* Must have right number of operands.  */
3008       if (i.operands != t->operands)
3009         continue;
3010
3011       /* Check the suffix, except for some instructions in intel mode.  */
3012       if (((t->opcode_modifier.no_bsuf & suffix_check.no_bsuf)
3013            || (t->opcode_modifier.no_wsuf & suffix_check.no_wsuf)
3014            || (t->opcode_modifier.no_lsuf & suffix_check.no_lsuf)
3015            || (t->opcode_modifier.no_ssuf & suffix_check.no_ssuf)
3016            || (t->opcode_modifier.no_qsuf & suffix_check.no_qsuf)
3017            || (t->opcode_modifier.no_xsuf & suffix_check.no_xsuf))
3018           && !(intel_syntax && t->opcode_modifier.ignoresize))
3019         continue;
3020
3021       for (j = 0; j < MAX_OPERANDS; j++)
3022         operand_types [j] = t->operand_types [j];
3023
3024       /* In general, don't allow 64-bit operands in 32-bit mode.  */
3025       if (i.suffix == QWORD_MNEM_SUFFIX
3026           && flag_code != CODE_64BIT
3027           && (intel_syntax
3028               ? (!t->opcode_modifier.ignoresize
3029                  && !intel_float_operand (t->name))
3030               : intel_float_operand (t->name) != 2)
3031           && ((!operand_types[0].bitfield.regmmx
3032                && !operand_types[0].bitfield.regxmm)
3033               || (!operand_types[t->operands > 1].bitfield.regmmx
3034                   && !!operand_types[t->operands > 1].bitfield.regxmm))
3035           && (t->base_opcode != 0x0fc7
3036               || t->extension_opcode != 1 /* cmpxchg8b */))
3037         continue;
3038
3039       /* Do not verify operands when there are none.  */
3040       else 
3041         {
3042           overlap = cpu_flags_and (t->cpu_flags, cpu_arch_flags_not);
3043           if (!t->operands)
3044             {
3045               if (!UINTS_ALL_ZERO (overlap))
3046                 continue;
3047               /* We've found a match; break out of loop.  */
3048               break;
3049             }
3050         }
3051
3052       /* Address size prefix will turn Disp64/Disp32/Disp16 operand
3053          into Disp32/Disp16/Disp32 operand.  */
3054       if (i.prefix[ADDR_PREFIX] != 0)
3055           {
3056             /* There should be only one Disp operand.  */
3057             switch (flag_code)
3058             {
3059             case CODE_16BIT:
3060               for (j = 0; j < MAX_OPERANDS; j++)
3061                 {
3062                   if (operand_types[j].bitfield.disp16)
3063                     {
3064                       addr_prefix_disp = j;
3065                       operand_types[j].bitfield.disp32 = 1;
3066                       operand_types[j].bitfield.disp16 = 0;
3067                       break;
3068                     }
3069                 }
3070               break;
3071             case CODE_32BIT:
3072               for (j = 0; j < MAX_OPERANDS; j++)
3073                 {
3074                   if (operand_types[j].bitfield.disp32)
3075                     {
3076                       addr_prefix_disp = j;
3077                       operand_types[j].bitfield.disp32 = 0;
3078                       operand_types[j].bitfield.disp16 = 1;
3079                       break;
3080                     }
3081                 }
3082               break;
3083             case CODE_64BIT:
3084               for (j = 0; j < MAX_OPERANDS; j++)
3085                 {
3086                   if (operand_types[j].bitfield.disp64)
3087                     {
3088                       addr_prefix_disp = j;
3089                       operand_types[j].bitfield.disp64 = 0;
3090                       operand_types[j].bitfield.disp32 = 1;
3091                       break;
3092                     }
3093                 }
3094               break;
3095             }
3096           }
3097
3098       overlap0 = operand_type_and (i.types[0], operand_types[0]);
3099       switch (t->operands)
3100         {
3101         case 1:
3102           if (!operand_type_match (overlap0, i.types[0]))
3103             continue;
3104           break;
3105         case 2:
3106           /* xchg %eax, %eax is a special case. It is an aliase for nop
3107              only in 32bit mode and we can use opcode 0x90.  In 64bit
3108              mode, we can't use 0x90 for xchg %eax, %eax since it should
3109              zero-extend %eax to %rax.  */
3110           if (flag_code == CODE_64BIT
3111               && t->base_opcode == 0x90
3112               && UINTS_EQUAL (i.types [0], acc32)
3113               && UINTS_EQUAL (i.types [1], acc32))
3114             continue;
3115         case 3:
3116         case 4:
3117           overlap1 = operand_type_and (i.types[1], operand_types[1]);
3118           if (!operand_type_match (overlap0, i.types[0])
3119               || !operand_type_match (overlap1, i.types[1])
3120               /* monitor in SSE3 is a very special case.  The first
3121                  register and the second register may have different
3122                  sizes.  The same applies to crc32 in SSE4.2.  It is
3123                  also true for invlpga, vmload, vmrun and vmsave in
3124                  SVME.  */
3125               || !((t->base_opcode == 0x0f01
3126                     && (t->extension_opcode == 0xc8
3127                         || t->extension_opcode == 0xd8
3128                         || t->extension_opcode == 0xda
3129                         || t->extension_opcode == 0xdb
3130                         || t->extension_opcode == 0xdf))
3131                    || t->base_opcode == 0xf20f38f1
3132                    || operand_type_register_match (overlap0, i.types[0],
3133                                                    operand_types[0],
3134                                                    overlap1, i.types[1],
3135                                                    operand_types[1])))
3136             {
3137               /* Check if other direction is valid ...  */
3138               if (!t->opcode_modifier.d && !t->opcode_modifier.floatd)
3139                 continue;
3140
3141               /* Try reversing direction of operands.  */
3142               overlap0 = operand_type_and (i.types[0], operand_types[1]);
3143               overlap1 = operand_type_and (i.types[1], operand_types[0]);
3144               if (!operand_type_match (overlap0, i.types[0])
3145                   || !operand_type_match (overlap1, i.types[1])
3146                   || !operand_type_register_match (overlap0, i.types[0],
3147                                                    operand_types[1],
3148                                                    overlap1, i.types[1],
3149                                                    operand_types[0]))
3150                 {
3151                   /* Does not match either direction.  */
3152                   continue;
3153                 }
3154               /* found_reverse_match holds which of D or FloatDR
3155                  we've found.  */
3156               if (t->opcode_modifier.d)
3157                 found_reverse_match = Opcode_D;
3158               else if (t->opcode_modifier.floatd)
3159                 found_reverse_match = Opcode_FloatD;
3160               else
3161                 found_reverse_match = 0;
3162               if (t->opcode_modifier.floatr)
3163                 found_reverse_match |= Opcode_FloatR;
3164             }
3165           else
3166             {
3167               /* Found a forward 2 operand match here.  */
3168               switch (t->operands)
3169                 {
3170                 case 4:
3171                   overlap3 = operand_type_and (i.types[3],
3172                                                operand_types[3]);
3173                 case 3:
3174                   overlap2 = operand_type_and (i.types[2],
3175                                                operand_types[2]);
3176                   break;
3177                 }
3178
3179               switch (t->operands)
3180                 {
3181                 case 4:
3182                   if (!operand_type_match (overlap3, i.types[3])
3183                       || !operand_type_register_match (overlap2,
3184                                                        i.types[2],
3185                                                        operand_types[2],
3186                                                        overlap3,
3187                                                        i.types[3],
3188                                                        operand_types[3]))
3189                     continue;
3190                 case 3:
3191                   /* Here we make use of the fact that there are no
3192                      reverse match 3 operand instructions, and all 3
3193                      operand instructions only need to be checked for
3194                      register consistency between operands 2 and 3.  */
3195                   if (!operand_type_match (overlap2, i.types[2])
3196                       || !operand_type_register_match (overlap1,
3197                                                        i.types[1],
3198                                                        operand_types[1],
3199                                                        overlap2,
3200                                                        i.types[2],
3201                                                        operand_types[2]))
3202                     continue;
3203                   break;
3204                 }
3205             }
3206           /* Found either forward/reverse 2, 3 or 4 operand match here:
3207              slip through to break.  */
3208         }
3209       if (!UINTS_ALL_ZERO (overlap))
3210         {
3211           found_reverse_match = 0;
3212           continue;
3213         }
3214       /* We've found a match; break out of loop.  */
3215       break;
3216     }
3217
3218   if (t == current_templates->end)
3219     {
3220       /* We found no match.  */
3221       as_bad (_("suffix or operands invalid for `%s'"),
3222               current_templates->start->name);
3223       return 0;
3224     }
3225
3226   if (!quiet_warnings)
3227     {
3228       if (!intel_syntax
3229           && (i.types[0].bitfield.jumpabsolute
3230               != operand_types[0].bitfield.jumpabsolute))
3231         {
3232           as_warn (_("indirect %s without `*'"), t->name);
3233         }
3234
3235       if (t->opcode_modifier.isprefix
3236           && t->opcode_modifier.ignoresize)
3237         {
3238           /* Warn them that a data or address size prefix doesn't
3239              affect assembly of the next line of code.  */
3240           as_warn (_("stand-alone `%s' prefix"), t->name);
3241         }
3242     }
3243
3244   /* Copy the template we found.  */
3245   i.tm = *t;
3246
3247   if (addr_prefix_disp != -1)
3248     i.tm.operand_types[addr_prefix_disp]
3249       = operand_types[addr_prefix_disp];
3250
3251   if (found_reverse_match)
3252     {
3253       /* If we found a reverse match we must alter the opcode
3254          direction bit.  found_reverse_match holds bits to change
3255          (different for int & float insns).  */
3256
3257       i.tm.base_opcode ^= found_reverse_match;
3258
3259       i.tm.operand_types[0] = operand_types[1];
3260       i.tm.operand_types[1] = operand_types[0];
3261     }
3262
3263   return 1;
3264 }
3265
3266 static int
3267 check_string (void)
3268 {
3269   int mem_op = operand_type_check (i.types[0], anymem) ? 0 : 1;
3270   if (i.tm.operand_types[mem_op].bitfield.esseg)
3271     {
3272       if (i.seg[0] != NULL && i.seg[0] != &es)
3273         {
3274           as_bad (_("`%s' operand %d must use `%%es' segment"),
3275                   i.tm.name,
3276                   mem_op + 1);
3277           return 0;
3278         }
3279       /* There's only ever one segment override allowed per instruction.
3280          This instruction possibly has a legal segment override on the
3281          second operand, so copy the segment to where non-string
3282          instructions store it, allowing common code.  */
3283       i.seg[0] = i.seg[1];
3284     }
3285   else if (i.tm.operand_types[mem_op + 1].bitfield.esseg)
3286     {
3287       if (i.seg[1] != NULL && i.seg[1] != &es)
3288         {
3289           as_bad (_("`%s' operand %d must use `%%es' segment"),
3290                   i.tm.name,
3291                   mem_op + 2);
3292           return 0;
3293         }
3294     }
3295   return 1;
3296 }
3297
3298 static int
3299 process_suffix (void)
3300 {
3301   /* If matched instruction specifies an explicit instruction mnemonic
3302      suffix, use it.  */
3303   if (i.tm.opcode_modifier.size16)
3304     i.suffix = WORD_MNEM_SUFFIX;
3305   else if (i.tm.opcode_modifier.size32)
3306     i.suffix = LONG_MNEM_SUFFIX;
3307   else if (i.tm.opcode_modifier.size64)
3308     i.suffix = QWORD_MNEM_SUFFIX;
3309   else if (i.reg_operands)
3310     {
3311       /* If there's no instruction mnemonic suffix we try to invent one
3312          based on register operands.  */
3313       if (!i.suffix)
3314         {
3315           /* We take i.suffix from the last register operand specified,
3316              Destination register type is more significant than source
3317              register type.  crc32 in SSE4.2 prefers source register
3318              type. */
3319           if (i.tm.base_opcode == 0xf20f38f1)
3320             {
3321               if (i.types[0].bitfield.reg16)
3322                 i.suffix = WORD_MNEM_SUFFIX;
3323               else if (i.types[0].bitfield.reg32)
3324                 i.suffix = LONG_MNEM_SUFFIX;
3325               else if (i.types[0].bitfield.reg64)
3326                 i.suffix = QWORD_MNEM_SUFFIX;
3327             }
3328           else if (i.tm.base_opcode == 0xf20f38f0)
3329             {
3330               if (i.types[0].bitfield.reg8)
3331                 i.suffix = BYTE_MNEM_SUFFIX;
3332             }
3333
3334           if (!i.suffix)
3335             {
3336               int op;
3337
3338               if (i.tm.base_opcode == 0xf20f38f1
3339                   || i.tm.base_opcode == 0xf20f38f0)
3340                 {
3341                   /* We have to know the operand size for crc32.  */
3342                   as_bad (_("ambiguous memory operand size for `%s`"),
3343                           i.tm.name);
3344                   return 0;
3345                 }
3346
3347               for (op = i.operands; --op >= 0;)
3348                 if (!i.tm.operand_types[op].bitfield.inoutportreg)
3349                   {
3350                     if (i.types[op].bitfield.reg8)
3351                       {
3352                         i.suffix = BYTE_MNEM_SUFFIX;
3353                         break;
3354                       }
3355                     else if (i.types[op].bitfield.reg16)
3356                       {
3357                         i.suffix = WORD_MNEM_SUFFIX;
3358                         break;
3359                       }
3360                     else if (i.types[op].bitfield.reg32)
3361                       {
3362                         i.suffix = LONG_MNEM_SUFFIX;
3363                         break;
3364                       }
3365                     else if (i.types[op].bitfield.reg64)
3366                       {
3367                         i.suffix = QWORD_MNEM_SUFFIX;
3368                         break;
3369                       }
3370                   }
3371             }
3372         }
3373       else if (i.suffix == BYTE_MNEM_SUFFIX)
3374         {
3375           if (!check_byte_reg ())
3376             return 0;
3377         }
3378       else if (i.suffix == LONG_MNEM_SUFFIX)
3379         {
3380           if (!check_long_reg ())
3381             return 0;
3382         }
3383       else if (i.suffix == QWORD_MNEM_SUFFIX)
3384         {
3385           if (!check_qword_reg ())
3386             return 0;
3387         }
3388       else if (i.suffix == WORD_MNEM_SUFFIX)
3389         {
3390           if (!check_word_reg ())
3391             return 0;
3392         }
3393       else if (intel_syntax && i.tm.opcode_modifier.ignoresize)
3394         /* Do nothing if the instruction is going to ignore the prefix.  */
3395         ;
3396       else
3397         abort ();
3398     }
3399   else if (i.tm.opcode_modifier.defaultsize
3400            && !i.suffix
3401            /* exclude fldenv/frstor/fsave/fstenv */
3402            && i.tm.opcode_modifier.no_ssuf)
3403     {
3404       i.suffix = stackop_size;
3405     }
3406   else if (intel_syntax
3407            && !i.suffix
3408            && (i.tm.operand_types[0].bitfield.jumpabsolute
3409                || i.tm.opcode_modifier.jumpbyte
3410                || i.tm.opcode_modifier.jumpintersegment
3411                || (i.tm.base_opcode == 0x0f01 /* [ls][gi]dt */
3412                    && i.tm.extension_opcode <= 3)))
3413     {
3414       switch (flag_code)
3415         {
3416         case CODE_64BIT:
3417           if (!i.tm.opcode_modifier.no_qsuf)
3418             {
3419               i.suffix = QWORD_MNEM_SUFFIX;
3420               break;
3421             }
3422         case CODE_32BIT:
3423           if (!i.tm.opcode_modifier.no_lsuf)
3424             i.suffix = LONG_MNEM_SUFFIX;
3425           break;
3426         case CODE_16BIT:
3427           if (!i.tm.opcode_modifier.no_wsuf)
3428             i.suffix = WORD_MNEM_SUFFIX;
3429           break;
3430         }
3431     }
3432
3433   if (!i.suffix)
3434     {
3435       if (!intel_syntax)
3436         {
3437           if (i.tm.opcode_modifier.w)
3438             {
3439               as_bad (_("no instruction mnemonic suffix given and "
3440                         "no register operands; can't size instruction"));
3441               return 0;
3442             }
3443         }
3444       else
3445         {
3446           unsigned int suffixes;
3447           
3448           suffixes = !i.tm.opcode_modifier.no_bsuf;
3449           if (!i.tm.opcode_modifier.no_wsuf)
3450             suffixes |= 1 << 1;
3451           if (!i.tm.opcode_modifier.no_lsuf)
3452             suffixes |= 1 << 2;
3453           if (!i.tm.opcode_modifier.no_lsuf)
3454             suffixes |= 1 << 3;
3455           if (!i.tm.opcode_modifier.no_ssuf)
3456             suffixes |= 1 << 4;
3457           if (!i.tm.opcode_modifier.no_qsuf)
3458             suffixes |= 1 << 5;
3459
3460           /* There are more than suffix matches.  */
3461           if (i.tm.opcode_modifier.w
3462               || ((suffixes & (suffixes - 1))
3463                   && !i.tm.opcode_modifier.defaultsize
3464                   && !i.tm.opcode_modifier.ignoresize))
3465             {
3466               as_bad (_("ambiguous operand size for `%s'"), i.tm.name);
3467               return 0;
3468             }
3469         }
3470     }
3471
3472   /* Change the opcode based on the operand size given by i.suffix;
3473      We don't need to change things for byte insns.  */
3474
3475   if (i.suffix && i.suffix != BYTE_MNEM_SUFFIX)
3476     {
3477       /* It's not a byte, select word/dword operation.  */
3478       if (i.tm.opcode_modifier.w)
3479         {
3480           if (i.tm.opcode_modifier.shortform)
3481             i.tm.base_opcode |= 8;
3482           else
3483             i.tm.base_opcode |= 1;
3484         }
3485
3486       /* Now select between word & dword operations via the operand
3487          size prefix, except for instructions that will ignore this
3488          prefix anyway.  */
3489       if (i.tm.base_opcode == 0x0f01
3490            && (i.tm.extension_opcode == 0xc8
3491                || i.tm.extension_opcode == 0xd8
3492                || i.tm.extension_opcode == 0xda
3493                || i.tm.extension_opcode == 0xdb
3494                || i.tm.extension_opcode == 0xdf))
3495         {
3496           /* monitor in SSE3 is a very special case. The default size
3497              of AX is the size of mode. The address size override
3498              prefix will change the size of AX.  It is also true for
3499              invlpga, vmload, vmrun and vmsave in SVME.  */
3500           if ((flag_code == CODE_32BIT
3501                && i.op->regs[0].reg_type.bitfield.reg16)
3502               || (flag_code != CODE_32BIT
3503                   && i.op->regs[0].reg_type.bitfield.reg32))
3504             if (!add_prefix (ADDR_PREFIX_OPCODE))
3505               return 0;
3506         }
3507       else if (i.suffix != QWORD_MNEM_SUFFIX
3508                && i.suffix != LONG_DOUBLE_MNEM_SUFFIX
3509                && !i.tm.opcode_modifier.ignoresize
3510                && !i.tm.opcode_modifier.floatmf
3511                && ((i.suffix == LONG_MNEM_SUFFIX) == (flag_code == CODE_16BIT)
3512                    || (flag_code == CODE_64BIT
3513                        && i.tm.opcode_modifier.jumpbyte)))
3514         {
3515           unsigned int prefix = DATA_PREFIX_OPCODE;
3516
3517           if (i.tm.opcode_modifier.jumpbyte) /* jcxz, loop */
3518             prefix = ADDR_PREFIX_OPCODE;
3519
3520           if (!add_prefix (prefix))
3521             return 0;
3522         }
3523
3524       /* Set mode64 for an operand.  */
3525       if (i.suffix == QWORD_MNEM_SUFFIX
3526           && flag_code == CODE_64BIT
3527           && !i.tm.opcode_modifier.norex64)
3528         {
3529           /* Special case for xchg %rax,%rax.  It is NOP and doesn't
3530              need rex64.  cmpxchg8b is also a special case. */
3531           if (! (i.operands == 2
3532                  && i.tm.base_opcode == 0x90
3533                  && i.tm.extension_opcode == None
3534                  && UINTS_EQUAL (i.types [0], acc64)
3535                  && UINTS_EQUAL (i.types [1], acc64))
3536               && ! (i.operands == 1
3537                     && i.tm.base_opcode == 0xfc7
3538                     && i.tm.extension_opcode == 1
3539                     && !operand_type_check (i.types [0], reg)
3540                     && operand_type_check (i.types [0], anymem)))
3541             i.rex |= REX_W;
3542         }
3543
3544       /* Size floating point instruction.  */
3545       if (i.suffix == LONG_MNEM_SUFFIX)
3546         if (i.tm.opcode_modifier.floatmf)
3547           i.tm.base_opcode ^= 4;
3548     }
3549
3550   return 1;
3551 }
3552
3553 static int
3554 check_byte_reg (void)
3555 {
3556   int op;
3557
3558   for (op = i.operands; --op >= 0;)
3559     {
3560       /* If this is an eight bit register, it's OK.  If it's the 16 or
3561          32 bit version of an eight bit register, we will just use the
3562          low portion, and that's OK too.  */
3563       if (i.types[op].bitfield.reg8)
3564         continue;
3565
3566       /* movzx, movsx, pextrb and pinsrb should not generate this
3567          warning.  */
3568       if (intel_syntax
3569           && (i.tm.base_opcode == 0xfb7
3570               || i.tm.base_opcode == 0xfb6
3571               || i.tm.base_opcode == 0x63
3572               || i.tm.base_opcode == 0xfbe
3573               || i.tm.base_opcode == 0xfbf
3574               || i.tm.base_opcode == 0x660f3a14
3575               || i.tm.base_opcode == 0x660f3a20))
3576         continue;
3577
3578       /* crc32 doesn't generate this warning.  */
3579       if (i.tm.base_opcode == 0xf20f38f0)
3580         continue;
3581
3582       if ((i.types[op].bitfield.reg16
3583            || i.types[op].bitfield.reg32
3584            || i.types[op].bitfield.reg64)
3585           && i.op[op].regs->reg_num < 4)
3586         {
3587           /* Prohibit these changes in the 64bit mode, since the
3588              lowering is more complicated.  */
3589           if (flag_code == CODE_64BIT
3590               && !i.tm.operand_types[op].bitfield.inoutportreg)
3591             {
3592               as_bad (_("Incorrect register `%s%s' used with `%c' suffix"),
3593                       register_prefix, i.op[op].regs->reg_name,
3594                       i.suffix);
3595               return 0;
3596             }
3597 #if REGISTER_WARNINGS
3598           if (!quiet_warnings
3599               && !i.tm.operand_types[op].bitfield.inoutportreg)
3600             as_warn (_("using `%s%s' instead of `%s%s' due to `%c' suffix"),
3601                      register_prefix,
3602                      (i.op[op].regs + (i.types[op].bitfield.reg16
3603                                        ? REGNAM_AL - REGNAM_AX
3604                                        : REGNAM_AL - REGNAM_EAX))->reg_name,
3605                      register_prefix,
3606                      i.op[op].regs->reg_name,
3607                      i.suffix);
3608 #endif
3609           continue;
3610         }
3611       /* Any other register is bad.  */
3612       if (i.types[op].bitfield.reg16
3613           || i.types[op].bitfield.reg32
3614           || i.types[op].bitfield.reg64
3615           || i.types[op].bitfield.regmmx
3616           || i.types[op].bitfield.regxmm
3617           || i.types[op].bitfield.sreg2
3618           || i.types[op].bitfield.sreg3
3619           || i.types[op].bitfield.control
3620           || i.types[op].bitfield.debug
3621           || i.types[op].bitfield.test
3622           || i.types[op].bitfield.floatreg
3623           || i.types[op].bitfield.floatacc)
3624         {
3625           as_bad (_("`%s%s' not allowed with `%s%c'"),
3626                   register_prefix,
3627                   i.op[op].regs->reg_name,
3628                   i.tm.name,
3629                   i.suffix);
3630           return 0;
3631         }
3632     }
3633   return 1;
3634 }
3635
3636 static int
3637 check_long_reg (void)
3638 {
3639   int op;
3640
3641   for (op = i.operands; --op >= 0;)
3642     /* Reject eight bit registers, except where the template requires
3643        them. (eg. movzb)  */
3644     if (i.types[op].bitfield.reg8
3645         && (i.tm.operand_types[op].bitfield.reg16
3646             || i.tm.operand_types[op].bitfield.reg32
3647             || i.tm.operand_types[op].bitfield.acc))
3648       {
3649         as_bad (_("`%s%s' not allowed with `%s%c'"),
3650                 register_prefix,
3651                 i.op[op].regs->reg_name,
3652                 i.tm.name,
3653                 i.suffix);
3654         return 0;
3655       }
3656   /* Warn if the e prefix on a general reg is missing.  */
3657     else if ((!quiet_warnings || flag_code == CODE_64BIT)
3658              && i.types[op].bitfield.reg16
3659              && (i.tm.operand_types[op].bitfield.reg32
3660                  || i.tm.operand_types[op].bitfield.acc))
3661       {
3662         /* Prohibit these changes in the 64bit mode, since the
3663            lowering is more complicated.  */
3664         if (flag_code == CODE_64BIT)
3665           {
3666             as_bad (_("Incorrect register `%s%s' used with `%c' suffix"),
3667                     register_prefix, i.op[op].regs->reg_name,
3668                     i.suffix);
3669             return 0;
3670           }
3671 #if REGISTER_WARNINGS
3672         else
3673           as_warn (_("using `%s%s' instead of `%s%s' due to `%c' suffix"),
3674                    register_prefix,
3675                    (i.op[op].regs + REGNAM_EAX - REGNAM_AX)->reg_name,
3676                    register_prefix,
3677                    i.op[op].regs->reg_name,
3678                    i.suffix);
3679 #endif
3680       }
3681   /* Warn if the r prefix on a general reg is missing.  */
3682     else if (i.types[op].bitfield.reg64
3683              && (i.tm.operand_types[op].bitfield.reg32
3684                  || i.tm.operand_types[op].bitfield.acc))
3685       {
3686         if (intel_syntax
3687             && i.tm.base_opcode == 0xf30f2d
3688             && !i.types[0].bitfield.regxmm)
3689           {
3690             /* cvtss2si converts DWORD memory to Reg64.  We want
3691                REX byte. */
3692             i.suffix = QWORD_MNEM_SUFFIX;
3693           }
3694         else
3695           {
3696             as_bad (_("Incorrect register `%s%s' used with `%c' suffix"),
3697                     register_prefix, i.op[op].regs->reg_name,
3698                     i.suffix);
3699             return 0;
3700           }
3701       }
3702   return 1;
3703 }
3704
3705 static int
3706 check_qword_reg (void)
3707 {
3708   int op;
3709
3710   for (op = i.operands; --op >= 0; )
3711     /* Reject eight bit registers, except where the template requires
3712        them. (eg. movzb)  */
3713     if (i.types[op].bitfield.reg8
3714         && (i.tm.operand_types[op].bitfield.reg16
3715             || i.tm.operand_types[op].bitfield.reg32
3716             || i.tm.operand_types[op].bitfield.acc))
3717       {
3718         as_bad (_("`%s%s' not allowed with `%s%c'"),
3719                 register_prefix,
3720                 i.op[op].regs->reg_name,
3721                 i.tm.name,
3722                 i.suffix);
3723         return 0;
3724       }
3725   /* Warn if the e prefix on a general reg is missing.  */
3726     else if ((i.types[op].bitfield.reg16
3727               || i.types[op].bitfield.reg32)
3728              && (i.tm.operand_types[op].bitfield.reg32
3729                  || i.tm.operand_types[op].bitfield.acc))
3730       {
3731         /* Prohibit these changes in the 64bit mode, since the
3732            lowering is more complicated.  */
3733         if (intel_syntax
3734             && i.tm.base_opcode == 0xf20f2d
3735             && !i.types[0].bitfield.regxmm)
3736           {
3737             /* cvtsd2si converts QWORD memory to Reg32.  We don't want
3738                REX byte. */
3739             i.suffix = LONG_MNEM_SUFFIX;
3740           }
3741         else
3742           {
3743             as_bad (_("Incorrect register `%s%s' used with `%c' suffix"),
3744                     register_prefix, i.op[op].regs->reg_name,
3745                     i.suffix);
3746             return 0;
3747           }
3748       }
3749   return 1;
3750 }
3751
3752 static int
3753 check_word_reg (void)
3754 {
3755   int op;
3756   for (op = i.operands; --op >= 0;)
3757     /* Reject eight bit registers, except where the template requires
3758        them. (eg. movzb)  */
3759     if (i.types[op].bitfield.reg8
3760         && (i.tm.operand_types[op].bitfield.reg16
3761             || i.tm.operand_types[op].bitfield.reg32
3762             || i.tm.operand_types[op].bitfield.acc))
3763       {
3764         as_bad (_("`%s%s' not allowed with `%s%c'"),
3765                 register_prefix,
3766                 i.op[op].regs->reg_name,
3767                 i.tm.name,
3768                 i.suffix);
3769         return 0;
3770       }
3771   /* Warn if the e prefix on a general reg is present.  */
3772     else if ((!quiet_warnings || flag_code == CODE_64BIT)
3773              && i.types[op].bitfield.reg32
3774              && (i.tm.operand_types[op].bitfield.reg16
3775                  || i.tm.operand_types[op].bitfield.acc))
3776       {
3777         /* Prohibit these changes in the 64bit mode, since the
3778            lowering is more complicated.  */
3779         if (flag_code == CODE_64BIT)
3780           {
3781             as_bad (_("Incorrect register `%s%s' used with `%c' suffix"),
3782                     register_prefix, i.op[op].regs->reg_name,
3783                     i.suffix);
3784             return 0;
3785           }
3786         else
3787 #if REGISTER_WARNINGS
3788           as_warn (_("using `%s%s' instead of `%s%s' due to `%c' suffix"),
3789                    register_prefix,
3790                    (i.op[op].regs + REGNAM_AX - REGNAM_EAX)->reg_name,
3791                    register_prefix,
3792                    i.op[op].regs->reg_name,
3793                    i.suffix);
3794 #endif
3795       }
3796   return 1;
3797 }
3798
3799 static int
3800 update_imm (unsigned int j)
3801 {
3802   i386_operand_type overlap;
3803
3804   overlap = operand_type_and (i.types[j], i.tm.operand_types[j]);
3805   if ((overlap.bitfield.imm8
3806        || overlap.bitfield.imm8s
3807        || overlap.bitfield.imm16
3808        || overlap.bitfield.imm32
3809        || overlap.bitfield.imm32s
3810        || overlap.bitfield.imm64)
3811       && !UINTS_EQUAL (overlap, imm8)
3812       && !UINTS_EQUAL (overlap, imm8s)
3813       && !UINTS_EQUAL (overlap, imm16)
3814       && !UINTS_EQUAL (overlap, imm32)
3815       && !UINTS_EQUAL (overlap, imm32s)
3816       && !UINTS_EQUAL (overlap, imm64))
3817     {
3818       if (i.suffix)
3819         {
3820           i386_operand_type temp;
3821
3822           UINTS_CLEAR (temp);
3823           if (i.suffix == BYTE_MNEM_SUFFIX) 
3824             {
3825               temp.bitfield.imm8 = overlap.bitfield.imm8;
3826               temp.bitfield.imm8s = overlap.bitfield.imm8s;
3827             }
3828           else if (i.suffix == WORD_MNEM_SUFFIX)
3829             temp.bitfield.imm16 = overlap.bitfield.imm16;
3830           else if (i.suffix == QWORD_MNEM_SUFFIX)
3831             {
3832               temp.bitfield.imm64 = overlap.bitfield.imm64;
3833               temp.bitfield.imm32s = overlap.bitfield.imm32s;
3834             }
3835           else
3836             temp.bitfield.imm32 = overlap.bitfield.imm32;
3837           overlap = temp;
3838         }
3839       else if (UINTS_EQUAL (overlap, imm16_32_32s)
3840                || UINTS_EQUAL (overlap, imm16_32)
3841                || UINTS_EQUAL (overlap, imm16_32s))
3842         {
3843           UINTS_CLEAR (overlap);
3844           if ((flag_code == CODE_16BIT) ^ (i.prefix[DATA_PREFIX] != 0))
3845             overlap.bitfield.imm16 = 1;
3846           else
3847             overlap.bitfield.imm32s = 1;
3848         }
3849       if (!UINTS_EQUAL (overlap, imm8)
3850           && !UINTS_EQUAL (overlap, imm8s)
3851           && !UINTS_EQUAL (overlap, imm16)
3852           && !UINTS_EQUAL (overlap, imm32)
3853           && !UINTS_EQUAL (overlap, imm32s)
3854           && !UINTS_EQUAL (overlap, imm64))
3855         {
3856           as_bad (_("no instruction mnemonic suffix given; "
3857                     "can't determine immediate size"));
3858           return 0;
3859         }
3860     }
3861   i.types[j] = overlap;
3862
3863   return 1;
3864 }
3865
3866 static int
3867 finalize_imm (void)
3868 {
3869   unsigned int j;
3870
3871   for (j = 0; j < 2; j++)
3872     if (update_imm (j) == 0)
3873       return 0;
3874
3875   i.types[2] = operand_type_and (i.types[2], i.tm.operand_types[2]);
3876   assert (operand_type_check (i.types[2], imm) == 0);
3877
3878   return 1;
3879 }
3880
3881 static void
3882 process_drex (void)
3883 {
3884   i.drex.modrm_reg = None;
3885   i.drex.modrm_regmem = None;
3886
3887   /* SSE5 4 operand instructions must have the destination the same as 
3888      one of the inputs.  Figure out the destination register and cache
3889      it away in the drex field, and remember which fields to use for 
3890      the modrm byte.  */
3891   if (i.tm.opcode_modifier.drex 
3892       && i.tm.opcode_modifier.drexv 
3893       && i.operands == 4)
3894     {
3895       i.tm.extension_opcode = None;
3896
3897       /* Case 1: 4 operand insn, dest = src1, src3 = register.  */
3898       if (i.types[0].bitfield.regxmm != 0
3899           && i.types[1].bitfield.regxmm != 0
3900           && i.types[2].bitfield.regxmm != 0
3901           && i.types[3].bitfield.regxmm != 0
3902           && i.op[0].regs->reg_num == i.op[3].regs->reg_num
3903           && i.op[0].regs->reg_flags == i.op[3].regs->reg_flags)
3904         {
3905           /* Clear the arguments that are stored in drex.  */
3906           UINTS_CLEAR (i.types[0]); 
3907           UINTS_CLEAR (i.types[3]);
3908           i.reg_operands -= 2;
3909
3910           /* There are two different ways to encode a 4 operand 
3911              instruction with all registers that uses OC1 set to 
3912              0 or 1.  Favor setting OC1 to 0 since this mimics the 
3913              actions of other SSE5 assemblers.  Use modrm encoding 2 
3914              for register/register.  Include the high order bit that 
3915              is normally stored in the REX byte in the register
3916              field.  */
3917           i.tm.extension_opcode = DREX_X1_XMEM_X2_X1;
3918           i.drex.modrm_reg = 2;
3919           i.drex.modrm_regmem = 1;
3920           i.drex.reg = (i.op[3].regs->reg_num
3921                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
3922         }
3923
3924       /* Case 2: 4 operand insn, dest = src1, src3 = memory.  */
3925       else if (i.types[0].bitfield.regxmm != 0
3926                && i.types[1].bitfield.regxmm != 0
3927                && (i.types[2].bitfield.regxmm 
3928                    || operand_type_check (i.types[2], anymem))
3929                && i.types[3].bitfield.regxmm != 0
3930                && i.op[0].regs->reg_num == i.op[3].regs->reg_num
3931                && i.op[0].regs->reg_flags == i.op[3].regs->reg_flags)
3932         {
3933           /* clear the arguments that are stored in drex */
3934           UINTS_CLEAR (i.types[0]);
3935           UINTS_CLEAR (i.types[3]);
3936           i.reg_operands -= 2;
3937
3938           /* Specify the modrm encoding for memory addressing.  Include 
3939              the high order bit that is normally stored in the REX byte
3940              in the register field.  */
3941           i.tm.extension_opcode = DREX_X1_X2_XMEM_X1;
3942           i.drex.modrm_reg = 1;
3943           i.drex.modrm_regmem = 2;
3944           i.drex.reg = (i.op[3].regs->reg_num
3945                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
3946         }
3947
3948       /* Case 3: 4 operand insn, dest = src1, src2 = memory.  */
3949       else if (i.types[0].bitfield.regxmm != 0
3950                && operand_type_check (i.types[1], anymem) != 0
3951                && i.types[2].bitfield.regxmm != 0
3952                && i.types[3].bitfield.regxmm != 0
3953                && i.op[0].regs->reg_num == i.op[3].regs->reg_num
3954                && i.op[0].regs->reg_flags == i.op[3].regs->reg_flags)
3955         {
3956           /* Clear the arguments that are stored in drex.  */
3957           UINTS_CLEAR (i.types[0]);
3958           UINTS_CLEAR (i.types[3]);
3959           i.reg_operands -= 2;
3960
3961           /* Specify the modrm encoding for memory addressing.  Include
3962              the high order bit that is normally stored in the REX byte 
3963              in the register field.  */
3964           i.tm.extension_opcode = DREX_X1_XMEM_X2_X1;
3965           i.drex.modrm_reg = 2;
3966           i.drex.modrm_regmem = 1;
3967           i.drex.reg = (i.op[3].regs->reg_num
3968                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
3969         }
3970
3971       /* Case 4: 4 operand insn, dest = src3, src2 = register. */
3972       else if (i.types[0].bitfield.regxmm != 0
3973                && i.types[1].bitfield.regxmm != 0
3974                && i.types[2].bitfield.regxmm != 0
3975                && i.types[3].bitfield.regxmm != 0
3976                && i.op[2].regs->reg_num == i.op[3].regs->reg_num
3977                && i.op[2].regs->reg_flags == i.op[3].regs->reg_flags)
3978         {
3979           /* clear the arguments that are stored in drex */
3980           UINTS_CLEAR (i.types[2]);
3981           UINTS_CLEAR (i.types[3]);
3982           i.reg_operands -= 2;
3983
3984           /* There are two different ways to encode a 4 operand 
3985              instruction with all registers that uses OC1 set to 
3986              0 or 1.  Favor setting OC1 to 0 since this mimics the 
3987              actions of other SSE5 assemblers.  Use modrm encoding 
3988              2 for register/register.  Include the high order bit that 
3989              is normally stored in the REX byte in the register 
3990              field.  */
3991           i.tm.extension_opcode = DREX_XMEM_X1_X2_X2;
3992           i.drex.modrm_reg = 1;
3993           i.drex.modrm_regmem = 0;
3994
3995           /* Remember the register, including the upper bits */
3996           i.drex.reg = (i.op[3].regs->reg_num
3997                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
3998         }
3999
4000       /* Case 5: 4 operand insn, dest = src3, src2 = memory.  */
4001       else if (i.types[0].bitfield.regxmm != 0
4002                && (i.types[1].bitfield.regxmm 
4003                    || operand_type_check (i.types[1], anymem)) 
4004                && i.types[2].bitfield.regxmm != 0
4005                && i.types[3].bitfield.regxmm != 0
4006                && i.op[2].regs->reg_num == i.op[3].regs->reg_num
4007                && i.op[2].regs->reg_flags == i.op[3].regs->reg_flags)
4008         {
4009           /* Clear the arguments that are stored in drex.  */
4010           UINTS_CLEAR (i.types[2]);
4011           UINTS_CLEAR (i.types[3]);
4012           i.reg_operands -= 2;
4013
4014           /* Specify the modrm encoding and remember the register 
4015              including the bits normally stored in the REX byte. */
4016           i.tm.extension_opcode = DREX_X1_XMEM_X2_X2;
4017           i.drex.modrm_reg = 0;
4018           i.drex.modrm_regmem = 1;
4019           i.drex.reg = (i.op[3].regs->reg_num
4020                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
4021         }
4022
4023       /* Case 6: 4 operand insn, dest = src3, src1 = memory.  */
4024       else if (operand_type_check (i.types[0], anymem) != 0
4025                && i.types[1].bitfield.regxmm != 0
4026                && i.types[2].bitfield.regxmm != 0
4027                && i.types[3].bitfield.regxmm != 0
4028                && i.op[2].regs->reg_num == i.op[3].regs->reg_num
4029                && i.op[2].regs->reg_flags == i.op[3].regs->reg_flags)
4030         {
4031           /* clear the arguments that are stored in drex */
4032           UINTS_CLEAR (i.types[2]);
4033           UINTS_CLEAR (i.types[3]);
4034           i.reg_operands -= 2;
4035
4036           /* Specify the modrm encoding and remember the register 
4037              including the bits normally stored in the REX byte. */
4038           i.tm.extension_opcode = DREX_XMEM_X1_X2_X2;
4039           i.drex.modrm_reg = 1;
4040           i.drex.modrm_regmem = 0;
4041           i.drex.reg = (i.op[3].regs->reg_num
4042                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
4043         }
4044
4045       else
4046         as_bad (_("Incorrect operands for the '%s' instruction"), 
4047                 i.tm.name);
4048     }
4049
4050   /* SSE5 instructions with the DREX byte where the only memory operand 
4051      is in the 2nd argument, and the first and last xmm register must 
4052      match, and is encoded in the DREX byte. */
4053   else if (i.tm.opcode_modifier.drex 
4054            && !i.tm.opcode_modifier.drexv 
4055            && i.operands == 4)
4056     {
4057       /* Case 1: 4 operand insn, dest = src1, src3 = reg/mem.  */
4058       if (i.types[0].bitfield.regxmm != 0
4059           && (i.types[1].bitfield.regxmm 
4060               || operand_type_check(i.types[1], anymem)) 
4061           && i.types[2].bitfield.regxmm != 0
4062           && i.types[3].bitfield.regxmm != 0
4063           && i.op[0].regs->reg_num == i.op[3].regs->reg_num
4064           && i.op[0].regs->reg_flags == i.op[3].regs->reg_flags)
4065         {
4066           /* clear the arguments that are stored in drex */
4067           UINTS_CLEAR (i.types[0]);
4068           UINTS_CLEAR (i.types[3]);
4069           i.reg_operands -= 2;
4070
4071           /* Specify the modrm encoding and remember the register 
4072              including the high bit normally stored in the REX 
4073              byte.  */
4074           i.drex.modrm_reg = 2;
4075           i.drex.modrm_regmem = 1;
4076           i.drex.reg = (i.op[3].regs->reg_num
4077                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
4078         }
4079
4080       else
4081         as_bad (_("Incorrect operands for the '%s' instruction"), 
4082                 i.tm.name);
4083     }
4084
4085   /* SSE5 3 operand instructions that the result is a register, being 
4086      either operand can be a memory operand, using OC0 to note which 
4087      one is the memory.  */
4088   else if (i.tm.opcode_modifier.drex 
4089            && i.tm.opcode_modifier.drexv
4090            && i.operands == 3)
4091     {
4092       i.tm.extension_opcode = None;
4093
4094       /* Case 1: 3 operand insn, src1 = register.  */
4095       if (i.types[0].bitfield.regxmm != 0
4096           && i.types[1].bitfield.regxmm != 0
4097           && i.types[2].bitfield.regxmm != 0)
4098         {
4099           /* Clear the arguments that are stored in drex.  */
4100           UINTS_CLEAR (i.types[2]);
4101           i.reg_operands--;
4102
4103           /* Specify the modrm encoding and remember the register 
4104              including the high bit normally stored in the REX byte.  */
4105           i.tm.extension_opcode = DREX_XMEM_X1_X2;
4106           i.drex.modrm_reg = 1;
4107           i.drex.modrm_regmem = 0;
4108           i.drex.reg = (i.op[2].regs->reg_num
4109                         + ((i.op[2].regs->reg_flags & RegRex) ? 8 : 0));
4110         }
4111
4112       /* Case 2: 3 operand insn, src1 = memory.  */
4113       else if (operand_type_check (i.types[0], anymem) != 0
4114                && i.types[1].bitfield.regxmm != 0
4115                && i.types[2].bitfield.regxmm != 0)
4116         {
4117           /* Clear the arguments that are stored in drex.  */
4118           UINTS_CLEAR (i.types[2]);
4119           i.reg_operands--;
4120
4121           /* Specify the modrm encoding and remember the register 
4122              including the high bit normally stored in the REX 
4123              byte.  */
4124           i.tm.extension_opcode = DREX_XMEM_X1_X2;
4125           i.drex.modrm_reg = 1;
4126           i.drex.modrm_regmem = 0;
4127           i.drex.reg = (i.op[2].regs->reg_num
4128                         + ((i.op[2].regs->reg_flags & RegRex) ? 8 : 0));
4129         }
4130
4131       /* Case 3: 3 operand insn, src2 = memory.  */
4132       else if (i.types[0].bitfield.regxmm != 0
4133                && operand_type_check (i.types[1], anymem) != 0
4134                && i.types[2].bitfield.regxmm != 0)
4135         {
4136           /* Clear the arguments that are stored in drex.  */
4137           UINTS_CLEAR (i.types[2]);
4138           i.reg_operands--;
4139
4140           /* Specify the modrm encoding and remember the register 
4141              including the high bit normally stored in the REX byte.  */
4142           i.tm.extension_opcode = DREX_X1_XMEM_X2;
4143           i.drex.modrm_reg = 0;
4144           i.drex.modrm_regmem = 1;
4145           i.drex.reg = (i.op[2].regs->reg_num
4146                         + ((i.op[2].regs->reg_flags & RegRex) ? 8 : 0));
4147         }
4148
4149       else
4150         as_bad (_("Incorrect operands for the '%s' instruction"), 
4151                 i.tm.name);
4152     }
4153
4154   /* SSE5 4 operand instructions that are the comparison instructions 
4155      where the first operand is the immediate value of the comparison 
4156      to be done.  */
4157   else if (i.tm.opcode_modifier.drexc != 0 && i.operands == 4)
4158     {
4159       /* Case 1: 4 operand insn, src1 = reg/memory. */
4160       if (operand_type_check (i.types[0], imm) != 0
4161           && (i.types[1].bitfield.regxmm 
4162               || operand_type_check (i.types[1], anymem)) 
4163           && i.types[2].bitfield.regxmm != 0
4164           && i.types[3].bitfield.regxmm != 0)
4165         {
4166           /* clear the arguments that are stored in drex */
4167           UINTS_CLEAR (i.types[3]);
4168           i.reg_operands--;
4169
4170           /* Specify the modrm encoding and remember the register 
4171              including the high bit normally stored in the REX byte.  */
4172           i.drex.modrm_reg = 2;
4173           i.drex.modrm_regmem = 1;
4174           i.drex.reg = (i.op[3].regs->reg_num
4175                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
4176         }
4177
4178       /* Case 2: 3 operand insn with ImmExt that places the 
4179          opcode_extension as an immediate argument.  This is used for 
4180          all of the varients of comparison that supplies the appropriate
4181          value as part of the instruction.  */
4182       else if ((i.types[0].bitfield.regxmm
4183                 || operand_type_check (i.types[0], anymem)) 
4184                && i.types[1].bitfield.regxmm != 0
4185                && i.types[2].bitfield.regxmm != 0
4186                && operand_type_check (i.types[3], imm) != 0)
4187         {
4188           /* clear the arguments that are stored in drex */
4189           UINTS_CLEAR (i.types[2]);
4190           i.reg_operands--;
4191
4192           /* Specify the modrm encoding and remember the register 
4193              including the high bit normally stored in the REX byte.  */
4194           i.drex.modrm_reg = 1;
4195           i.drex.modrm_regmem = 0;
4196           i.drex.reg = (i.op[2].regs->reg_num
4197                         + ((i.op[2].regs->reg_flags & RegRex) ? 8 : 0));
4198         }
4199
4200       else
4201         as_bad (_("Incorrect operands for the '%s' instruction"), 
4202                 i.tm.name);
4203     }
4204
4205   else if (i.tm.opcode_modifier.drex 
4206            || i.tm.opcode_modifier.drexv 
4207            || i.tm.opcode_modifier.drexc)
4208     as_bad (_("Internal error for the '%s' instruction"), i.tm.name);
4209 }
4210
4211 static int
4212 process_operands (void)
4213 {
4214   /* Default segment register this instruction will use for memory
4215      accesses.  0 means unknown.  This is only for optimizing out
4216      unnecessary segment overrides.  */
4217   const seg_entry *default_seg = 0;
4218
4219   /* Handle all of the DREX munging that SSE5 needs.  */
4220   if (i.tm.opcode_modifier.drex 
4221       || i.tm.opcode_modifier.drexv 
4222       || i.tm.opcode_modifier.drexc)
4223     process_drex ();
4224
4225   /* The imul $imm, %reg instruction is converted into
4226      imul $imm, %reg, %reg, and the clr %reg instruction
4227      is converted into xor %reg, %reg.  */
4228   if (i.tm.opcode_modifier.regkludge)
4229     {
4230        if (i.tm.cpu_flags.bitfield.cpusse4_1)
4231          {
4232            /* The first operand in instruction blendvpd, blendvps and
4233               pblendvb in SSE4.1 is implicit and must be xmm0.  */
4234            assert (i.operands == 3
4235                    && i.reg_operands >= 2
4236                    && UINTS_EQUAL (i.types[0], regxmm));
4237            if (i.op[0].regs->reg_num != 0)
4238              {
4239                if (intel_syntax)
4240                  as_bad (_("the last operand of `%s' must be `%sxmm0'"),
4241                          i.tm.name, register_prefix);
4242                else
4243                  as_bad (_("the first operand of `%s' must be `%sxmm0'"),
4244                          i.tm.name, register_prefix);
4245                return 0;
4246              }
4247            i.op[0] = i.op[1];
4248            i.op[1] = i.op[2];
4249            i.types[0] = i.types[1];
4250            i.types[1] = i.types[2];
4251            i.operands--;
4252            i.reg_operands--;
4253
4254            /* We need to adjust fields in i.tm since they are used by
4255               build_modrm_byte.  */
4256            i.tm.operand_types [0] = i.tm.operand_types [1];
4257            i.tm.operand_types [1] = i.tm.operand_types [2];
4258            i.tm.operands--;
4259          }
4260        else
4261          {
4262            unsigned int first_reg_op;
4263            
4264            if (operand_type_check (i.types[0], reg))
4265              first_reg_op = 0;
4266            else
4267              first_reg_op = 1;
4268            /* Pretend we saw the extra register operand.  */
4269            assert (i.reg_operands == 1
4270                    && i.op[first_reg_op + 1].regs == 0);
4271            i.op[first_reg_op + 1].regs = i.op[first_reg_op].regs;
4272            i.types[first_reg_op + 1] = i.types[first_reg_op];
4273            i.operands++;
4274            i.reg_operands++;
4275          }
4276     }
4277
4278   if (i.tm.opcode_modifier.shortform)
4279     {
4280       if (i.types[0].bitfield.sreg2
4281           || i.types[0].bitfield.sreg3)
4282         {
4283           if (i.tm.base_opcode == POP_SEG_SHORT
4284               && i.op[0].regs->reg_num == 1)
4285             {
4286               as_bad (_("you can't `pop %%cs'"));
4287               return 0;
4288             }
4289           i.tm.base_opcode |= (i.op[0].regs->reg_num << 3);
4290           if ((i.op[0].regs->reg_flags & RegRex) != 0)
4291             i.rex |= REX_B;
4292         }
4293       else
4294         {
4295           /* The register or float register operand is in operand 
4296              0 or 1.  */
4297           unsigned int op;
4298           
4299            if (i.types[0].bitfield.floatreg
4300                || operand_type_check (i.types[0], reg))
4301              op = 0;
4302            else
4303              op = 1;
4304           /* Register goes in low 3 bits of opcode.  */
4305           i.tm.base_opcode |= i.op[op].regs->reg_num;
4306           if ((i.op[op].regs->reg_flags & RegRex) != 0)
4307             i.rex |= REX_B;
4308           if (!quiet_warnings && i.tm.opcode_modifier.ugh)
4309             {
4310               /* Warn about some common errors, but press on regardless.
4311                  The first case can be generated by gcc (<= 2.8.1).  */
4312               if (i.operands == 2)
4313                 {
4314                   /* Reversed arguments on faddp, fsubp, etc.  */
4315                   as_warn (_("translating to `%s %s%s,%s%s'"), i.tm.name,
4316                            register_prefix, i.op[1].regs->reg_name,
4317                            register_prefix, i.op[0].regs->reg_name);
4318                 }
4319               else
4320                 {
4321                   /* Extraneous `l' suffix on fp insn.  */
4322                   as_warn (_("translating to `%s %s%s'"), i.tm.name,
4323                            register_prefix, i.op[0].regs->reg_name);
4324                 }
4325             }
4326         }
4327     }
4328   else if (i.tm.opcode_modifier.modrm)
4329     {
4330       /* The opcode is completed (modulo i.tm.extension_opcode which
4331          must be put into the modrm byte).  Now, we make the modrm and
4332          index base bytes based on all the info we've collected.  */
4333
4334       default_seg = build_modrm_byte ();
4335     }
4336   else if ((i.tm.base_opcode & ~0x3) == MOV_AX_DISP32)
4337     {
4338       default_seg = &ds;
4339     }
4340   else if (i.tm.opcode_modifier.isstring)
4341     {
4342       /* For the string instructions that allow a segment override
4343          on one of their operands, the default segment is ds.  */
4344       default_seg = &ds;
4345     }
4346
4347   if (i.tm.base_opcode == 0x8d /* lea */
4348       && i.seg[0]
4349       && !quiet_warnings)
4350     as_warn (_("segment override on `%s' is ineffectual"), i.tm.name);
4351
4352   /* If a segment was explicitly specified, and the specified segment
4353      is not the default, use an opcode prefix to select it.  If we
4354      never figured out what the default segment is, then default_seg
4355      will be zero at this point, and the specified segment prefix will
4356      always be used.  */
4357   if ((i.seg[0]) && (i.seg[0] != default_seg))
4358     {
4359       if (!add_prefix (i.seg[0]->seg_prefix))
4360         return 0;
4361     }
4362   return 1;
4363 }
4364
4365 static const seg_entry *
4366 build_modrm_byte (void)
4367 {
4368   const seg_entry *default_seg = 0;
4369
4370   /* SSE5 4 operand instructions are encoded in such a way that one of 
4371      the inputs must match the destination register.  Process_drex hides
4372      the 3rd argument in the drex field, so that by the time we get 
4373      here, it looks to GAS as if this is a 2 operand instruction.  */
4374   if ((i.tm.opcode_modifier.drex 
4375        || i.tm.opcode_modifier.drexv 
4376        || i.tm.opcode_modifier.drexc) != 0 
4377       && i.reg_operands == 2)
4378     {
4379       const reg_entry *reg = i.op[i.drex.modrm_reg].regs;
4380       const reg_entry *regmem = i.op[i.drex.modrm_regmem].regs;
4381
4382       i.rm.reg = reg->reg_num;
4383       i.rm.regmem = regmem->reg_num;
4384       i.rm.mode = 3;
4385       if ((reg->reg_flags & RegRex) != 0)
4386         i.rex |= REX_R;
4387       if ((regmem->reg_flags & RegRex) != 0)
4388         i.rex |= REX_B;
4389     }
4390
4391   /* i.reg_operands MUST be the number of real register operands;
4392      implicit registers do not count.  */
4393   else if (i.reg_operands == 2)
4394     {
4395       unsigned int source, dest;
4396
4397       switch (i.operands)
4398         {
4399         case 2:
4400           source = 0;
4401           break;
4402         case 3:
4403           /* When there are 3 operands, one of them may be immediate,
4404              which may be the first or the last operand.  Otherwise,
4405              the first operand must be shift count register (cl). */
4406           assert (i.imm_operands == 1
4407                   || (i.imm_operands == 0
4408                       && i.types[0].bitfield.shiftcount));
4409           if (operand_type_check (i.types[0], imm)
4410               || i.types[0].bitfield.shiftcount)
4411             source = 1;
4412           else
4413             source = 0;
4414           break;
4415         case 4:
4416           /* When there are 4 operands, the first two must be immediate
4417              operands. The source operand will be the 3rd one.  */
4418           assert (i.imm_operands == 2
4419                   && operand_type_check (i.types[0], imm)
4420                   && operand_type_check (i.types[1], imm));
4421           source = 2;
4422           break;
4423         default:
4424           abort ();
4425         }
4426
4427       dest = source + 1;
4428
4429       i.rm.mode = 3;
4430       /* One of the register operands will be encoded in the i.tm.reg
4431          field, the other in the combined i.tm.mode and i.tm.regmem
4432          fields.  If no form of this instruction supports a memory
4433          destination operand, then we assume the source operand may
4434          sometimes be a memory operand and so we need to store the
4435          destination in the i.rm.reg field.  */
4436       if (!i.tm.operand_types[dest].bitfield.regmem
4437           && operand_type_check (i.tm.operand_types[dest], anymem) == 0)
4438         {
4439           i.rm.reg = i.op[dest].regs->reg_num;
4440           i.rm.regmem = i.op[source].regs->reg_num;
4441           if ((i.op[dest].regs->reg_flags & RegRex) != 0)
4442             i.rex |= REX_R;
4443           if ((i.op[source].regs->reg_flags & RegRex) != 0)
4444             i.rex |= REX_B;
4445         }
4446       else
4447         {
4448           i.rm.reg = i.op[source].regs->reg_num;
4449           i.rm.regmem = i.op[dest].regs->reg_num;
4450           if ((i.op[dest].regs->reg_flags & RegRex) != 0)
4451             i.rex |= REX_B;
4452           if ((i.op[source].regs->reg_flags & RegRex) != 0)
4453             i.rex |= REX_R;
4454         }
4455       if (flag_code != CODE_64BIT && (i.rex & (REX_R | REX_B)))
4456         {
4457           if (!i.types[0].bitfield.control
4458               && !i.types[1].bitfield.control)
4459             abort ();
4460           i.rex &= ~(REX_R | REX_B);
4461           add_prefix (LOCK_PREFIX_OPCODE);
4462         }
4463     }
4464   else
4465     {                   /* If it's not 2 reg operands...  */
4466       if (i.mem_operands)
4467         {
4468           unsigned int fake_zero_displacement = 0;
4469           unsigned int op;
4470
4471           /* This has been precalculated for SSE5 instructions 
4472              that have a DREX field earlier in process_drex.  */
4473           if ((i.tm.opcode_modifier.drex 
4474                || i.tm.opcode_modifier.drexv 
4475                || i.tm.opcode_modifier.drexc) != 0)
4476             op = i.drex.modrm_regmem;
4477           else
4478             {
4479           for (op = 0; op < i.operands; op++)
4480             if (operand_type_check (i.types[op], anymem))
4481               break;
4482           assert (op < i.operands);
4483             }
4484
4485           default_seg = &ds;
4486
4487           if (i.base_reg == 0)
4488             {
4489               i.rm.mode = 0;
4490               if (!i.disp_operands)
4491                 fake_zero_displacement = 1;
4492               if (i.index_reg == 0)
4493                 {
4494                   /* Operand is just <disp>  */
4495                   if (flag_code == CODE_64BIT)
4496                     {
4497                       /* 64bit mode overwrites the 32bit absolute
4498                          addressing by RIP relative addressing and
4499                          absolute addressing is encoded by one of the
4500                          redundant SIB forms.  */
4501                       i.rm.regmem = ESCAPE_TO_TWO_BYTE_ADDRESSING;
4502                       i.sib.base = NO_BASE_REGISTER;
4503                       i.sib.index = NO_INDEX_REGISTER;
4504                       i.types[op] = ((i.prefix[ADDR_PREFIX] == 0)
4505                                      ? disp32s : disp32);
4506                     }
4507                   else if ((flag_code == CODE_16BIT)
4508                            ^ (i.prefix[ADDR_PREFIX] != 0))
4509                     {
4510                       i.rm.regmem = NO_BASE_REGISTER_16;
4511                       i.types[op] = disp16;
4512                     }
4513                   else
4514                     {
4515                       i.rm.regmem = NO_BASE_REGISTER;
4516                       i.types[op] = disp32;
4517                     }
4518                 }
4519               else /* !i.base_reg && i.index_reg  */
4520                 {
4521                   i.sib.index = i.index_reg->reg_num;
4522                   i.sib.base = NO_BASE_REGISTER;
4523                   i.sib.scale = i.log2_scale_factor;
4524                   i.rm.regmem = ESCAPE_TO_TWO_BYTE_ADDRESSING;
4525                   i.types[op].bitfield.disp8 = 0;
4526                   i.types[op].bitfield.disp16 = 0;
4527                   i.types[op].bitfield.disp64 = 0;
4528                   if (flag_code != CODE_64BIT)
4529                     {
4530                       /* Must be 32 bit */
4531                       i.types[op].bitfield.disp32 = 1;
4532                       i.types[op].bitfield.disp32s = 0;
4533                     }
4534                   else
4535                     {
4536                       i.types[op].bitfield.disp32 = 0;
4537                       i.types[op].bitfield.disp32s = 1;
4538                     }
4539                   if ((i.index_reg->reg_flags & RegRex) != 0)
4540                     i.rex |= REX_X;
4541                 }
4542             }
4543           /* RIP addressing for 64bit mode.  */
4544           else if (UINTS_EQUAL (i.base_reg->reg_type, baseindex))
4545             {
4546               i.rm.regmem = NO_BASE_REGISTER;
4547               i.types[op].bitfield.disp8 = 0;
4548               i.types[op].bitfield.disp16 = 0;
4549               i.types[op].bitfield.disp32 = 0;
4550               i.types[op].bitfield.disp32s = 1;
4551               i.types[op].bitfield.disp64 = 0;
4552               i.flags[op] |= Operand_PCrel;
4553               if (! i.disp_operands)
4554                 fake_zero_displacement = 1;
4555             }
4556           else if (i.base_reg->reg_type.bitfield.reg16)
4557             {
4558               switch (i.base_reg->reg_num)
4559                 {
4560                 case 3: /* (%bx)  */
4561                   if (i.index_reg == 0)
4562                     i.rm.regmem = 7;
4563                   else /* (%bx,%si) -> 0, or (%bx,%di) -> 1  */
4564                     i.rm.regmem = i.index_reg->reg_num - 6;
4565                   break;
4566                 case 5: /* (%bp)  */
4567                   default_seg = &ss;
4568                   if (i.index_reg == 0)
4569                     {
4570                       i.rm.regmem = 6;
4571                       if (operand_type_check (i.types[op], disp) == 0)
4572                         {
4573                           /* fake (%bp) into 0(%bp)  */
4574                           i.types[op].bitfield.disp8 = 1;
4575                           fake_zero_displacement = 1;
4576                         }
4577                     }
4578                   else /* (%bp,%si) -> 2, or (%bp,%di) -> 3  */
4579                     i.rm.regmem = i.index_reg->reg_num - 6 + 2;
4580                   break;
4581                 default: /* (%si) -> 4 or (%di) -> 5  */
4582                   i.rm.regmem = i.base_reg->reg_num - 6 + 4;
4583                 }
4584               i.rm.mode = mode_from_disp_size (i.types[op]);
4585             }
4586           else /* i.base_reg and 32/64 bit mode  */
4587             {
4588               if (flag_code == CODE_64BIT
4589                   && operand_type_check (i.types[op], disp))
4590                 {
4591                   i386_operand_type temp;
4592                   UINTS_CLEAR (temp);
4593                   temp.bitfield.disp8 = i.types[op].bitfield.disp8;
4594                   i.types[op] = temp;
4595                   if (i.prefix[ADDR_PREFIX] == 0)
4596                     i.types[op].bitfield.disp32s = 1;
4597                   else
4598                     i.types[op].bitfield.disp32 = 1;
4599                 }
4600
4601               i.rm.regmem = i.base_reg->reg_num;
4602               if ((i.base_reg->reg_flags & RegRex) != 0)
4603                 i.rex |= REX_B;
4604               i.sib.base = i.base_reg->reg_num;
4605               /* x86-64 ignores REX prefix bit here to avoid decoder
4606                  complications.  */
4607               if ((i.base_reg->reg_num & 7) == EBP_REG_NUM)
4608                 {
4609                   default_seg = &ss;
4610                   if (i.disp_operands == 0)
4611                     {
4612                       fake_zero_displacement = 1;
4613                       i.types[op].bitfield.disp8 = 1;
4614                     }
4615                 }
4616               else if (i.base_reg->reg_num == ESP_REG_NUM)
4617                 {
4618                   default_seg = &ss;
4619                 }
4620               i.sib.scale = i.log2_scale_factor;
4621               if (i.index_reg == 0)
4622                 {
4623                   /* <disp>(%esp) becomes two byte modrm with no index
4624                      register.  We've already stored the code for esp
4625                      in i.rm.regmem ie. ESCAPE_TO_TWO_BYTE_ADDRESSING.
4626                      Any base register besides %esp will not use the
4627                      extra modrm byte.  */
4628                   i.sib.index = NO_INDEX_REGISTER;
4629 #if !SCALE1_WHEN_NO_INDEX
4630                   /* Another case where we force the second 
4631                      modrm byte.  */
4632                   if (i.log2_scale_factor)
4633                     i.rm.regmem = ESCAPE_TO_TWO_BYTE_ADDRESSING;
4634 #endif
4635                 }
4636               else
4637                 {
4638                   i.sib.index = i.index_reg->reg_num;
4639                   i.rm.regmem = ESCAPE_TO_TWO_BYTE_ADDRESSING;
4640                   if ((i.index_reg->reg_flags & RegRex) != 0)
4641                     i.rex |= REX_X;
4642                 }
4643
4644               if (i.disp_operands
4645                   && (i.reloc[op] == BFD_RELOC_386_TLS_DESC_CALL
4646                       || i.reloc[op] == BFD_RELOC_X86_64_TLSDESC_CALL))
4647                 i.rm.mode = 0;
4648               else
4649                 i.rm.mode = mode_from_disp_size (i.types[op]);
4650             }
4651
4652           if (fake_zero_displacement)
4653             {
4654               /* Fakes a zero displacement assuming that i.types[op]
4655                  holds the correct displacement size.  */
4656               expressionS *exp;
4657
4658               assert (i.op[op].disps == 0);
4659               exp = &disp_expressions[i.disp_operands++];
4660               i.op[op].disps = exp;
4661               exp->X_op = O_constant;
4662               exp->X_add_number = 0;
4663               exp->X_add_symbol = (symbolS *) 0;
4664               exp->X_op_symbol = (symbolS *) 0;
4665             }
4666         }
4667
4668       /* Fill in i.rm.reg or i.rm.regmem field with register operand
4669          (if any) based on i.tm.extension_opcode.  Again, we must be
4670          careful to make sure that segment/control/debug/test/MMX
4671          registers are coded into the i.rm.reg field.  */
4672       if (i.reg_operands)
4673         {
4674           unsigned int op;
4675
4676           /* This has been precalculated for SSE5 instructions 
4677              that have a DREX field earlier in process_drex.  */
4678           if ((i.tm.opcode_modifier.drex 
4679                || i.tm.opcode_modifier.drexv 
4680                || i.tm.opcode_modifier.drexc) != 0)
4681             {
4682               op = i.drex.modrm_reg;
4683               i.rm.reg = i.op[op].regs->reg_num;
4684               if ((i.op[op].regs->reg_flags & RegRex) != 0)
4685                 i.rex |= REX_R;
4686             }
4687           else
4688             {
4689           for (op = 0; op < i.operands; op++)
4690             if (i.types[op].bitfield.reg8
4691                 || i.types[op].bitfield.reg16
4692                 || i.types[op].bitfield.reg32
4693                 || i.types[op].bitfield.reg64
4694                 || i.types[op].bitfield.regmmx
4695                 || i.types[op].bitfield.regxmm
4696                 || i.types[op].bitfield.sreg2
4697                 || i.types[op].bitfield.sreg3
4698                 || i.types[op].bitfield.control
4699                 || i.types[op].bitfield.debug
4700                 || i.types[op].bitfield.test)
4701               break;
4702           assert (op < i.operands);
4703
4704               /* If there is an extension opcode to put here, the 
4705                  register number must be put into the regmem field.  */
4706           if (i.tm.extension_opcode != None)
4707             {
4708               i.rm.regmem = i.op[op].regs->reg_num;
4709               if ((i.op[op].regs->reg_flags & RegRex) != 0)
4710                 i.rex |= REX_B;
4711             }
4712           else
4713             {
4714               i.rm.reg = i.op[op].regs->reg_num;
4715               if ((i.op[op].regs->reg_flags & RegRex) != 0)
4716                 i.rex |= REX_R;
4717             }
4718             }
4719
4720           /* Now, if no memory operand has set i.rm.mode = 0, 1, 2 we
4721              must set it to 3 to indicate this is a register operand
4722              in the regmem field.  */
4723           if (!i.mem_operands)
4724             i.rm.mode = 3;
4725         }
4726
4727       /* Fill in i.rm.reg field with extension opcode (if any).  */
4728       if (i.tm.extension_opcode != None
4729           && !(i.tm.opcode_modifier.drex 
4730               || i.tm.opcode_modifier.drexv 
4731               || i.tm.opcode_modifier.drexc))
4732         i.rm.reg = i.tm.extension_opcode;
4733     }
4734   return default_seg;
4735 }
4736
4737 static void
4738 output_branch (void)
4739 {
4740   char *p;
4741   int code16;
4742   int prefix;
4743   relax_substateT subtype;
4744   symbolS *sym;
4745   offsetT off;
4746
4747   code16 = 0;
4748   if (flag_code == CODE_16BIT)
4749     code16 = CODE16;
4750
4751   prefix = 0;
4752   if (i.prefix[DATA_PREFIX] != 0)
4753     {
4754       prefix = 1;
4755       i.prefixes -= 1;
4756       code16 ^= CODE16;
4757     }
4758   /* Pentium4 branch hints.  */
4759   if (i.prefix[SEG_PREFIX] == CS_PREFIX_OPCODE /* not taken */
4760       || i.prefix[SEG_PREFIX] == DS_PREFIX_OPCODE /* taken */)
4761     {
4762       prefix++;
4763       i.prefixes--;
4764     }
4765   if (i.prefix[REX_PREFIX] != 0)
4766     {
4767       prefix++;
4768       i.prefixes--;
4769     }
4770
4771   if (i.prefixes != 0 && !intel_syntax)
4772     as_warn (_("skipping prefixes on this instruction"));
4773
4774   /* It's always a symbol;  End frag & setup for relax.
4775      Make sure there is enough room in this frag for the largest
4776      instruction we may generate in md_convert_frag.  This is 2
4777      bytes for the opcode and room for the prefix and largest
4778      displacement.  */
4779   frag_grow (prefix + 2 + 4);
4780   /* Prefix and 1 opcode byte go in fr_fix.  */
4781   p = frag_more (prefix + 1);
4782   if (i.prefix[DATA_PREFIX] != 0)
4783     *p++ = DATA_PREFIX_OPCODE;
4784   if (i.prefix[SEG_PREFIX] == CS_PREFIX_OPCODE
4785       || i.prefix[SEG_PREFIX] == DS_PREFIX_OPCODE)
4786     *p++ = i.prefix[SEG_PREFIX];
4787   if (i.prefix[REX_PREFIX] != 0)
4788     *p++ = i.prefix[REX_PREFIX];
4789   *p = i.tm.base_opcode;
4790
4791   if ((unsigned char) *p == JUMP_PC_RELATIVE)
4792     subtype = ENCODE_RELAX_STATE (UNCOND_JUMP, SMALL);
4793   else if (cpu_arch_flags.bitfield.cpui386)
4794     subtype = ENCODE_RELAX_STATE (COND_JUMP, SMALL);
4795   else
4796     subtype = ENCODE_RELAX_STATE (COND_JUMP86, SMALL);
4797   subtype |= code16;
4798
4799   sym = i.op[0].disps->X_add_symbol;
4800   off = i.op[0].disps->X_add_number;
4801
4802   if (i.op[0].disps->X_op != O_constant
4803       && i.op[0].disps->X_op != O_symbol)
4804     {
4805       /* Handle complex expressions.  */
4806       sym = make_expr_symbol (i.op[0].disps);
4807       off = 0;
4808     }
4809
4810   /* 1 possible extra opcode + 4 byte displacement go in var part.
4811      Pass reloc in fr_var.  */
4812   frag_var (rs_machine_dependent, 5, i.reloc[0], subtype, sym, off, p);
4813 }
4814
4815 static void
4816 output_jump (void)
4817 {
4818   char *p;
4819   int size;
4820   fixS *fixP;
4821
4822   if (i.tm.opcode_modifier.jumpbyte)
4823     {
4824       /* This is a loop or jecxz type instruction.  */
4825       size = 1;
4826       if (i.prefix[ADDR_PREFIX] != 0)
4827         {
4828           FRAG_APPEND_1_CHAR (ADDR_PREFIX_OPCODE);
4829           i.prefixes -= 1;
4830         }
4831       /* Pentium4 branch hints.  */
4832       if (i.prefix[SEG_PREFIX] == CS_PREFIX_OPCODE /* not taken */
4833           || i.prefix[SEG_PREFIX] == DS_PREFIX_OPCODE /* taken */)
4834         {
4835           FRAG_APPEND_1_CHAR (i.prefix[SEG_PREFIX]);
4836           i.prefixes--;
4837         }
4838     }
4839   else
4840     {
4841       int code16;
4842
4843       code16 = 0;
4844       if (flag_code == CODE_16BIT)
4845         code16 = CODE16;
4846
4847       if (i.prefix[DATA_PREFIX] != 0)
4848         {
4849           FRAG_APPEND_1_CHAR (DATA_PREFIX_OPCODE);
4850           i.prefixes -= 1;
4851           code16 ^= CODE16;
4852         }
4853
4854       size = 4;
4855       if (code16)
4856         size = 2;
4857     }
4858
4859   if (i.prefix[REX_PREFIX] != 0)
4860     {
4861       FRAG_APPEND_1_CHAR (i.prefix[REX_PREFIX]);
4862       i.prefixes -= 1;
4863     }
4864
4865   if (i.prefixes != 0 && !intel_syntax)
4866     as_warn (_("skipping prefixes on this instruction"));
4867
4868   p = frag_more (1 + size);
4869   *p++ = i.tm.base_opcode;
4870
4871   fixP = fix_new_exp (frag_now, p - frag_now->fr_literal, size,
4872                       i.op[0].disps, 1, reloc (size, 1, 1, i.reloc[0]));
4873
4874   /* All jumps handled here are signed, but don't use a signed limit
4875      check for 32 and 16 bit jumps as we want to allow wrap around at
4876      4G and 64k respectively.  */
4877   if (size == 1)
4878     fixP->fx_signed = 1;
4879 }
4880
4881 static void
4882 output_interseg_jump (void)
4883 {
4884   char *p;
4885   int size;
4886   int prefix;
4887   int code16;
4888
4889   code16 = 0;
4890   if (flag_code == CODE_16BIT)
4891     code16 = CODE16;
4892
4893   prefix = 0;
4894   if (i.prefix[DATA_PREFIX] != 0)
4895     {
4896       prefix = 1;
4897       i.prefixes -= 1;
4898       code16 ^= CODE16;
4899     }
4900   if (i.prefix[REX_PREFIX] != 0)
4901     {
4902       prefix++;
4903       i.prefixes -= 1;
4904     }
4905
4906   size = 4;
4907   if (code16)
4908     size = 2;
4909
4910   if (i.prefixes != 0 && !intel_syntax)
4911     as_warn (_("skipping prefixes on this instruction"));
4912
4913   /* 1 opcode; 2 segment; offset  */
4914   p = frag_more (prefix + 1 + 2 + size);
4915
4916   if (i.prefix[DATA_PREFIX] != 0)
4917     *p++ = DATA_PREFIX_OPCODE;
4918
4919   if (i.prefix[REX_PREFIX] != 0)
4920     *p++ = i.prefix[REX_PREFIX];
4921
4922   *p++ = i.tm.base_opcode;
4923   if (i.op[1].imms->X_op == O_constant)
4924     {
4925       offsetT n = i.op[1].imms->X_add_number;
4926
4927       if (size == 2
4928           && !fits_in_unsigned_word (n)
4929           && !fits_in_signed_word (n))
4930         {
4931           as_bad (_("16-bit jump out of range"));
4932           return;
4933         }
4934       md_number_to_chars (p, n, size);
4935     }
4936   else
4937     fix_new_exp (frag_now, p - frag_now->fr_literal, size,
4938                  i.op[1].imms, 0, reloc (size, 0, 0, i.reloc[1]));
4939   if (i.op[0].imms->X_op != O_constant)
4940     as_bad (_("can't handle non absolute segment in `%s'"),
4941             i.tm.name);
4942   md_number_to_chars (p + size, (valueT) i.op[0].imms->X_add_number, 2);
4943 }
4944
4945 static void
4946 output_insn (void)
4947 {
4948   fragS *insn_start_frag;
4949   offsetT insn_start_off;
4950
4951   /* Tie dwarf2 debug info to the address at the start of the insn.
4952      We can't do this after the insn has been output as the current
4953      frag may have been closed off.  eg. by frag_var.  */
4954   dwarf2_emit_insn (0);
4955
4956   insn_start_frag = frag_now;
4957   insn_start_off = frag_now_fix ();
4958
4959   /* Output jumps.  */
4960   if (i.tm.opcode_modifier.jump)
4961     output_branch ();
4962   else if (i.tm.opcode_modifier.jumpbyte
4963            || i.tm.opcode_modifier.jumpdword)
4964     output_jump ();
4965   else if (i.tm.opcode_modifier.jumpintersegment)
4966     output_interseg_jump ();
4967   else
4968     {
4969       /* Output normal instructions here.  */
4970       char *p;
4971       unsigned char *q;
4972       unsigned int prefix;
4973       int opc_3b;
4974
4975       /* All opcodes on i386 have either 1 or 2 bytes.  SSSE3 and
4976          SSE4 and SSE5 instructions have 3 bytes.  We may use one 
4977          more higher byte to specify a prefix the instruction 
4978          requires. Exclude instructions which are in both SSE4.2 
4979          and ABM.  */
4980       opc_3b = (i.tm.cpu_flags.bitfield.cpussse3
4981                 || i.tm.cpu_flags.bitfield.cpusse5
4982                 || i.tm.cpu_flags.bitfield.cpusse4_1
4983                 || (i.tm.cpu_flags.bitfield.cpusse4_2
4984                     && !i.tm.cpu_flags.bitfield.cpuabm));
4985       if (opc_3b)
4986         {
4987           if (i.tm.base_opcode & 0xff000000)
4988             {
4989               prefix = (i.tm.base_opcode >> 24) & 0xff;
4990               goto check_prefix;
4991             }
4992         }
4993       else if ((i.tm.base_opcode & 0xff0000) != 0)
4994         {
4995           prefix = (i.tm.base_opcode >> 16) & 0xff;
4996           if (i.tm.cpu_flags.bitfield.cpupadlock)
4997             {
4998             check_prefix:
4999               if (prefix != REPE_PREFIX_OPCODE
5000                   || i.prefix[LOCKREP_PREFIX] != REPE_PREFIX_OPCODE)
5001                 add_prefix (prefix);
5002             }
5003           else
5004             add_prefix (prefix);
5005         }
5006
5007       /* The prefix bytes.  */
5008       for (q = i.prefix;
5009            q < i.prefix + sizeof (i.prefix) / sizeof (i.prefix[0]);
5010            q++)
5011         {
5012           if (*q)
5013             {
5014               p = frag_more (1);
5015               md_number_to_chars (p, (valueT) *q, 1);
5016             }
5017         }
5018
5019       /* Now the opcode; be careful about word order here!  */
5020       if (fits_in_unsigned_byte (i.tm.base_opcode))
5021         {
5022           FRAG_APPEND_1_CHAR (i.tm.base_opcode);
5023         }
5024       else
5025         {
5026           if (opc_3b)
5027             {
5028               p = frag_more (3);
5029               *p++ = (i.tm.base_opcode >> 16) & 0xff;
5030             }
5031           else
5032             p = frag_more (2);
5033
5034           /* Put out high byte first: can't use md_number_to_chars!  */
5035           *p++ = (i.tm.base_opcode >> 8) & 0xff;
5036           *p = i.tm.base_opcode & 0xff;
5037
5038           /* On SSE5, encode the OC1 bit in the DREX field if this 
5039              encoding has multiple formats.  */
5040           if (i.tm.opcode_modifier.drex 
5041               && i.tm.opcode_modifier.drexv 
5042               && DREX_OC1 (i.tm.extension_opcode))
5043             *p |= DREX_OC1_MASK;
5044         }
5045
5046       /* Now the modrm byte and sib byte (if present).  */
5047       if (i.tm.opcode_modifier.modrm)
5048         {
5049           p = frag_more (1);
5050           md_number_to_chars (p,
5051                               (valueT) (i.rm.regmem << 0
5052                                         | i.rm.reg << 3
5053                                         | i.rm.mode << 6),
5054                               1);
5055           /* If i.rm.regmem == ESP (4)
5056              && i.rm.mode != (Register mode)
5057              && not 16 bit
5058              ==> need second modrm byte.  */
5059           if (i.rm.regmem == ESCAPE_TO_TWO_BYTE_ADDRESSING
5060               && i.rm.mode != 3
5061               && !(i.base_reg && i.base_reg->reg_type.bitfield.reg16))
5062             {
5063               p = frag_more (1);
5064               md_number_to_chars (p,
5065                                   (valueT) (i.sib.base << 0
5066                                             | i.sib.index << 3
5067                                             | i.sib.scale << 6),
5068                                   1);
5069             }
5070         }
5071
5072       /* Write the DREX byte if needed.  */
5073       if (i.tm.opcode_modifier.drex || i.tm.opcode_modifier.drexc)
5074         {
5075           p = frag_more (1);
5076           *p = (((i.drex.reg & 0xf) << 4) | (i.drex.rex & 0x7));
5077
5078           /* Encode the OC0 bit if this encoding has multiple 
5079              formats.  */
5080           if ((i.tm.opcode_modifier.drex 
5081                || i.tm.opcode_modifier.drexv) 
5082               && DREX_OC0 (i.tm.extension_opcode))
5083             *p |= DREX_OC0_MASK;
5084         }
5085
5086       if (i.disp_operands)
5087         output_disp (insn_start_frag, insn_start_off);
5088
5089       if (i.imm_operands)
5090         output_imm (insn_start_frag, insn_start_off);
5091     }
5092
5093 #ifdef DEBUG386
5094   if (flag_debug)
5095     {
5096       pi ("" /*line*/, &i);
5097     }
5098 #endif /* DEBUG386  */
5099 }
5100
5101 /* Return the size of the displacement operand N.  */
5102
5103 static int
5104 disp_size (unsigned int n)
5105 {
5106   int size = 4;
5107   if (i.types[n].bitfield.disp64)
5108     size = 8;
5109   else if (i.types[n].bitfield.disp8)
5110     size = 1;
5111   else if (i.types[n].bitfield.disp16)
5112     size = 2;
5113   return size;
5114 }
5115
5116 /* Return the size of the immediate operand N.  */
5117
5118 static int
5119 imm_size (unsigned int n)
5120 {
5121   int size = 4;
5122   if (i.types[n].bitfield.imm64)
5123     size = 8;
5124   else if (i.types[n].bitfield.imm8 || i.types[n].bitfield.imm8s)
5125     size = 1;
5126   else if (i.types[n].bitfield.imm16)
5127     size = 2;
5128   return size;
5129 }
5130
5131 static void
5132 output_disp (fragS *insn_start_frag, offsetT insn_start_off)
5133 {
5134   char *p;
5135   unsigned int n;
5136
5137   for (n = 0; n < i.operands; n++)
5138     {
5139       if (operand_type_check (i.types[n], disp))
5140         {
5141           if (i.op[n].disps->X_op == O_constant)
5142             {
5143               int size = disp_size (n);
5144               offsetT val;
5145
5146               val = offset_in_range (i.op[n].disps->X_add_number,
5147                                      size);
5148               p = frag_more (size);
5149               md_number_to_chars (p, val, size);
5150             }
5151           else
5152             {
5153               enum bfd_reloc_code_real reloc_type;
5154               int size = disp_size (n);
5155               int sign = i.types[n].bitfield.disp32s;
5156               int pcrel = (i.flags[n] & Operand_PCrel) != 0;
5157
5158               /* We can't have 8 bit displacement here.  */
5159               assert (!i.types[n].bitfield.disp8);
5160
5161               /* The PC relative address is computed relative
5162                  to the instruction boundary, so in case immediate
5163                  fields follows, we need to adjust the value.  */
5164               if (pcrel && i.imm_operands)
5165                 {
5166                   unsigned int n1;
5167                   int sz = 0;
5168
5169                   for (n1 = 0; n1 < i.operands; n1++)
5170                     if (operand_type_check (i.types[n1], imm))
5171                       {
5172                         /* Only one immediate is allowed for PC
5173                            relative address.  */
5174                         assert (sz == 0);
5175                         sz = imm_size (n1);
5176                         i.op[n].disps->X_add_number -= sz;
5177                       }
5178                   /* We should find the immediate.  */
5179                   assert (sz != 0);
5180                 }
5181
5182               p = frag_more (size);
5183               reloc_type = reloc (size, pcrel, sign, i.reloc[n]);
5184               if (GOT_symbol
5185                   && GOT_symbol == i.op[n].disps->X_add_symbol
5186                   && (((reloc_type == BFD_RELOC_32
5187                         || reloc_type == BFD_RELOC_X86_64_32S
5188                         || (reloc_type == BFD_RELOC_64
5189                             && object_64bit))
5190                        && (i.op[n].disps->X_op == O_symbol
5191                            || (i.op[n].disps->X_op == O_add
5192                                && ((symbol_get_value_expression
5193                                     (i.op[n].disps->X_op_symbol)->X_op)
5194                                    == O_subtract))))
5195                       || reloc_type == BFD_RELOC_32_PCREL))
5196                 {
5197                   offsetT add;
5198
5199                   if (insn_start_frag == frag_now)
5200                     add = (p - frag_now->fr_literal) - insn_start_off;
5201                   else
5202                     {
5203                       fragS *fr;
5204
5205                       add = insn_start_frag->fr_fix - insn_start_off;
5206                       for (fr = insn_start_frag->fr_next;
5207                            fr && fr != frag_now; fr = fr->fr_next)
5208                         add += fr->fr_fix;
5209                       add += p - frag_now->fr_literal;
5210                     }
5211
5212                   if (!object_64bit)
5213                     {
5214                       reloc_type = BFD_RELOC_386_GOTPC;
5215                       i.op[n].imms->X_add_number += add;
5216                     }
5217                   else if (reloc_type == BFD_RELOC_64)
5218                     reloc_type = BFD_RELOC_X86_64_GOTPC64;
5219                   else
5220                     /* Don't do the adjustment for x86-64, as there
5221                        the pcrel addressing is relative to the _next_
5222                        insn, and that is taken care of in other code.  */
5223                     reloc_type = BFD_RELOC_X86_64_GOTPC32;
5224                 }
5225               fix_new_exp (frag_now, p - frag_now->fr_literal, size,
5226                            i.op[n].disps, pcrel, reloc_type);
5227             }
5228         }
5229     }
5230 }
5231
5232 static void
5233 output_imm (fragS *insn_start_frag, offsetT insn_start_off)
5234 {
5235   char *p;
5236   unsigned int n;
5237
5238   for (n = 0; n < i.operands; n++)
5239     {
5240       if (operand_type_check (i.types[n], imm))
5241         {
5242           if (i.op[n].imms->X_op == O_constant)
5243             {
5244               int size = imm_size (n);
5245               offsetT val;
5246
5247               val = offset_in_range (i.op[n].imms->X_add_number,
5248                                      size);
5249               p = frag_more (size);
5250               md_number_to_chars (p, val, size);
5251             }
5252           else
5253             {
5254               /* Not absolute_section.
5255                  Need a 32-bit fixup (don't support 8bit
5256                  non-absolute imms).  Try to support other
5257                  sizes ...  */
5258               enum bfd_reloc_code_real reloc_type;
5259               int size = imm_size (n);
5260               int sign;
5261
5262               if (i.types[n].bitfield.imm32s
5263                   && (i.suffix == QWORD_MNEM_SUFFIX
5264                       || (!i.suffix && i.tm.opcode_modifier.no_lsuf)))
5265                 sign = 1;
5266               else
5267                 sign = 0;
5268
5269               p = frag_more (size);
5270               reloc_type = reloc (size, 0, sign, i.reloc[n]);
5271
5272               /*   This is tough to explain.  We end up with this one if we
5273                * have operands that look like
5274                * "_GLOBAL_OFFSET_TABLE_+[.-.L284]".  The goal here is to
5275                * obtain the absolute address of the GOT, and it is strongly
5276                * preferable from a performance point of view to avoid using
5277                * a runtime relocation for this.  The actual sequence of
5278                * instructions often look something like:
5279                *
5280                *        call    .L66
5281                * .L66:
5282                *        popl    %ebx
5283                *        addl    $_GLOBAL_OFFSET_TABLE_+[.-.L66],%ebx
5284                *
5285                *   The call and pop essentially return the absolute address
5286                * of the label .L66 and store it in %ebx.  The linker itself
5287                * will ultimately change the first operand of the addl so
5288                * that %ebx points to the GOT, but to keep things simple, the
5289                * .o file must have this operand set so that it generates not
5290                * the absolute address of .L66, but the absolute address of
5291                * itself.  This allows the linker itself simply treat a GOTPC
5292                * relocation as asking for a pcrel offset to the GOT to be
5293                * added in, and the addend of the relocation is stored in the
5294                * operand field for the instruction itself.
5295                *
5296                *   Our job here is to fix the operand so that it would add
5297                * the correct offset so that %ebx would point to itself.  The
5298                * thing that is tricky is that .-.L66 will point to the
5299                * beginning of the instruction, so we need to further modify
5300                * the operand so that it will point to itself.  There are
5301                * other cases where you have something like:
5302                *
5303                *        .long   $_GLOBAL_OFFSET_TABLE_+[.-.L66]
5304                *
5305                * and here no correction would be required.  Internally in
5306                * the assembler we treat operands of this form as not being
5307                * pcrel since the '.' is explicitly mentioned, and I wonder
5308                * whether it would simplify matters to do it this way.  Who
5309                * knows.  In earlier versions of the PIC patches, the
5310                * pcrel_adjust field was used to store the correction, but
5311                * since the expression is not pcrel, I felt it would be
5312                * confusing to do it this way.  */
5313
5314               if ((reloc_type == BFD_RELOC_32
5315                    || reloc_type == BFD_RELOC_X86_64_32S
5316                    || reloc_type == BFD_RELOC_64)
5317                   && GOT_symbol
5318                   && GOT_symbol == i.op[n].imms->X_add_symbol
5319                   && (i.op[n].imms->X_op == O_symbol
5320                       || (i.op[n].imms->X_op == O_add
5321                           && ((symbol_get_value_expression
5322                                (i.op[n].imms->X_op_symbol)->X_op)
5323                               == O_subtract))))
5324                 {
5325                   offsetT add;
5326
5327                   if (insn_start_frag == frag_now)
5328                     add = (p - frag_now->fr_literal) - insn_start_off;
5329                   else
5330                     {
5331                       fragS *fr;
5332
5333                       add = insn_start_frag->fr_fix - insn_start_off;
5334                       for (fr = insn_start_frag->fr_next;
5335                            fr && fr != frag_now; fr = fr->fr_next)
5336                         add += fr->fr_fix;
5337                       add += p - frag_now->fr_literal;
5338                     }
5339
5340                   if (!object_64bit)
5341                     reloc_type = BFD_RELOC_386_GOTPC;
5342                   else if (size == 4)
5343                     reloc_type = BFD_RELOC_X86_64_GOTPC32;
5344                   else if (size == 8)
5345                     reloc_type = BFD_RELOC_X86_64_GOTPC64;
5346                   i.op[n].imms->X_add_number += add;
5347                 }
5348               fix_new_exp (frag_now, p - frag_now->fr_literal, size,
5349                            i.op[n].imms, 0, reloc_type);
5350             }
5351         }
5352     }
5353 }
5354 \f
5355 /* x86_cons_fix_new is called via the expression parsing code when a
5356    reloc is needed.  We use this hook to get the correct .got reloc.  */
5357 static enum bfd_reloc_code_real got_reloc = NO_RELOC;
5358 static int cons_sign = -1;
5359
5360 void
5361 x86_cons_fix_new (fragS *frag, unsigned int off, unsigned int len,
5362                   expressionS *exp)
5363 {
5364   enum bfd_reloc_code_real r = reloc (len, 0, cons_sign, got_reloc);
5365
5366   got_reloc = NO_RELOC;
5367
5368 #ifdef TE_PE
5369   if (exp->X_op == O_secrel)
5370     {
5371       exp->X_op = O_symbol;
5372       r = BFD_RELOC_32_SECREL;
5373     }
5374 #endif
5375
5376   fix_new_exp (frag, off, len, exp, 0, r);
5377 }
5378
5379 #if (!defined (OBJ_ELF) && !defined (OBJ_MAYBE_ELF)) || defined (LEX_AT)
5380 # define lex_got(reloc, adjust, types) NULL
5381 #else
5382 /* Parse operands of the form
5383    <symbol>@GOTOFF+<nnn>
5384    and similar .plt or .got references.
5385
5386    If we find one, set up the correct relocation in RELOC and copy the
5387    input string, minus the `@GOTOFF' into a malloc'd buffer for
5388    parsing by the calling routine.  Return this buffer, and if ADJUST
5389    is non-null set it to the length of the string we removed from the
5390    input line.  Otherwise return NULL.  */
5391 static char *
5392 lex_got (enum bfd_reloc_code_real *reloc,
5393          int *adjust,
5394          i386_operand_type *types)
5395 {
5396   /* Some of the relocations depend on the size of what field is to
5397      be relocated.  But in our callers i386_immediate and i386_displacement
5398      we don't yet know the operand size (this will be set by insn
5399      matching).  Hence we record the word32 relocation here,
5400      and adjust the reloc according to the real size in reloc().  */
5401   static const struct {
5402     const char *str;
5403     const enum bfd_reloc_code_real rel[2];
5404     const i386_operand_type types64;
5405   } gotrel[] = {
5406     { "PLTOFF",   { 0,
5407                     BFD_RELOC_X86_64_PLTOFF64 },
5408       OPERAND_TYPE_IMM64 },
5409     { "PLT",      { BFD_RELOC_386_PLT32,
5410                     BFD_RELOC_X86_64_PLT32    },
5411       OPERAND_TYPE_IMM32_32S_DISP32 },
5412     { "GOTPLT",   { 0,
5413                     BFD_RELOC_X86_64_GOTPLT64 },
5414       OPERAND_TYPE_IMM64_DISP64 },
5415     { "GOTOFF",   { BFD_RELOC_386_GOTOFF,
5416                     BFD_RELOC_X86_64_GOTOFF64 },
5417       OPERAND_TYPE_IMM64_DISP64 },
5418     { "GOTPCREL", { 0,
5419                     BFD_RELOC_X86_64_GOTPCREL },
5420       OPERAND_TYPE_IMM32_32S_DISP32 },
5421     { "TLSGD",    { BFD_RELOC_386_TLS_GD,
5422                     BFD_RELOC_X86_64_TLSGD    },
5423       OPERAND_TYPE_IMM32_32S_DISP32 },
5424     { "TLSLDM",   { BFD_RELOC_386_TLS_LDM,
5425                     0                         },
5426       OPERAND_TYPE_NONE },
5427     { "TLSLD",    { 0,
5428                     BFD_RELOC_X86_64_TLSLD    },
5429       OPERAND_TYPE_IMM32_32S_DISP32 },
5430     { "GOTTPOFF", { BFD_RELOC_386_TLS_IE_32,
5431                     BFD_RELOC_X86_64_GOTTPOFF },
5432       OPERAND_TYPE_IMM32_32S_DISP32 },
5433     { "TPOFF",    { BFD_RELOC_386_TLS_LE_32,
5434                     BFD_RELOC_X86_64_TPOFF32  },
5435       OPERAND_TYPE_IMM32_32S_64_DISP32_64 },
5436     { "NTPOFF",   { BFD_RELOC_386_TLS_LE,
5437                     0                         },
5438       OPERAND_TYPE_NONE },
5439     { "DTPOFF",   { BFD_RELOC_386_TLS_LDO_32,
5440                     BFD_RELOC_X86_64_DTPOFF32 },
5441       
5442       OPERAND_TYPE_IMM32_32S_64_DISP32_64 },
5443     { "GOTNTPOFF",{ BFD_RELOC_386_TLS_GOTIE,
5444                     0                         },
5445       OPERAND_TYPE_NONE },
5446     { "INDNTPOFF",{ BFD_RELOC_386_TLS_IE,
5447                     0                         },
5448       OPERAND_TYPE_NONE },
5449     { "GOT",      { BFD_RELOC_386_GOT32,
5450                     BFD_RELOC_X86_64_GOT32    },
5451       OPERAND_TYPE_IMM32_32S_64_DISP32 },
5452     { "TLSDESC",  { BFD_RELOC_386_TLS_GOTDESC,
5453                     BFD_RELOC_X86_64_GOTPC32_TLSDESC },
5454       OPERAND_TYPE_IMM32_32S_DISP32 },
5455     { "TLSCALL",  { BFD_RELOC_386_TLS_DESC_CALL,
5456                     BFD_RELOC_X86_64_TLSDESC_CALL },
5457       OPERAND_TYPE_IMM32_32S_DISP32 },
5458   };
5459   char *cp;
5460   unsigned int j;
5461
5462   if (!IS_ELF)
5463     return NULL;
5464
5465   for (cp = input_line_pointer; *cp != '@'; cp++)
5466     if (is_end_of_line[(unsigned char) *cp] || *cp == ',')
5467       return NULL;
5468
5469   for (j = 0; j < sizeof (gotrel) / sizeof (gotrel[0]); j++)
5470     {
5471       int len;
5472
5473       len = strlen (gotrel[j].str);
5474       if (strncasecmp (cp + 1, gotrel[j].str, len) == 0)
5475         {
5476           if (gotrel[j].rel[object_64bit] != 0)
5477             {
5478               int first, second;
5479               char *tmpbuf, *past_reloc;
5480
5481               *reloc = gotrel[j].rel[object_64bit];
5482               if (adjust)
5483                 *adjust = len;
5484
5485               if (types)
5486                 {
5487                   if (flag_code != CODE_64BIT)
5488                     {
5489                       types->bitfield.imm32 = 1;
5490                       types->bitfield.disp32 = 1;
5491                     }
5492                   else
5493                     *types = gotrel[j].types64;
5494                 }
5495
5496               if (GOT_symbol == NULL)
5497                 GOT_symbol = symbol_find_or_make (GLOBAL_OFFSET_TABLE_NAME);
5498
5499               /* The length of the first part of our input line.  */
5500               first = cp - input_line_pointer;
5501
5502               /* The second part goes from after the reloc token until
5503                  (and including) an end_of_line char or comma.  */
5504               past_reloc = cp + 1 + len;
5505               cp = past_reloc;
5506               while (!is_end_of_line[(unsigned char) *cp] && *cp != ',')
5507                 ++cp;
5508               second = cp + 1 - past_reloc;
5509
5510               /* Allocate and copy string.  The trailing NUL shouldn't
5511                  be necessary, but be safe.  */
5512               tmpbuf = xmalloc (first + second + 2);
5513               memcpy (tmpbuf, input_line_pointer, first);
5514               if (second != 0 && *past_reloc != ' ')
5515                 /* Replace the relocation token with ' ', so that
5516                    errors like foo@GOTOFF1 will be detected.  */
5517                 tmpbuf[first++] = ' ';
5518               memcpy (tmpbuf + first, past_reloc, second);
5519               tmpbuf[first + second] = '\0';
5520               return tmpbuf;
5521             }
5522
5523           as_bad (_("@%s reloc is not supported with %d-bit output format"),
5524                   gotrel[j].str, 1 << (5 + object_64bit));
5525           return NULL;
5526         }
5527     }
5528
5529   /* Might be a symbol version string.  Don't as_bad here.  */
5530   return NULL;
5531 }
5532
5533 void
5534 x86_cons (expressionS *exp, int size)
5535 {
5536   if (size == 4 || (object_64bit && size == 8))
5537     {
5538       /* Handle @GOTOFF and the like in an expression.  */
5539       char *save;
5540       char *gotfree_input_line;
5541       int adjust;
5542
5543       save = input_line_pointer;
5544       gotfree_input_line = lex_got (&got_reloc, &adjust, NULL);
5545       if (gotfree_input_line)
5546         input_line_pointer = gotfree_input_line;
5547
5548       expression (exp);
5549
5550       if (gotfree_input_line)
5551         {
5552           /* expression () has merrily parsed up to the end of line,
5553              or a comma - in the wrong buffer.  Transfer how far
5554              input_line_pointer has moved to the right buffer.  */
5555           input_line_pointer = (save
5556                                 + (input_line_pointer - gotfree_input_line)
5557                                 + adjust);
5558           free (gotfree_input_line);
5559           if (exp->X_op == O_constant
5560               || exp->X_op == O_absent
5561               || exp->X_op == O_illegal
5562               || exp->X_op == O_register
5563               || exp->X_op == O_big)
5564             {
5565               char c = *input_line_pointer;
5566               *input_line_pointer = 0;
5567               as_bad (_("missing or invalid expression `%s'"), save);
5568               *input_line_pointer = c;
5569             }
5570         }
5571     }
5572   else
5573     expression (exp);
5574 }
5575 #endif
5576
5577 static void signed_cons (int size)
5578 {
5579   if (flag_code == CODE_64BIT)
5580     cons_sign = 1;
5581   cons (size);
5582   cons_sign = -1;
5583 }
5584
5585 #ifdef TE_PE
5586 static void
5587 pe_directive_secrel (dummy)
5588      int dummy ATTRIBUTE_UNUSED;
5589 {
5590   expressionS exp;
5591
5592   do
5593     {
5594       expression (&exp);
5595       if (exp.X_op == O_symbol)
5596         exp.X_op = O_secrel;
5597
5598       emit_expr (&exp, 4);
5599     }
5600   while (*input_line_pointer++ == ',');
5601
5602   input_line_pointer--;
5603   demand_empty_rest_of_line ();
5604 }
5605 #endif
5606
5607 static int
5608 i386_immediate (char *imm_start)
5609 {
5610   char *save_input_line_pointer;
5611   char *gotfree_input_line;
5612   segT exp_seg = 0;
5613   expressionS *exp;
5614   i386_operand_type types;
5615
5616   UINTS_SET (types, ~0);
5617
5618   if (i.imm_operands == MAX_IMMEDIATE_OPERANDS)
5619     {
5620       as_bad (_("at most %d immediate operands are allowed"),
5621               MAX_IMMEDIATE_OPERANDS);
5622       return 0;
5623     }
5624
5625   exp = &im_expressions[i.imm_operands++];
5626   i.op[this_operand].imms = exp;
5627
5628   if (is_space_char (*imm_start))
5629     ++imm_start;
5630
5631   save_input_line_pointer = input_line_pointer;
5632   input_line_pointer = imm_start;
5633
5634   gotfree_input_line = lex_got (&i.reloc[this_operand], NULL, &types);
5635   if (gotfree_input_line)
5636     input_line_pointer = gotfree_input_line;
5637
5638   exp_seg = expression (exp);
5639
5640   SKIP_WHITESPACE ();
5641   if (*input_line_pointer)
5642     as_bad (_("junk `%s' after expression"), input_line_pointer);
5643
5644   input_line_pointer = save_input_line_pointer;
5645   if (gotfree_input_line)
5646     free (gotfree_input_line);
5647
5648   if (exp->X_op == O_absent
5649       || exp->X_op == O_illegal
5650       || exp->X_op == O_big
5651       || (gotfree_input_line
5652           && (exp->X_op == O_constant
5653               || exp->X_op == O_register)))
5654     {
5655       as_bad (_("missing or invalid immediate expression `%s'"),
5656               imm_start);
5657       return 0;
5658     }
5659   else if (exp->X_op == O_constant)
5660     {
5661       /* Size it properly later.  */
5662       i.types[this_operand].bitfield.imm64 = 1;
5663       /* If BFD64, sign extend val.  */
5664       if (!use_rela_relocations
5665           && (exp->X_add_number & ~(((addressT) 2 << 31) - 1)) == 0)
5666         exp->X_add_number
5667           = (exp->X_add_number ^ ((addressT) 1 << 31)) - ((addressT) 1 << 31);
5668     }
5669 #if (defined (OBJ_AOUT) || defined (OBJ_MAYBE_AOUT))
5670   else if (OUTPUT_FLAVOR == bfd_target_aout_flavour
5671            && exp_seg != absolute_section
5672            && exp_seg != text_section
5673            && exp_seg != data_section
5674            && exp_seg != bss_section
5675            && exp_seg != undefined_section
5676            && !bfd_is_com_section (exp_seg))
5677     {
5678       as_bad (_("unimplemented segment %s in operand"), exp_seg->name);
5679       return 0;
5680     }
5681 #endif
5682   else if (!intel_syntax && exp->X_op == O_register)
5683     {
5684       as_bad (_("illegal immediate register operand %s"), imm_start);
5685       return 0;
5686     }
5687   else
5688     {
5689       /* This is an address.  The size of the address will be
5690          determined later, depending on destination register,
5691          suffix, or the default for the section.  */
5692       i.types[this_operand].bitfield.imm8 = 1;
5693       i.types[this_operand].bitfield.imm16 = 1;
5694       i.types[this_operand].bitfield.imm32 = 1;
5695       i.types[this_operand].bitfield.imm32s = 1;
5696       i.types[this_operand].bitfield.imm64 = 1;
5697       i.types[this_operand] = operand_type_and (i.types[this_operand],
5698                                                 types);
5699     }
5700
5701   return 1;
5702 }
5703
5704 static char *
5705 i386_scale (char *scale)
5706 {
5707   offsetT val;
5708   char *save = input_line_pointer;
5709
5710   input_line_pointer = scale;
5711   val = get_absolute_expression ();
5712
5713   switch (val)
5714     {
5715     case 1:
5716       i.log2_scale_factor = 0;
5717       break;
5718     case 2:
5719       i.log2_scale_factor = 1;
5720       break;
5721     case 4:
5722       i.log2_scale_factor = 2;
5723       break;
5724     case 8:
5725       i.log2_scale_factor = 3;
5726       break;
5727     default:
5728       {
5729         char sep = *input_line_pointer;
5730
5731         *input_line_pointer = '\0';
5732         as_bad (_("expecting scale factor of 1, 2, 4, or 8: got `%s'"),
5733                 scale);
5734         *input_line_pointer = sep;
5735         input_line_pointer = save;
5736         return NULL;
5737       }
5738     }
5739   if (i.log2_scale_factor != 0 && i.index_reg == 0)
5740     {
5741       as_warn (_("scale factor of %d without an index register"),
5742                1 << i.log2_scale_factor);
5743 #if SCALE1_WHEN_NO_INDEX
5744       i.log2_scale_factor = 0;
5745 #endif
5746     }
5747   scale = input_line_pointer;
5748   input_line_pointer = save;
5749   return scale;
5750 }
5751
5752 static int
5753 i386_displacement (char *disp_start, char *disp_end)
5754 {
5755   expressionS *exp;
5756   segT exp_seg = 0;
5757   char *save_input_line_pointer;
5758   char *gotfree_input_line;
5759   int override;
5760   i386_operand_type bigdisp, types = anydisp;
5761   int ret;
5762
5763   if (i.disp_operands == MAX_MEMORY_OPERANDS)
5764     {
5765       as_bad (_("at most %d displacement operands are allowed"),
5766               MAX_MEMORY_OPERANDS);
5767       return 0;
5768     }
5769
5770   UINTS_CLEAR (bigdisp);
5771   if ((i.types[this_operand].bitfield.jumpabsolute)
5772       || (!current_templates->start->opcode_modifier.jump
5773           && !current_templates->start->opcode_modifier.jumpdword))
5774     {
5775       bigdisp.bitfield.disp32 = 1;
5776       override = (i.prefix[ADDR_PREFIX] != 0);
5777       if (flag_code == CODE_64BIT)
5778         {
5779           if (!override)
5780             {
5781               bigdisp.bitfield.disp32s = 1;
5782               bigdisp.bitfield.disp64 = 1;
5783             }
5784         }
5785       else if ((flag_code == CODE_16BIT) ^ override)
5786         {
5787           bigdisp.bitfield.disp32 = 0;
5788           bigdisp.bitfield.disp16 = 1;
5789         }
5790     }
5791   else
5792     {
5793       /* For PC-relative branches, the width of the displacement
5794          is dependent upon data size, not address size.  */
5795       override = (i.prefix[DATA_PREFIX] != 0);
5796       if (flag_code == CODE_64BIT)
5797         {
5798           if (override || i.suffix == WORD_MNEM_SUFFIX)
5799             bigdisp.bitfield.disp16 = 1;
5800           else
5801             {
5802               bigdisp.bitfield.disp32 = 1;
5803               bigdisp.bitfield.disp32s = 1;
5804             }
5805         }
5806       else
5807         {
5808           if (!override)
5809             override = (i.suffix == (flag_code != CODE_16BIT
5810                                      ? WORD_MNEM_SUFFIX
5811                                      : LONG_MNEM_SUFFIX));
5812           bigdisp.bitfield.disp32 = 1;
5813           if ((flag_code == CODE_16BIT) ^ override)
5814             {
5815               bigdisp.bitfield.disp32 = 0;
5816               bigdisp.bitfield.disp16 = 1;
5817             }
5818         }
5819     }
5820   i.types[this_operand] = operand_type_or (i.types[this_operand],
5821                                            bigdisp);
5822
5823   exp = &disp_expressions[i.disp_operands];
5824   i.op[this_operand].disps = exp;
5825   i.disp_operands++;
5826   save_input_line_pointer = input_line_pointer;
5827   input_line_pointer = disp_start;
5828   END_STRING_AND_SAVE (disp_end);
5829
5830 #ifndef GCC_ASM_O_HACK
5831 #define GCC_ASM_O_HACK 0
5832 #endif
5833 #if GCC_ASM_O_HACK
5834   END_STRING_AND_SAVE (disp_end + 1);
5835   if (i.types[this_operand].bitfield.baseIndex
5836       && displacement_string_end[-1] == '+')
5837     {
5838       /* This hack is to avoid a warning when using the "o"
5839          constraint within gcc asm statements.
5840          For instance:
5841
5842          #define _set_tssldt_desc(n,addr,limit,type) \
5843          __asm__ __volatile__ ( \
5844          "movw %w2,%0\n\t" \
5845          "movw %w1,2+%0\n\t" \
5846          "rorl $16,%1\n\t" \
5847          "movb %b1,4+%0\n\t" \
5848          "movb %4,5+%0\n\t" \
5849          "movb $0,6+%0\n\t" \
5850          "movb %h1,7+%0\n\t" \
5851          "rorl $16,%1" \
5852          : "=o"(*(n)) : "q" (addr), "ri"(limit), "i"(type))
5853
5854          This works great except that the output assembler ends
5855          up looking a bit weird if it turns out that there is
5856          no offset.  You end up producing code that looks like:
5857
5858          #APP
5859          movw $235,(%eax)
5860          movw %dx,2+(%eax)
5861          rorl $16,%edx
5862          movb %dl,4+(%eax)
5863          movb $137,5+(%eax)
5864          movb $0,6+(%eax)
5865          movb %dh,7+(%eax)
5866          rorl $16,%edx
5867          #NO_APP
5868
5869          So here we provide the missing zero.  */
5870
5871       *displacement_string_end = '0';
5872     }
5873 #endif
5874   gotfree_input_line = lex_got (&i.reloc[this_operand], NULL, &types);
5875   if (gotfree_input_line)
5876     input_line_pointer = gotfree_input_line;
5877
5878   exp_seg = expression (exp);
5879
5880   SKIP_WHITESPACE ();
5881   if (*input_line_pointer)
5882     as_bad (_("junk `%s' after expression"), input_line_pointer);
5883 #if GCC_ASM_O_HACK
5884   RESTORE_END_STRING (disp_end + 1);
5885 #endif
5886   input_line_pointer = save_input_line_pointer;
5887   if (gotfree_input_line)
5888     free (gotfree_input_line);
5889   ret = 1;
5890
5891   /* We do this to make sure that the section symbol is in
5892      the symbol table.  We will ultimately change the relocation
5893      to be relative to the beginning of the section.  */
5894   if (i.reloc[this_operand] == BFD_RELOC_386_GOTOFF
5895       || i.reloc[this_operand] == BFD_RELOC_X86_64_GOTPCREL
5896       || i.reloc[this_operand] == BFD_RELOC_X86_64_GOTOFF64)
5897     {
5898       if (exp->X_op != O_symbol)
5899         goto inv_disp;
5900
5901       if (S_IS_LOCAL (exp->X_add_symbol)
5902           && S_GET_SEGMENT (exp->X_add_symbol) != undefined_section)
5903         section_symbol (S_GET_SEGMENT (exp->X_add_symbol));
5904       exp->X_op = O_subtract;
5905       exp->X_op_symbol = GOT_symbol;
5906       if (i.reloc[this_operand] == BFD_RELOC_X86_64_GOTPCREL)
5907         i.reloc[this_operand] = BFD_RELOC_32_PCREL;
5908       else if (i.reloc[this_operand] == BFD_RELOC_X86_64_GOTOFF64)
5909         i.reloc[this_operand] = BFD_RELOC_64;
5910       else
5911         i.reloc[this_operand] = BFD_RELOC_32;
5912     }
5913
5914   else if (exp->X_op == O_absent
5915            || exp->X_op == O_illegal
5916            || exp->X_op == O_big
5917            || (gotfree_input_line
5918                && (exp->X_op == O_constant
5919                    || exp->X_op == O_register)))
5920     {
5921     inv_disp:
5922       as_bad (_("missing or invalid displacement expression `%s'"),
5923               disp_start);
5924       ret = 0;
5925     }
5926
5927 #if (defined (OBJ_AOUT) || defined (OBJ_MAYBE_AOUT))
5928   else if (exp->X_op != O_constant
5929            && OUTPUT_FLAVOR == bfd_target_aout_flavour
5930            && exp_seg != absolute_section
5931            && exp_seg != text_section
5932            && exp_seg != data_section
5933            && exp_seg != bss_section
5934            && exp_seg != undefined_section
5935            && !bfd_is_com_section (exp_seg))
5936     {
5937       as_bad (_("unimplemented segment %s in operand"), exp_seg->name);
5938       ret = 0;
5939     }
5940 #endif
5941
5942   RESTORE_END_STRING (disp_end);
5943
5944   /* Check if this is a displacement only operand.  */
5945   bigdisp = i.types[this_operand];
5946   bigdisp.bitfield.disp8 = 0;
5947   bigdisp.bitfield.disp16 = 0;
5948   bigdisp.bitfield.disp32 = 0;
5949   bigdisp.bitfield.disp32s = 0;
5950   bigdisp.bitfield.disp64 = 0;
5951   if (UINTS_ALL_ZERO (bigdisp))
5952     i.types[this_operand] = operand_type_and (i.types[this_operand],
5953                                               types);
5954
5955   return ret;
5956 }
5957
5958 /* Make sure the memory operand we've been dealt is valid.
5959    Return 1 on success, 0 on a failure.  */
5960
5961 static int
5962 i386_index_check (const char *operand_string)
5963 {
5964   int ok;
5965 #if INFER_ADDR_PREFIX
5966   int fudged = 0;
5967
5968  tryprefix:
5969 #endif
5970   ok = 1;
5971   if (flag_code == CODE_64BIT)
5972     {
5973       if ((i.base_reg
5974            && ((i.prefix[ADDR_PREFIX] == 0
5975                 && !i.base_reg->reg_type.bitfield.reg64)
5976                || (i.prefix[ADDR_PREFIX]
5977                    && !i.base_reg->reg_type.bitfield.reg32))
5978            && (i.index_reg
5979                || !UINTS_EQUAL (i.base_reg->reg_type, baseindex)))
5980           || (i.index_reg
5981               && (!i.index_reg->reg_type.bitfield.baseindex
5982                   || (i.prefix[ADDR_PREFIX] == 0
5983                       && !i.index_reg->reg_type.bitfield.reg64)
5984                   || (i.prefix[ADDR_PREFIX]
5985                       && !i.index_reg->reg_type.bitfield.reg32))))
5986         ok = 0;
5987     }
5988   else
5989     {
5990       if ((flag_code == CODE_16BIT) ^ (i.prefix[ADDR_PREFIX] != 0))
5991         {
5992           /* 16bit checks.  */
5993           if ((i.base_reg
5994                && (!i.base_reg->reg_type.bitfield.reg16
5995                    || !i.base_reg->reg_type.bitfield.baseindex))
5996               || (i.index_reg
5997                   && (!i.index_reg->reg_type.bitfield.reg16
5998                       || !i.index_reg->reg_type.bitfield.baseindex
5999                       || !(i.base_reg
6000                            && i.base_reg->reg_num < 6
6001                            && i.index_reg->reg_num >= 6
6002                            && i.log2_scale_factor == 0))))
6003             ok = 0;
6004         }
6005       else
6006         {
6007           /* 32bit checks.  */
6008           if ((i.base_reg
6009                && !i.base_reg->reg_type.bitfield.reg32)
6010               || (i.index_reg
6011                   && (!i.index_reg->reg_type.bitfield.reg32
6012                       || !i.index_reg->reg_type.bitfield.baseindex)))
6013             ok = 0;
6014         }
6015     }
6016   if (!ok)
6017     {
6018 #if INFER_ADDR_PREFIX
6019       if (i.prefix[ADDR_PREFIX] == 0)
6020         {
6021           i.prefix[ADDR_PREFIX] = ADDR_PREFIX_OPCODE;
6022           i.prefixes += 1;
6023           /* Change the size of any displacement too.  At most one of
6024              Disp16 or Disp32 is set.
6025              FIXME.  There doesn't seem to be any real need for separate
6026              Disp16 and Disp32 flags.  The same goes for Imm16 and Imm32.
6027              Removing them would probably clean up the code quite a lot.  */
6028           if (flag_code != CODE_64BIT
6029               && (i.types[this_operand].bitfield.disp16
6030                   || i.types[this_operand].bitfield.disp32))
6031             i.types[this_operand]
6032               = operand_type_xor (i.types[this_operand], disp16_32);
6033           fudged = 1;
6034           goto tryprefix;
6035         }
6036       if (fudged)
6037         as_bad (_("`%s' is not a valid base/index expression"),
6038                 operand_string);
6039       else
6040 #endif
6041         as_bad (_("`%s' is not a valid %s bit base/index expression"),
6042                 operand_string,
6043                 flag_code_names[flag_code]);
6044     }
6045   return ok;
6046 }
6047
6048 /* Parse OPERAND_STRING into the i386_insn structure I.  Returns non-zero
6049    on error.  */
6050
6051 static int
6052 i386_operand (char *operand_string)
6053 {
6054   const reg_entry *r;
6055   char *end_op;
6056   char *op_string = operand_string;
6057
6058   if (is_space_char (*op_string))
6059     ++op_string;
6060
6061   /* We check for an absolute prefix (differentiating,
6062      for example, 'jmp pc_relative_label' from 'jmp *absolute_label'.  */
6063   if (*op_string == ABSOLUTE_PREFIX)
6064     {
6065       ++op_string;
6066       if (is_space_char (*op_string))
6067         ++op_string;
6068       i.types[this_operand].bitfield.jumpabsolute = 1;
6069     }
6070
6071   /* Check if operand is a register.  */
6072   if ((r = parse_register (op_string, &end_op)) != NULL)
6073     {
6074       i386_operand_type temp;
6075
6076       /* Check for a segment override by searching for ':' after a
6077          segment register.  */
6078       op_string = end_op;
6079       if (is_space_char (*op_string))
6080         ++op_string;
6081       if (*op_string == ':'
6082           && (r->reg_type.bitfield.sreg2
6083               || r->reg_type.bitfield.sreg3))
6084         {
6085           switch (r->reg_num)
6086             {
6087             case 0:
6088               i.seg[i.mem_operands] = &es;
6089               break;
6090             case 1:
6091               i.seg[i.mem_operands] = &cs;
6092               break;
6093             case 2:
6094               i.seg[i.mem_operands] = &ss;
6095               break;
6096             case 3:
6097               i.seg[i.mem_operands] = &ds;
6098               break;
6099             case 4:
6100               i.seg[i.mem_operands] = &fs;
6101               break;
6102             case 5:
6103               i.seg[i.mem_operands] = &gs;
6104               break;
6105             }
6106
6107           /* Skip the ':' and whitespace.  */
6108           ++op_string;
6109           if (is_space_char (*op_string))
6110             ++op_string;
6111
6112           if (!is_digit_char (*op_string)
6113               && !is_identifier_char (*op_string)
6114               && *op_string != '('
6115               && *op_string != ABSOLUTE_PREFIX)
6116             {
6117               as_bad (_("bad memory operand `%s'"), op_string);
6118               return 0;
6119             }
6120           /* Handle case of %es:*foo.  */
6121           if (*op_string == ABSOLUTE_PREFIX)
6122             {
6123               ++op_string;
6124               if (is_space_char (*op_string))
6125                 ++op_string;
6126               i.types[this_operand].bitfield.jumpabsolute = 1;
6127             }
6128           goto do_memory_reference;
6129         }
6130       if (*op_string)
6131         {
6132           as_bad (_("junk `%s' after register"), op_string);
6133           return 0;
6134         }
6135       temp = r->reg_type;
6136       temp.bitfield.baseindex = 0;
6137       i.types[this_operand] = operand_type_or (i.types[this_operand],
6138                                                temp);
6139       i.op[this_operand].regs = r;
6140       i.reg_operands++;
6141     }
6142   else if (*op_string == REGISTER_PREFIX)
6143     {
6144       as_bad (_("bad register name `%s'"), op_string);
6145       return 0;
6146     }
6147   else if (*op_string == IMMEDIATE_PREFIX)
6148     {
6149       ++op_string;
6150       if (i.types[this_operand].bitfield.jumpabsolute)
6151         {
6152           as_bad (_("immediate operand illegal with absolute jump"));
6153           return 0;
6154         }
6155       if (!i386_immediate (op_string))
6156         return 0;
6157     }
6158   else if (is_digit_char (*op_string)
6159            || is_identifier_char (*op_string)
6160            || *op_string == '(')
6161     {
6162       /* This is a memory reference of some sort.  */
6163       char *base_string;
6164
6165       /* Start and end of displacement string expression (if found).  */
6166       char *displacement_string_start;
6167       char *displacement_string_end;
6168
6169     do_memory_reference:
6170       if ((i.mem_operands == 1
6171            && !current_templates->start->opcode_modifier.isstring)
6172           || i.mem_operands == 2)
6173         {
6174           as_bad (_("too many memory references for `%s'"),
6175                   current_templates->start->name);
6176           return 0;
6177         }
6178
6179       /* Check for base index form.  We detect the base index form by
6180          looking for an ')' at the end of the operand, searching
6181          for the '(' matching it, and finding a REGISTER_PREFIX or ','
6182          after the '('.  */
6183       base_string = op_string + strlen (op_string);
6184
6185       --base_string;
6186       if (is_space_char (*base_string))
6187         --base_string;
6188
6189       /* If we only have a displacement, set-up for it to be parsed later.  */
6190       displacement_string_start = op_string;
6191       displacement_string_end = base_string + 1;
6192
6193       if (*base_string == ')')
6194         {
6195           char *temp_string;
6196           unsigned int parens_balanced = 1;
6197           /* We've already checked that the number of left & right ()'s are
6198              equal, so this loop will not be infinite.  */
6199           do
6200             {
6201               base_string--;
6202               if (*base_string == ')')
6203                 parens_balanced++;
6204               if (*base_string == '(')
6205                 parens_balanced--;
6206             }
6207           while (parens_balanced);
6208
6209           temp_string = base_string;
6210
6211           /* Skip past '(' and whitespace.  */
6212           ++base_string;
6213           if (is_space_char (*base_string))
6214             ++base_string;
6215
6216           if (*base_string == ','
6217               || ((i.base_reg = parse_register (base_string, &end_op))
6218                   != NULL))
6219             {
6220               displacement_string_end = temp_string;
6221
6222               i.types[this_operand].bitfield.baseindex = 1;
6223
6224               if (i.base_reg)
6225                 {
6226                   base_string = end_op;
6227                   if (is_space_char (*base_string))
6228                     ++base_string;
6229                 }
6230
6231               /* There may be an index reg or scale factor here.  */
6232               if (*base_string == ',')
6233                 {
6234                   ++base_string;
6235                   if (is_space_char (*base_string))
6236                     ++base_string;
6237
6238                   if ((i.index_reg = parse_register (base_string, &end_op))
6239                       != NULL)
6240                     {
6241                       base_string = end_op;
6242                       if (is_space_char (*base_string))
6243                         ++base_string;
6244                       if (*base_string == ',')
6245                         {
6246                           ++base_string;
6247                           if (is_space_char (*base_string))
6248                             ++base_string;
6249                         }
6250                       else if (*base_string != ')')
6251                         {
6252                           as_bad (_("expecting `,' or `)' "
6253                                     "after index register in `%s'"),
6254                                   operand_string);
6255                           return 0;
6256                         }
6257                     }
6258                   else if (*base_string == REGISTER_PREFIX)
6259                     {
6260                       as_bad (_("bad register name `%s'"), base_string);
6261                       return 0;
6262                     }
6263
6264                   /* Check for scale factor.  */
6265                   if (*base_string != ')')
6266                     {
6267                       char *end_scale = i386_scale (base_string);
6268
6269                       if (!end_scale)
6270                         return 0;
6271
6272                       base_string = end_scale;
6273                       if (is_space_char (*base_string))
6274                         ++base_string;
6275                       if (*base_string != ')')
6276                         {
6277                           as_bad (_("expecting `)' "
6278                                     "after scale factor in `%s'"),
6279                                   operand_string);
6280                           return 0;
6281                         }
6282                     }
6283                   else if (!i.index_reg)
6284                     {
6285                       as_bad (_("expecting index register or scale factor "
6286                                 "after `,'; got '%c'"),
6287                               *base_string);
6288                       return 0;
6289                     }
6290                 }
6291               else if (*base_string != ')')
6292                 {
6293                   as_bad (_("expecting `,' or `)' "
6294                             "after base register in `%s'"),
6295                           operand_string);
6296                   return 0;
6297                 }
6298             }
6299           else if (*base_string == REGISTER_PREFIX)
6300             {
6301               as_bad (_("bad register name `%s'"), base_string);
6302               return 0;
6303             }
6304         }
6305
6306       /* If there's an expression beginning the operand, parse it,
6307          assuming displacement_string_start and
6308          displacement_string_end are meaningful.  */
6309       if (displacement_string_start != displacement_string_end)
6310         {
6311           if (!i386_displacement (displacement_string_start,
6312                                   displacement_string_end))
6313             return 0;
6314         }
6315
6316       /* Special case for (%dx) while doing input/output op.  */
6317       if (i.base_reg
6318           && UINTS_EQUAL (i.base_reg->reg_type, reg16_inoutportreg)
6319           && i.index_reg == 0
6320           && i.log2_scale_factor == 0
6321           && i.seg[i.mem_operands] == 0
6322           && !operand_type_check (i.types[this_operand], disp))
6323         {
6324           UINTS_CLEAR (i.types[this_operand]);
6325           i.types[this_operand].bitfield.inoutportreg = 1;
6326           return 1;
6327         }
6328
6329       if (i386_index_check (operand_string) == 0)
6330         return 0;
6331       i.mem_operands++;
6332     }
6333   else
6334     {
6335       /* It's not a memory operand; argh!  */
6336       as_bad (_("invalid char %s beginning operand %d `%s'"),
6337               output_invalid (*op_string),
6338               this_operand + 1,
6339               op_string);
6340       return 0;
6341     }
6342   return 1;                     /* Normal return.  */
6343 }
6344 \f
6345 /* md_estimate_size_before_relax()
6346
6347    Called just before relax() for rs_machine_dependent frags.  The x86
6348    assembler uses these frags to handle variable size jump
6349    instructions.
6350
6351    Any symbol that is now undefined will not become defined.
6352    Return the correct fr_subtype in the frag.
6353    Return the initial "guess for variable size of frag" to caller.
6354    The guess is actually the growth beyond the fixed part.  Whatever
6355    we do to grow the fixed or variable part contributes to our
6356    returned value.  */
6357
6358 int
6359 md_estimate_size_before_relax (fragP, segment)
6360      fragS *fragP;
6361      segT segment;
6362 {
6363   /* We've already got fragP->fr_subtype right;  all we have to do is
6364      check for un-relaxable symbols.  On an ELF system, we can't relax
6365      an externally visible symbol, because it may be overridden by a
6366      shared library.  */
6367   if (S_GET_SEGMENT (fragP->fr_symbol) != segment
6368 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
6369       || (IS_ELF
6370           && (S_IS_EXTERNAL (fragP->fr_symbol)
6371               || S_IS_WEAK (fragP->fr_symbol)))
6372 #endif
6373       )
6374     {
6375       /* Symbol is undefined in this segment, or we need to keep a
6376          reloc so that weak symbols can be overridden.  */
6377       int size = (fragP->fr_subtype & CODE16) ? 2 : 4;
6378       enum bfd_reloc_code_real reloc_type;
6379       unsigned char *opcode;
6380       int old_fr_fix;
6381
6382       if (fragP->fr_var != NO_RELOC)
6383         reloc_type = fragP->fr_var;
6384       else if (size == 2)
6385         reloc_type = BFD_RELOC_16_PCREL;
6386       else
6387         reloc_type = BFD_RELOC_32_PCREL;
6388
6389       old_fr_fix = fragP->fr_fix;
6390       opcode = (unsigned char *) fragP->fr_opcode;
6391
6392       switch (TYPE_FROM_RELAX_STATE (fragP->fr_subtype))
6393         {
6394         case UNCOND_JUMP:
6395           /* Make jmp (0xeb) a (d)word displacement jump.  */
6396           opcode[0] = 0xe9;
6397           fragP->fr_fix += size;
6398           fix_new (fragP, old_fr_fix, size,
6399                    fragP->fr_symbol,
6400                    fragP->fr_offset, 1,
6401                    reloc_type);
6402           break;
6403
6404         case COND_JUMP86:
6405           if (size == 2
6406               && (!no_cond_jump_promotion || fragP->fr_var != NO_RELOC))
6407             {
6408               /* Negate the condition, and branch past an
6409                  unconditional jump.  */
6410               opcode[0] ^= 1;
6411               opcode[1] = 3;
6412               /* Insert an unconditional jump.  */
6413               opcode[2] = 0xe9;
6414               /* We added two extra opcode bytes, and have a two byte
6415                  offset.  */
6416               fragP->fr_fix += 2 + 2;
6417               fix_new (fragP, old_fr_fix + 2, 2,
6418                        fragP->fr_symbol,
6419                        fragP->fr_offset, 1,
6420                        reloc_type);
6421               break;
6422             }
6423           /* Fall through.  */
6424
6425         case COND_JUMP:
6426           if (no_cond_jump_promotion && fragP->fr_var == NO_RELOC)
6427             {
6428               fixS *fixP;
6429
6430               fragP->fr_fix += 1;
6431               fixP = fix_new (fragP, old_fr_fix, 1,
6432                               fragP->fr_symbol,
6433                               fragP->fr_offset, 1,
6434                               BFD_RELOC_8_PCREL);
6435               fixP->fx_signed = 1;
6436               break;
6437             }
6438
6439           /* This changes the byte-displacement jump 0x7N
6440              to the (d)word-displacement jump 0x0f,0x8N.  */
6441           opcode[1] = opcode[0] + 0x10;
6442           opcode[0] = TWO_BYTE_OPCODE_ESCAPE;
6443           /* We've added an opcode byte.  */
6444           fragP->fr_fix += 1 + size;
6445           fix_new (fragP, old_fr_fix + 1, size,
6446                    fragP->fr_symbol,
6447                    fragP->fr_offset, 1,
6448                    reloc_type);
6449           break;
6450
6451         default:
6452           BAD_CASE (fragP->fr_subtype);
6453           break;
6454         }
6455       frag_wane (fragP);
6456       return fragP->fr_fix - old_fr_fix;
6457     }
6458
6459   /* Guess size depending on current relax state.  Initially the relax
6460      state will correspond to a short jump and we return 1, because
6461      the variable part of the frag (the branch offset) is one byte
6462      long.  However, we can relax a section more than once and in that
6463      case we must either set fr_subtype back to the unrelaxed state,
6464      or return the value for the appropriate branch.  */
6465   return md_relax_table[fragP->fr_subtype].rlx_length;
6466 }
6467
6468 /* Called after relax() is finished.
6469
6470    In:  Address of frag.
6471         fr_type == rs_machine_dependent.
6472         fr_subtype is what the address relaxed to.
6473
6474    Out: Any fixSs and constants are set up.
6475         Caller will turn frag into a ".space 0".  */
6476
6477 void
6478 md_convert_frag (abfd, sec, fragP)
6479      bfd *abfd ATTRIBUTE_UNUSED;
6480      segT sec ATTRIBUTE_UNUSED;
6481      fragS *fragP;
6482 {
6483   unsigned char *opcode;
6484   unsigned char *where_to_put_displacement = NULL;
6485   offsetT target_address;
6486   offsetT opcode_address;
6487   unsigned int extension = 0;
6488   offsetT displacement_from_opcode_start;
6489
6490   opcode = (unsigned char *) fragP->fr_opcode;
6491
6492   /* Address we want to reach in file space.  */
6493   target_address = S_GET_VALUE (fragP->fr_symbol) + fragP->fr_offset;
6494
6495   /* Address opcode resides at in file space.  */
6496   opcode_address = fragP->fr_address + fragP->fr_fix;
6497
6498   /* Displacement from opcode start to fill into instruction.  */
6499   displacement_from_opcode_start = target_address - opcode_address;
6500
6501   if ((fragP->fr_subtype & BIG) == 0)
6502     {
6503       /* Don't have to change opcode.  */
6504       extension = 1;            /* 1 opcode + 1 displacement  */
6505       where_to_put_displacement = &opcode[1];
6506     }
6507   else
6508     {
6509       if (no_cond_jump_promotion
6510           && TYPE_FROM_RELAX_STATE (fragP->fr_subtype) != UNCOND_JUMP)
6511         as_warn_where (fragP->fr_file, fragP->fr_line,
6512                        _("long jump required"));
6513
6514       switch (fragP->fr_subtype)
6515         {
6516         case ENCODE_RELAX_STATE (UNCOND_JUMP, BIG):
6517           extension = 4;                /* 1 opcode + 4 displacement  */
6518           opcode[0] = 0xe9;
6519           where_to_put_displacement = &opcode[1];
6520           break;
6521
6522         case ENCODE_RELAX_STATE (UNCOND_JUMP, BIG16):
6523           extension = 2;                /* 1 opcode + 2 displacement  */
6524           opcode[0] = 0xe9;
6525           where_to_put_displacement = &opcode[1];
6526           break;
6527
6528         case ENCODE_RELAX_STATE (COND_JUMP, BIG):
6529         case ENCODE_RELAX_STATE (COND_JUMP86, BIG):
6530           extension = 5;                /* 2 opcode + 4 displacement  */
6531           opcode[1] = opcode[0] + 0x10;
6532           opcode[0] = TWO_BYTE_OPCODE_ESCAPE;
6533           where_to_put_displacement = &opcode[2];
6534           break;
6535
6536         case ENCODE_RELAX_STATE (COND_JUMP, BIG16):
6537           extension = 3;                /* 2 opcode + 2 displacement  */
6538           opcode[1] = opcode[0] + 0x10;
6539           opcode[0] = TWO_BYTE_OPCODE_ESCAPE;
6540           where_to_put_displacement = &opcode[2];
6541           break;
6542
6543         case ENCODE_RELAX_STATE (COND_JUMP86, BIG16):
6544           extension = 4;
6545           opcode[0] ^= 1;
6546           opcode[1] = 3;
6547           opcode[2] = 0xe9;
6548           where_to_put_displacement = &opcode[3];
6549           break;
6550
6551         default:
6552           BAD_CASE (fragP->fr_subtype);
6553           break;
6554         }
6555     }
6556
6557   /* If size if less then four we are sure that the operand fits,
6558      but if it's 4, then it could be that the displacement is larger
6559      then -/+ 2GB.  */
6560   if (DISP_SIZE_FROM_RELAX_STATE (fragP->fr_subtype) == 4
6561       && object_64bit
6562       && ((addressT) (displacement_from_opcode_start - extension
6563                       + ((addressT) 1 << 31))
6564           > (((addressT) 2 << 31) - 1)))
6565     {
6566       as_bad_where (fragP->fr_file, fragP->fr_line,
6567                     _("jump target out of range"));
6568       /* Make us emit 0.  */
6569       displacement_from_opcode_start = extension;
6570     }
6571   /* Now put displacement after opcode.  */
6572   md_number_to_chars ((char *) where_to_put_displacement,
6573                       (valueT) (displacement_from_opcode_start - extension),
6574                       DISP_SIZE_FROM_RELAX_STATE (fragP->fr_subtype));
6575   fragP->fr_fix += extension;
6576 }
6577 \f
6578 /* Size of byte displacement jmp.  */
6579 int md_short_jump_size = 2;
6580
6581 /* Size of dword displacement jmp.  */
6582 int md_long_jump_size = 5;
6583
6584 void
6585 md_create_short_jump (ptr, from_addr, to_addr, frag, to_symbol)
6586      char *ptr;
6587      addressT from_addr, to_addr;
6588      fragS *frag ATTRIBUTE_UNUSED;
6589      symbolS *to_symbol ATTRIBUTE_UNUSED;
6590 {
6591   offsetT offset;
6592
6593   offset = to_addr - (from_addr + 2);
6594   /* Opcode for byte-disp jump.  */
6595   md_number_to_chars (ptr, (valueT) 0xeb, 1);
6596   md_number_to_chars (ptr + 1, (valueT) offset, 1);
6597 }
6598
6599 void
6600 md_create_long_jump (ptr, from_addr, to_addr, frag, to_symbol)
6601      char *ptr;
6602      addressT from_addr, to_addr;
6603      fragS *frag ATTRIBUTE_UNUSED;
6604      symbolS *to_symbol ATTRIBUTE_UNUSED;
6605 {
6606   offsetT offset;
6607
6608   offset = to_addr - (from_addr + 5);
6609   md_number_to_chars (ptr, (valueT) 0xe9, 1);
6610   md_number_to_chars (ptr + 1, (valueT) offset, 4);
6611 }
6612 \f
6613 /* Apply a fixup (fixS) to segment data, once it has been determined
6614    by our caller that we have all the info we need to fix it up.
6615
6616    On the 386, immediates, displacements, and data pointers are all in
6617    the same (little-endian) format, so we don't need to care about which
6618    we are handling.  */
6619
6620 void
6621 md_apply_fix (fixP, valP, seg)
6622      /* The fix we're to put in.  */
6623      fixS *fixP;
6624      /* Pointer to the value of the bits.  */
6625      valueT *valP;
6626      /* Segment fix is from.  */
6627      segT seg ATTRIBUTE_UNUSED;
6628 {
6629   char *p = fixP->fx_where + fixP->fx_frag->fr_literal;
6630   valueT value = *valP;
6631
6632 #if !defined (TE_Mach)
6633   if (fixP->fx_pcrel)
6634     {
6635       switch (fixP->fx_r_type)
6636         {
6637         default:
6638           break;
6639
6640         case BFD_RELOC_64:
6641           fixP->fx_r_type = BFD_RELOC_64_PCREL;
6642           break;
6643         case BFD_RELOC_32:
6644         case BFD_RELOC_X86_64_32S:
6645           fixP->fx_r_type = BFD_RELOC_32_PCREL;
6646           break;
6647         case BFD_RELOC_16:
6648           fixP->fx_r_type = BFD_RELOC_16_PCREL;
6649           break;
6650         case BFD_RELOC_8:
6651           fixP->fx_r_type = BFD_RELOC_8_PCREL;
6652           break;
6653         }
6654     }
6655
6656   if (fixP->fx_addsy != NULL
6657       && (fixP->fx_r_type == BFD_RELOC_32_PCREL
6658           || fixP->fx_r_type == BFD_RELOC_64_PCREL
6659           || fixP->fx_r_type == BFD_RELOC_16_PCREL
6660           || fixP->fx_r_type == BFD_RELOC_8_PCREL)
6661       && !use_rela_relocations)
6662     {
6663       /* This is a hack.  There should be a better way to handle this.
6664          This covers for the fact that bfd_install_relocation will
6665          subtract the current location (for partial_inplace, PC relative
6666          relocations); see more below.  */
6667 #ifndef OBJ_AOUT
6668       if (IS_ELF
6669 #ifdef TE_PE
6670           || OUTPUT_FLAVOR == bfd_target_coff_flavour
6671 #endif
6672           )
6673         value += fixP->fx_where + fixP->fx_frag->fr_address;
6674 #endif
6675 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
6676       if (IS_ELF)
6677         {
6678           segT sym_seg = S_GET_SEGMENT (fixP->fx_addsy);
6679
6680           if ((sym_seg == seg
6681                || (symbol_section_p (fixP->fx_addsy)
6682                    && sym_seg != absolute_section))
6683               && !generic_force_reloc (fixP))
6684             {
6685               /* Yes, we add the values in twice.  This is because
6686                  bfd_install_relocation subtracts them out again.  I think
6687                  bfd_install_relocation is broken, but I don't dare change
6688                  it.  FIXME.  */
6689               value += fixP->fx_where + fixP->fx_frag->fr_address;
6690             }
6691         }
6692 #endif
6693 #if defined (OBJ_COFF) && defined (TE_PE)
6694       /* For some reason, the PE format does not store a
6695          section address offset for a PC relative symbol.  */
6696       if (S_GET_SEGMENT (fixP->fx_addsy) != seg
6697           || S_IS_WEAK (fixP->fx_addsy))
6698         value += md_pcrel_from (fixP);
6699 #endif
6700     }
6701
6702   /* Fix a few things - the dynamic linker expects certain values here,
6703      and we must not disappoint it.  */
6704 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
6705   if (IS_ELF && fixP->fx_addsy)
6706     switch (fixP->fx_r_type)
6707       {
6708       case BFD_RELOC_386_PLT32:
6709       case BFD_RELOC_X86_64_PLT32:
6710         /* Make the jump instruction point to the address of the operand.  At
6711            runtime we merely add the offset to the actual PLT entry.  */
6712         value = -4;
6713         break;
6714
6715       case BFD_RELOC_386_TLS_GD:
6716       case BFD_RELOC_386_TLS_LDM:
6717       case BFD_RELOC_386_TLS_IE_32:
6718       case BFD_RELOC_386_TLS_IE:
6719       case BFD_RELOC_386_TLS_GOTIE:
6720       case BFD_RELOC_386_TLS_GOTDESC:
6721       case BFD_RELOC_X86_64_TLSGD:
6722       case BFD_RELOC_X86_64_TLSLD:
6723       case BFD_RELOC_X86_64_GOTTPOFF:
6724       case BFD_RELOC_X86_64_GOTPC32_TLSDESC:
6725         value = 0; /* Fully resolved at runtime.  No addend.  */
6726         /* Fallthrough */
6727       case BFD_RELOC_386_TLS_LE:
6728       case BFD_RELOC_386_TLS_LDO_32:
6729       case BFD_RELOC_386_TLS_LE_32:
6730       case BFD_RELOC_X86_64_DTPOFF32:
6731       case BFD_RELOC_X86_64_DTPOFF64:
6732       case BFD_RELOC_X86_64_TPOFF32:
6733       case BFD_RELOC_X86_64_TPOFF64:
6734         S_SET_THREAD_LOCAL (fixP->fx_addsy);
6735         break;
6736
6737       case BFD_RELOC_386_TLS_DESC_CALL:
6738       case BFD_RELOC_X86_64_TLSDESC_CALL:
6739         value = 0; /* Fully resolved at runtime.  No addend.  */
6740         S_SET_THREAD_LOCAL (fixP->fx_addsy);
6741         fixP->fx_done = 0;
6742         return;
6743
6744       case BFD_RELOC_386_GOT32:
6745       case BFD_RELOC_X86_64_GOT32:
6746         value = 0; /* Fully resolved at runtime.  No addend.  */
6747         break;
6748
6749       case BFD_RELOC_VTABLE_INHERIT:
6750       case BFD_RELOC_VTABLE_ENTRY:
6751         fixP->fx_done = 0;
6752         return;
6753
6754       default:
6755         break;
6756       }
6757 #endif /* defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)  */
6758   *valP = value;
6759 #endif /* !defined (TE_Mach)  */
6760
6761   /* Are we finished with this relocation now?  */
6762   if (fixP->fx_addsy == NULL)
6763     fixP->fx_done = 1;
6764   else if (use_rela_relocations)
6765     {
6766       fixP->fx_no_overflow = 1;
6767       /* Remember value for tc_gen_reloc.  */
6768       fixP->fx_addnumber = value;
6769       value = 0;
6770     }
6771
6772   md_number_to_chars (p, value, fixP->fx_size);
6773 }
6774 \f
6775 #define MAX_LITTLENUMS 6
6776
6777 /* Turn the string pointed to by litP into a floating point constant
6778    of type TYPE, and emit the appropriate bytes.  The number of
6779    LITTLENUMS emitted is stored in *SIZEP.  An error message is
6780    returned, or NULL on OK.  */
6781
6782 char *
6783 md_atof (type, litP, sizeP)
6784      int type;
6785      char *litP;
6786      int *sizeP;
6787 {
6788   int prec;
6789   LITTLENUM_TYPE words[MAX_LITTLENUMS];
6790   LITTLENUM_TYPE *wordP;
6791   char *t;
6792
6793   switch (type)
6794     {
6795     case 'f':
6796     case 'F':
6797       prec = 2;
6798       break;
6799
6800     case 'd':
6801     case 'D':
6802       prec = 4;
6803       break;
6804
6805     case 'x':
6806     case 'X':
6807       prec = 5;
6808       break;
6809
6810     default:
6811       *sizeP = 0;
6812       return _("Bad call to md_atof ()");
6813     }
6814   t = atof_ieee (input_line_pointer, type, words);
6815   if (t)
6816     input_line_pointer = t;
6817
6818   *sizeP = prec * sizeof (LITTLENUM_TYPE);
6819   /* This loops outputs the LITTLENUMs in REVERSE order; in accord with
6820      the bigendian 386.  */
6821   for (wordP = words + prec - 1; prec--;)
6822     {
6823       md_number_to_chars (litP, (valueT) (*wordP--), sizeof (LITTLENUM_TYPE));
6824       litP += sizeof (LITTLENUM_TYPE);
6825     }
6826   return 0;
6827 }
6828 \f
6829 static char output_invalid_buf[sizeof (unsigned char) * 2 + 6];
6830
6831 static char *
6832 output_invalid (int c)
6833 {
6834   if (ISPRINT (c))
6835     snprintf (output_invalid_buf, sizeof (output_invalid_buf),
6836               "'%c'", c);
6837   else
6838     snprintf (output_invalid_buf, sizeof (output_invalid_buf),
6839               "(0x%x)", (unsigned char) c);
6840   return output_invalid_buf;
6841 }
6842
6843 /* REG_STRING starts *before* REGISTER_PREFIX.  */
6844
6845 static const reg_entry *
6846 parse_real_register (char *reg_string, char **end_op)
6847 {
6848   char *s = reg_string;
6849   char *p;
6850   char reg_name_given[MAX_REG_NAME_SIZE + 1];
6851   const reg_entry *r;
6852
6853   /* Skip possible REGISTER_PREFIX and possible whitespace.  */
6854   if (*s == REGISTER_PREFIX)
6855     ++s;
6856
6857   if (is_space_char (*s))
6858     ++s;
6859
6860   p = reg_name_given;
6861   while ((*p++ = register_chars[(unsigned char) *s]) != '\0')
6862     {
6863       if (p >= reg_name_given + MAX_REG_NAME_SIZE)
6864         return (const reg_entry *) NULL;
6865       s++;
6866     }
6867
6868   /* For naked regs, make sure that we are not dealing with an identifier.
6869      This prevents confusing an identifier like `eax_var' with register
6870      `eax'.  */
6871   if (allow_naked_reg && identifier_chars[(unsigned char) *s])
6872     return (const reg_entry *) NULL;
6873
6874   *end_op = s;
6875
6876   r = (const reg_entry *) hash_find (reg_hash, reg_name_given);
6877
6878   /* Handle floating point regs, allowing spaces in the (i) part.  */
6879   if (r == i386_regtab /* %st is first entry of table  */)
6880     {
6881       if (is_space_char (*s))
6882         ++s;
6883       if (*s == '(')
6884         {
6885           ++s;
6886           if (is_space_char (*s))
6887             ++s;
6888           if (*s >= '0' && *s <= '7')
6889             {
6890               int fpr = *s - '0';
6891               ++s;
6892               if (is_space_char (*s))
6893                 ++s;
6894               if (*s == ')')
6895                 {
6896                   *end_op = s + 1;
6897                   r = hash_find (reg_hash, "st(0)");
6898                   know (r);
6899                   return r + fpr;
6900                 }
6901             }
6902           /* We have "%st(" then garbage.  */
6903           return (const reg_entry *) NULL;
6904         }
6905     }
6906
6907   if (r != NULL
6908       && ((r->reg_flags & (RegRex64 | RegRex))
6909           || r->reg_type.bitfield.reg64)
6910       && (!cpu_arch_flags.bitfield.cpulm
6911           || !UINTS_EQUAL (r->reg_type, control))
6912       && flag_code != CODE_64BIT)
6913     return (const reg_entry *) NULL;
6914
6915   return r;
6916 }
6917
6918 /* REG_STRING starts *before* REGISTER_PREFIX.  */
6919
6920 static const reg_entry *
6921 parse_register (char *reg_string, char **end_op)
6922 {
6923   const reg_entry *r;
6924
6925   if (*reg_string == REGISTER_PREFIX || allow_naked_reg)
6926     r = parse_real_register (reg_string, end_op);
6927   else
6928     r = NULL;
6929   if (!r)
6930     {
6931       char *save = input_line_pointer;
6932       char c;
6933       symbolS *symbolP;
6934
6935       input_line_pointer = reg_string;
6936       c = get_symbol_end ();
6937       symbolP = symbol_find (reg_string);
6938       if (symbolP && S_GET_SEGMENT (symbolP) == reg_section)
6939         {
6940           const expressionS *e = symbol_get_value_expression (symbolP);
6941
6942           know (e->X_op == O_register);
6943           know (e->X_add_number >= 0
6944                 && (valueT) e->X_add_number < i386_regtab_size);
6945           r = i386_regtab + e->X_add_number;
6946           *end_op = input_line_pointer;
6947         }
6948       *input_line_pointer = c;
6949       input_line_pointer = save;
6950     }
6951   return r;
6952 }
6953
6954 int
6955 i386_parse_name (char *name, expressionS *e, char *nextcharP)
6956 {
6957   const reg_entry *r;
6958   char *end = input_line_pointer;
6959
6960   *end = *nextcharP;
6961   r = parse_register (name, &input_line_pointer);
6962   if (r && end <= input_line_pointer)
6963     {
6964       *nextcharP = *input_line_pointer;
6965       *input_line_pointer = 0;
6966       e->X_op = O_register;
6967       e->X_add_number = r - i386_regtab;
6968       return 1;
6969     }
6970   input_line_pointer = end;
6971   *end = 0;
6972   return 0;
6973 }
6974
6975 void
6976 md_operand (expressionS *e)
6977 {
6978   if (*input_line_pointer == REGISTER_PREFIX)
6979     {
6980       char *end;
6981       const reg_entry *r = parse_real_register (input_line_pointer, &end);
6982
6983       if (r)
6984         {
6985           e->X_op = O_register;
6986           e->X_add_number = r - i386_regtab;
6987           input_line_pointer = end;
6988         }
6989     }
6990 }
6991
6992 \f
6993 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
6994 const char *md_shortopts = "kVQ:sqn";
6995 #else
6996 const char *md_shortopts = "qn";
6997 #endif
6998
6999 #define OPTION_32 (OPTION_MD_BASE + 0)
7000 #define OPTION_64 (OPTION_MD_BASE + 1)
7001 #define OPTION_DIVIDE (OPTION_MD_BASE + 2)
7002 #define OPTION_MARCH (OPTION_MD_BASE + 3)
7003 #define OPTION_MTUNE (OPTION_MD_BASE + 4)
7004
7005 struct option md_longopts[] =
7006 {
7007   {"32", no_argument, NULL, OPTION_32},
7008 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF) || defined(TE_PEP)
7009   {"64", no_argument, NULL, OPTION_64},
7010 #endif
7011   {"divide", no_argument, NULL, OPTION_DIVIDE},
7012   {"march", required_argument, NULL, OPTION_MARCH},
7013   {"mtune", required_argument, NULL, OPTION_MTUNE},
7014   {NULL, no_argument, NULL, 0}
7015 };
7016 size_t md_longopts_size = sizeof (md_longopts);
7017
7018 int
7019 md_parse_option (int c, char *arg)
7020 {
7021   unsigned int i;
7022
7023   switch (c)
7024     {
7025     case 'n':
7026       optimize_align_code = 0;
7027       break;
7028
7029     case 'q':
7030       quiet_warnings = 1;
7031       break;
7032
7033 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
7034       /* -Qy, -Qn: SVR4 arguments controlling whether a .comment section
7035          should be emitted or not.  FIXME: Not implemented.  */
7036     case 'Q':
7037       break;
7038
7039       /* -V: SVR4 argument to print version ID.  */
7040     case 'V':
7041       print_version_id ();
7042       break;
7043
7044       /* -k: Ignore for FreeBSD compatibility.  */
7045     case 'k':
7046       break;
7047
7048     case 's':
7049       /* -s: On i386 Solaris, this tells the native assembler to use
7050          .stab instead of .stab.excl.  We always use .stab anyhow.  */
7051       break;
7052 #endif
7053 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF) || defined(TE_PEP)
7054     case OPTION_64:
7055       {
7056         const char **list, **l;
7057
7058         list = bfd_target_list ();
7059         for (l = list; *l != NULL; l++)
7060           if (CONST_STRNEQ (*l, "elf64-x86-64")
7061               || strcmp (*l, "coff-x86-64") == 0
7062               || strcmp (*l, "pe-x86-64") == 0
7063               || strcmp (*l, "pei-x86-64") == 0)
7064             {
7065               default_arch = "x86_64";
7066               break;
7067             }
7068         if (*l == NULL)
7069           as_fatal (_("No compiled in support for x86_64"));
7070         free (list);
7071       }
7072       break;
7073 #endif
7074
7075     case OPTION_32:
7076       default_arch = "i386";
7077       break;
7078
7079     case OPTION_DIVIDE:
7080 #ifdef SVR4_COMMENT_CHARS
7081       {
7082         char *n, *t;
7083         const char *s;
7084
7085         n = (char *) xmalloc (strlen (i386_comment_chars) + 1);
7086         t = n;
7087         for (s = i386_comment_chars; *s != '\0'; s++)
7088           if (*s != '/')
7089             *t++ = *s;
7090         *t = '\0';
7091         i386_comment_chars = n;
7092       }
7093 #endif
7094       break;
7095
7096     case OPTION_MARCH:
7097       if (*arg == '.')
7098         as_fatal (_("Invalid -march= option: `%s'"), arg);
7099       for (i = 0; i < ARRAY_SIZE (cpu_arch); i++)
7100         {
7101           if (strcmp (arg, cpu_arch [i].name) == 0)
7102             {
7103               cpu_arch_isa = cpu_arch[i].type;
7104               cpu_arch_isa_flags = cpu_arch[i].flags;
7105               if (!cpu_arch_tune_set)
7106                 {
7107                   cpu_arch_tune = cpu_arch_isa;
7108                   cpu_arch_tune_flags = cpu_arch_isa_flags;
7109                 }
7110               break;
7111             }
7112         }
7113       if (i >= ARRAY_SIZE (cpu_arch))
7114         as_fatal (_("Invalid -march= option: `%s'"), arg);
7115       break;
7116
7117     case OPTION_MTUNE:
7118       if (*arg == '.')
7119         as_fatal (_("Invalid -mtune= option: `%s'"), arg);
7120       for (i = 0; i < ARRAY_SIZE (cpu_arch); i++)
7121         {
7122           if (strcmp (arg, cpu_arch [i].name) == 0)
7123             {
7124               cpu_arch_tune_set = 1;
7125               cpu_arch_tune = cpu_arch [i].type;
7126               cpu_arch_tune_flags = cpu_arch[i].flags;
7127               break;
7128             }
7129         }
7130       if (i >= ARRAY_SIZE (cpu_arch))
7131         as_fatal (_("Invalid -mtune= option: `%s'"), arg);
7132       break;
7133
7134     default:
7135       return 0;
7136     }
7137   return 1;
7138 }
7139
7140 void
7141 md_show_usage (stream)
7142      FILE *stream;
7143 {
7144 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
7145   fprintf (stream, _("\
7146   -Q                      ignored\n\
7147   -V                      print assembler version number\n\
7148   -k                      ignored\n"));
7149 #endif
7150   fprintf (stream, _("\
7151   -n                      Do not optimize code alignment\n\
7152   -q                      quieten some warnings\n"));
7153 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
7154   fprintf (stream, _("\
7155   -s                      ignored\n"));
7156 #endif
7157 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF) || defined(TE_PEP)
7158   fprintf (stream, _("\
7159   --32/--64               generate 32bit/64bit code\n"));
7160 #endif
7161 #ifdef SVR4_COMMENT_CHARS
7162   fprintf (stream, _("\
7163   --divide                do not treat `/' as a comment character\n"));
7164 #else
7165   fprintf (stream, _("\
7166   --divide                ignored\n"));
7167 #endif
7168   fprintf (stream, _("\
7169   -march=CPU/-mtune=CPU   generate code/optimize for CPU, where CPU is one of:\n\
7170                            i386, i486, pentium, pentiumpro, pentium4, nocona,\n\
7171                            core, core2, k6, athlon, k8, generic32, generic64\n"));
7172
7173 }
7174
7175 #if ((defined (OBJ_MAYBE_COFF) && defined (OBJ_MAYBE_AOUT)) \
7176      || defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF) || defined (TE_PEP))
7177
7178 /* Pick the target format to use.  */
7179
7180 const char *
7181 i386_target_format (void)
7182 {
7183   if (!strcmp (default_arch, "x86_64"))
7184     {
7185       set_code_flag (CODE_64BIT);
7186       if (UINTS_ALL_ZERO (cpu_arch_isa_flags))
7187         {
7188           cpu_arch_isa_flags.bitfield.cpui186 = 1;
7189           cpu_arch_isa_flags.bitfield.cpui286 = 1;
7190           cpu_arch_isa_flags.bitfield.cpui386 = 1;
7191           cpu_arch_isa_flags.bitfield.cpui486 = 1;
7192           cpu_arch_isa_flags.bitfield.cpui586 = 1;
7193           cpu_arch_isa_flags.bitfield.cpui686 = 1;
7194           cpu_arch_isa_flags.bitfield.cpup4 = 1;
7195           cpu_arch_isa_flags.bitfield.cpummx= 1;
7196           cpu_arch_isa_flags.bitfield.cpummx2 = 1;
7197           cpu_arch_isa_flags.bitfield.cpusse = 1;
7198           cpu_arch_isa_flags.bitfield.cpusse2 = 1;
7199         }
7200       if (UINTS_ALL_ZERO (cpu_arch_tune_flags))
7201         {
7202           cpu_arch_tune_flags.bitfield.cpui186 = 1;
7203           cpu_arch_tune_flags.bitfield.cpui286 = 1;
7204           cpu_arch_tune_flags.bitfield.cpui386 = 1;
7205           cpu_arch_tune_flags.bitfield.cpui486 = 1;
7206           cpu_arch_tune_flags.bitfield.cpui586 = 1;
7207           cpu_arch_tune_flags.bitfield.cpui686 = 1;
7208           cpu_arch_tune_flags.bitfield.cpup4 = 1;
7209           cpu_arch_tune_flags.bitfield.cpummx= 1;
7210           cpu_arch_tune_flags.bitfield.cpummx2 = 1;
7211           cpu_arch_tune_flags.bitfield.cpusse = 1;
7212           cpu_arch_tune_flags.bitfield.cpusse2 = 1;
7213         }
7214     }
7215   else if (!strcmp (default_arch, "i386"))
7216     {
7217       set_code_flag (CODE_32BIT);
7218       if (UINTS_ALL_ZERO (cpu_arch_isa_flags))
7219         {
7220           cpu_arch_isa_flags.bitfield.cpui186 = 1;
7221           cpu_arch_isa_flags.bitfield.cpui286 = 1;
7222           cpu_arch_isa_flags.bitfield.cpui386 = 1;
7223         }
7224       if (UINTS_ALL_ZERO (cpu_arch_tune_flags))
7225         {
7226           cpu_arch_tune_flags.bitfield.cpui186 = 1;
7227           cpu_arch_tune_flags.bitfield.cpui286 = 1;
7228           cpu_arch_tune_flags.bitfield.cpui386 = 1;
7229         }
7230     }
7231   else
7232     as_fatal (_("Unknown architecture"));
7233   switch (OUTPUT_FLAVOR)
7234     {
7235 #ifdef TE_PEP
7236     case bfd_target_coff_flavour:
7237       return flag_code == CODE_64BIT ? COFF_TARGET_FORMAT : "coff-i386";
7238       break;
7239 #endif
7240 #ifdef OBJ_MAYBE_AOUT
7241     case bfd_target_aout_flavour:
7242       return AOUT_TARGET_FORMAT;
7243 #endif
7244 #ifdef OBJ_MAYBE_COFF
7245     case bfd_target_coff_flavour:
7246       return "coff-i386";
7247 #endif
7248 #if defined (OBJ_MAYBE_ELF) || defined (OBJ_ELF)
7249     case bfd_target_elf_flavour:
7250       {
7251         if (flag_code == CODE_64BIT)
7252           {
7253             object_64bit = 1;
7254             use_rela_relocations = 1;
7255           }
7256         return flag_code == CODE_64BIT ? ELF_TARGET_FORMAT64 : ELF_TARGET_FORMAT;
7257       }
7258 #endif
7259     default:
7260       abort ();
7261       return NULL;
7262     }
7263 }
7264
7265 #endif /* OBJ_MAYBE_ more than one  */
7266
7267 #if (defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF))
7268 void
7269 i386_elf_emit_arch_note (void)
7270 {
7271   if (IS_ELF && cpu_arch_name != NULL)
7272     {
7273       char *p;
7274       asection *seg = now_seg;
7275       subsegT subseg = now_subseg;
7276       Elf_Internal_Note i_note;
7277       Elf_External_Note e_note;
7278       asection *note_secp;
7279       int len;
7280
7281       /* Create the .note section.  */
7282       note_secp = subseg_new (".note", 0);
7283       bfd_set_section_flags (stdoutput,
7284                              note_secp,
7285                              SEC_HAS_CONTENTS | SEC_READONLY);
7286
7287       /* Process the arch string.  */
7288       len = strlen (cpu_arch_name);
7289
7290       i_note.namesz = len + 1;
7291       i_note.descsz = 0;
7292       i_note.type = NT_ARCH;
7293       p = frag_more (sizeof (e_note.namesz));
7294       md_number_to_chars (p, (valueT) i_note.namesz, sizeof (e_note.namesz));
7295       p = frag_more (sizeof (e_note.descsz));
7296       md_number_to_chars (p, (valueT) i_note.descsz, sizeof (e_note.descsz));
7297       p = frag_more (sizeof (e_note.type));
7298       md_number_to_chars (p, (valueT) i_note.type, sizeof (e_note.type));
7299       p = frag_more (len + 1);
7300       strcpy (p, cpu_arch_name);
7301
7302       frag_align (2, 0, 0);
7303
7304       subseg_set (seg, subseg);
7305     }
7306 }
7307 #endif
7308 \f
7309 symbolS *
7310 md_undefined_symbol (name)
7311      char *name;
7312 {
7313   if (name[0] == GLOBAL_OFFSET_TABLE_NAME[0]
7314       && name[1] == GLOBAL_OFFSET_TABLE_NAME[1]
7315       && name[2] == GLOBAL_OFFSET_TABLE_NAME[2]
7316       && strcmp (name, GLOBAL_OFFSET_TABLE_NAME) == 0)
7317     {
7318       if (!GOT_symbol)
7319         {
7320           if (symbol_find (name))
7321             as_bad (_("GOT already in symbol table"));
7322           GOT_symbol = symbol_new (name, undefined_section,
7323                                    (valueT) 0, &zero_address_frag);
7324         };
7325       return GOT_symbol;
7326     }
7327   return 0;
7328 }
7329
7330 /* Round up a section size to the appropriate boundary.  */
7331
7332 valueT
7333 md_section_align (segment, size)
7334      segT segment ATTRIBUTE_UNUSED;
7335      valueT size;
7336 {
7337 #if (defined (OBJ_AOUT) || defined (OBJ_MAYBE_AOUT))
7338   if (OUTPUT_FLAVOR == bfd_target_aout_flavour)
7339     {
7340       /* For a.out, force the section size to be aligned.  If we don't do
7341          this, BFD will align it for us, but it will not write out the
7342          final bytes of the section.  This may be a bug in BFD, but it is
7343          easier to fix it here since that is how the other a.out targets
7344          work.  */
7345       int align;
7346
7347       align = bfd_get_section_alignment (stdoutput, segment);
7348       size = ((size + (1 << align) - 1) & ((valueT) -1 << align));
7349     }
7350 #endif
7351
7352   return size;
7353 }
7354
7355 /* On the i386, PC-relative offsets are relative to the start of the
7356    next instruction.  That is, the address of the offset, plus its
7357    size, since the offset is always the last part of the insn.  */
7358
7359 long
7360 md_pcrel_from (fixS *fixP)
7361 {
7362   return fixP->fx_size + fixP->fx_where + fixP->fx_frag->fr_address;
7363 }
7364
7365 #ifndef I386COFF
7366
7367 static void
7368 s_bss (int ignore ATTRIBUTE_UNUSED)
7369 {
7370   int temp;
7371
7372 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
7373   if (IS_ELF)
7374     obj_elf_section_change_hook ();
7375 #endif
7376   temp = get_absolute_expression ();
7377   subseg_set (bss_section, (subsegT) temp);
7378   demand_empty_rest_of_line ();
7379 }
7380
7381 #endif
7382
7383 void
7384 i386_validate_fix (fixS *fixp)
7385 {
7386   if (fixp->fx_subsy && fixp->fx_subsy == GOT_symbol)
7387     {
7388       if (fixp->fx_r_type == BFD_RELOC_32_PCREL)
7389         {
7390           if (!object_64bit)
7391             abort ();
7392           fixp->fx_r_type = BFD_RELOC_X86_64_GOTPCREL;
7393         }
7394       else
7395         {
7396           if (!object_64bit)
7397             fixp->fx_r_type = BFD_RELOC_386_GOTOFF;
7398           else
7399             fixp->fx_r_type = BFD_RELOC_X86_64_GOTOFF64;
7400         }
7401       fixp->fx_subsy = 0;
7402     }
7403 }
7404
7405 arelent *
7406 tc_gen_reloc (section, fixp)
7407      asection *section ATTRIBUTE_UNUSED;
7408      fixS *fixp;
7409 {
7410   arelent *rel;
7411   bfd_reloc_code_real_type code;
7412
7413   switch (fixp->fx_r_type)
7414     {
7415     case BFD_RELOC_X86_64_PLT32:
7416     case BFD_RELOC_X86_64_GOT32:
7417     case BFD_RELOC_X86_64_GOTPCREL:
7418     case BFD_RELOC_386_PLT32:
7419     case BFD_RELOC_386_GOT32:
7420     case BFD_RELOC_386_GOTOFF:
7421     case BFD_RELOC_386_GOTPC:
7422     case BFD_RELOC_386_TLS_GD:
7423     case BFD_RELOC_386_TLS_LDM:
7424     case BFD_RELOC_386_TLS_LDO_32:
7425     case BFD_RELOC_386_TLS_IE_32:
7426     case BFD_RELOC_386_TLS_IE:
7427     case BFD_RELOC_386_TLS_GOTIE:
7428     case BFD_RELOC_386_TLS_LE_32:
7429     case BFD_RELOC_386_TLS_LE:
7430     case BFD_RELOC_386_TLS_GOTDESC:
7431     case BFD_RELOC_386_TLS_DESC_CALL:
7432     case BFD_RELOC_X86_64_TLSGD:
7433     case BFD_RELOC_X86_64_TLSLD:
7434     case BFD_RELOC_X86_64_DTPOFF32:
7435     case BFD_RELOC_X86_64_DTPOFF64:
7436     case BFD_RELOC_X86_64_GOTTPOFF:
7437     case BFD_RELOC_X86_64_TPOFF32:
7438     case BFD_RELOC_X86_64_TPOFF64:
7439     case BFD_RELOC_X86_64_GOTOFF64:
7440     case BFD_RELOC_X86_64_GOTPC32:
7441     case BFD_RELOC_X86_64_GOT64:
7442     case BFD_RELOC_X86_64_GOTPCREL64:
7443     case BFD_RELOC_X86_64_GOTPC64:
7444     case BFD_RELOC_X86_64_GOTPLT64:
7445     case BFD_RELOC_X86_64_PLTOFF64:
7446     case BFD_RELOC_X86_64_GOTPC32_TLSDESC:
7447     case BFD_RELOC_X86_64_TLSDESC_CALL:
7448     case BFD_RELOC_RVA:
7449     case BFD_RELOC_VTABLE_ENTRY:
7450     case BFD_RELOC_VTABLE_INHERIT:
7451 #ifdef TE_PE
7452     case BFD_RELOC_32_SECREL:
7453 #endif
7454       code = fixp->fx_r_type;
7455       break;
7456     case BFD_RELOC_X86_64_32S:
7457       if (!fixp->fx_pcrel)
7458         {
7459           /* Don't turn BFD_RELOC_X86_64_32S into BFD_RELOC_32.  */
7460           code = fixp->fx_r_type;
7461           break;
7462         }
7463     default:
7464       if (fixp->fx_pcrel)
7465         {
7466           switch (fixp->fx_size)
7467             {
7468             default:
7469               as_bad_where (fixp->fx_file, fixp->fx_line,
7470                             _("can not do %d byte pc-relative relocation"),
7471                             fixp->fx_size);
7472               code = BFD_RELOC_32_PCREL;
7473               break;
7474             case 1: code = BFD_RELOC_8_PCREL;  break;
7475             case 2: code = BFD_RELOC_16_PCREL; break;
7476             case 4: code = BFD_RELOC_32_PCREL; break;
7477 #ifdef BFD64
7478             case 8: code = BFD_RELOC_64_PCREL; break;
7479 #endif
7480             }
7481         }
7482       else
7483         {
7484           switch (fixp->fx_size)
7485             {
7486             default:
7487               as_bad_where (fixp->fx_file, fixp->fx_line,
7488                             _("can not do %d byte relocation"),
7489                             fixp->fx_size);
7490               code = BFD_RELOC_32;
7491               break;
7492             case 1: code = BFD_RELOC_8;  break;
7493             case 2: code = BFD_RELOC_16; break;
7494             case 4: code = BFD_RELOC_32; break;
7495 #ifdef BFD64
7496             case 8: code = BFD_RELOC_64; break;
7497 #endif
7498             }
7499         }
7500       break;
7501     }
7502
7503   if ((code == BFD_RELOC_32
7504        || code == BFD_RELOC_32_PCREL
7505        || code == BFD_RELOC_X86_64_32S)
7506       && GOT_symbol
7507       && fixp->fx_addsy == GOT_symbol)
7508     {
7509       if (!object_64bit)
7510         code = BFD_RELOC_386_GOTPC;
7511       else
7512         code = BFD_RELOC_X86_64_GOTPC32;
7513     }
7514   if ((code == BFD_RELOC_64 || code == BFD_RELOC_64_PCREL)
7515       && GOT_symbol
7516       && fixp->fx_addsy == GOT_symbol)
7517     {
7518       code = BFD_RELOC_X86_64_GOTPC64;
7519     }
7520
7521   rel = (arelent *) xmalloc (sizeof (arelent));
7522   rel->sym_ptr_ptr = (asymbol **) xmalloc (sizeof (asymbol *));
7523   *rel->sym_ptr_ptr = symbol_get_bfdsym (fixp->fx_addsy);
7524
7525   rel->address = fixp->fx_frag->fr_address + fixp->fx_where;
7526
7527   if (!use_rela_relocations)
7528     {
7529       /* HACK: Since i386 ELF uses Rel instead of Rela, encode the
7530          vtable entry to be used in the relocation's section offset.  */
7531       if (fixp->fx_r_type == BFD_RELOC_VTABLE_ENTRY)
7532         rel->address = fixp->fx_offset;
7533
7534       rel->addend = 0;
7535     }
7536   /* Use the rela in 64bit mode.  */
7537   else
7538     {
7539       if (!fixp->fx_pcrel)
7540         rel->addend = fixp->fx_offset;
7541       else
7542         switch (code)
7543           {
7544           case BFD_RELOC_X86_64_PLT32:
7545           case BFD_RELOC_X86_64_GOT32:
7546           case BFD_RELOC_X86_64_GOTPCREL:
7547           case BFD_RELOC_X86_64_TLSGD:
7548           case BFD_RELOC_X86_64_TLSLD:
7549           case BFD_RELOC_X86_64_GOTTPOFF:
7550           case BFD_RELOC_X86_64_GOTPC32_TLSDESC:
7551           case BFD_RELOC_X86_64_TLSDESC_CALL:
7552             rel->addend = fixp->fx_offset - fixp->fx_size;
7553             break;
7554           default:
7555             rel->addend = (section->vma
7556                            - fixp->fx_size
7557                            + fixp->fx_addnumber
7558                            + md_pcrel_from (fixp));
7559             break;
7560           }
7561     }
7562
7563   rel->howto = bfd_reloc_type_lookup (stdoutput, code);
7564   if (rel->howto == NULL)
7565     {
7566       as_bad_where (fixp->fx_file, fixp->fx_line,
7567                     _("cannot represent relocation type %s"),
7568                     bfd_get_reloc_code_name (code));
7569       /* Set howto to a garbage value so that we can keep going.  */
7570       rel->howto = bfd_reloc_type_lookup (stdoutput, BFD_RELOC_32);
7571       assert (rel->howto != NULL);
7572     }
7573
7574   return rel;
7575 }
7576
7577 \f
7578 /* Parse operands using Intel syntax. This implements a recursive descent
7579    parser based on the BNF grammar published in Appendix B of the MASM 6.1
7580    Programmer's Guide.
7581
7582    FIXME: We do not recognize the full operand grammar defined in the MASM
7583           documentation.  In particular, all the structure/union and
7584           high-level macro operands are missing.
7585
7586    Uppercase words are terminals, lower case words are non-terminals.
7587    Objects surrounded by double brackets '[[' ']]' are optional. Vertical
7588    bars '|' denote choices. Most grammar productions are implemented in
7589    functions called 'intel_<production>'.
7590
7591    Initial production is 'expr'.
7592
7593     addOp               + | -
7594
7595     alpha               [a-zA-Z]
7596
7597     binOp               & | AND | \| | OR | ^ | XOR
7598
7599     byteRegister        AL | AH | BL | BH | CL | CH | DL | DH
7600
7601     constant            digits [[ radixOverride ]]
7602
7603     dataType            BYTE | WORD | DWORD | FWORD | QWORD | TBYTE | OWORD | XMMWORD
7604
7605     digits              decdigit
7606                         | digits decdigit
7607                         | digits hexdigit
7608
7609     decdigit            [0-9]
7610
7611     e04                 e04 addOp e05
7612                         | e05
7613
7614     e05                 e05 binOp e06
7615                         | e06
7616
7617     e06                 e06 mulOp e09
7618                         | e09
7619
7620     e09                 OFFSET e10
7621                         | SHORT e10
7622                         | + e10
7623                         | - e10
7624                         | ~ e10
7625                         | NOT e10
7626                         | e09 PTR e10
7627                         | e09 : e10
7628                         | e10
7629
7630     e10                 e10 [ expr ]
7631                         | e11
7632
7633     e11                 ( expr )
7634                         | [ expr ]
7635                         | constant
7636                         | dataType
7637                         | id
7638                         | $
7639                         | register
7640
7641  => expr                expr cmpOp e04
7642                         | e04
7643
7644     gpRegister          AX | EAX | BX | EBX | CX | ECX | DX | EDX
7645                         | BP | EBP | SP | ESP | DI | EDI | SI | ESI
7646
7647     hexdigit            a | b | c | d | e | f
7648                         | A | B | C | D | E | F
7649
7650     id                  alpha
7651                         | id alpha
7652                         | id decdigit
7653
7654     mulOp               * | / | % | MOD | << | SHL | >> | SHR
7655
7656     quote               " | '
7657
7658     register            specialRegister
7659                         | gpRegister
7660                         | byteRegister
7661
7662     segmentRegister     CS | DS | ES | FS | GS | SS
7663
7664     specialRegister     CR0 | CR2 | CR3 | CR4
7665                         | DR0 | DR1 | DR2 | DR3 | DR6 | DR7
7666                         | TR3 | TR4 | TR5 | TR6 | TR7
7667
7668     We simplify the grammar in obvious places (e.g., register parsing is
7669     done by calling parse_register) and eliminate immediate left recursion
7670     to implement a recursive-descent parser.
7671
7672     expr        e04 expr'
7673
7674     expr'       cmpOp e04 expr'
7675                 | Empty
7676
7677     e04         e05 e04'
7678
7679     e04'        addOp e05 e04'
7680                 | Empty
7681
7682     e05         e06 e05'
7683
7684     e05'        binOp e06 e05'
7685                 | Empty
7686
7687     e06         e09 e06'
7688
7689     e06'        mulOp e09 e06'
7690                 | Empty
7691
7692     e09         OFFSET e10 e09'
7693                 | SHORT e10'
7694                 | + e10'
7695                 | - e10'
7696                 | ~ e10'
7697                 | NOT e10'
7698                 | e10 e09'
7699
7700     e09'        PTR e10 e09'
7701                 | : e10 e09'
7702                 | Empty
7703
7704     e10         e11 e10'
7705
7706     e10'        [ expr ] e10'
7707                 | Empty
7708
7709     e11         ( expr )
7710                 | [ expr ]
7711                 | BYTE
7712                 | WORD
7713                 | DWORD
7714                 | FWORD
7715                 | QWORD
7716                 | TBYTE
7717                 | OWORD
7718                 | XMMWORD
7719                 | .
7720                 | $
7721                 | register
7722                 | id
7723                 | constant  */
7724
7725 /* Parsing structure for the intel syntax parser. Used to implement the
7726    semantic actions for the operand grammar.  */
7727 struct intel_parser_s
7728   {
7729     char *op_string;            /* The string being parsed.  */
7730     int got_a_float;            /* Whether the operand is a float.  */
7731     int op_modifier;            /* Operand modifier.  */
7732     int is_mem;                 /* 1 if operand is memory reference.  */
7733     int in_offset;              /* >=1 if parsing operand of offset.  */
7734     int in_bracket;             /* >=1 if parsing operand in brackets.  */
7735     const reg_entry *reg;       /* Last register reference found.  */
7736     char *disp;                 /* Displacement string being built.  */
7737     char *next_operand;         /* Resume point when splitting operands.  */
7738   };
7739
7740 static struct intel_parser_s intel_parser;
7741
7742 /* Token structure for parsing intel syntax.  */
7743 struct intel_token
7744   {
7745     int code;                   /* Token code.  */
7746     const reg_entry *reg;       /* Register entry for register tokens.  */
7747     char *str;                  /* String representation.  */
7748   };
7749
7750 static struct intel_token cur_token, prev_token;
7751
7752 /* Token codes for the intel parser. Since T_SHORT is already used
7753    by COFF, undefine it first to prevent a warning.  */
7754 #define T_NIL           -1
7755 #define T_CONST         1
7756 #define T_REG           2
7757 #define T_BYTE          3
7758 #define T_WORD          4
7759 #define T_DWORD         5
7760 #define T_FWORD         6
7761 #define T_QWORD         7
7762 #define T_TBYTE         8
7763 #define T_XMMWORD       9
7764 #undef  T_SHORT
7765 #define T_SHORT         10
7766 #define T_OFFSET        11
7767 #define T_PTR           12
7768 #define T_ID            13
7769 #define T_SHL           14
7770 #define T_SHR           15
7771
7772 /* Prototypes for intel parser functions.  */
7773 static int intel_match_token (int);
7774 static void intel_putback_token (void);
7775 static void intel_get_token (void);
7776 static int intel_expr (void);
7777 static int intel_e04 (void);
7778 static int intel_e05 (void);
7779 static int intel_e06 (void);
7780 static int intel_e09 (void);
7781 static int intel_e10 (void);
7782 static int intel_e11 (void);
7783
7784 static int
7785 i386_intel_operand (char *operand_string, int got_a_float)
7786 {
7787   int ret;
7788   char *p;
7789
7790   p = intel_parser.op_string = xstrdup (operand_string);
7791   intel_parser.disp = (char *) xmalloc (strlen (operand_string) + 1);
7792
7793   for (;;)
7794     {
7795       /* Initialize token holders.  */
7796       cur_token.code = prev_token.code = T_NIL;
7797       cur_token.reg = prev_token.reg = NULL;
7798       cur_token.str = prev_token.str = NULL;
7799
7800       /* Initialize parser structure.  */
7801       intel_parser.got_a_float = got_a_float;
7802       intel_parser.op_modifier = 0;
7803       intel_parser.is_mem = 0;
7804       intel_parser.in_offset = 0;
7805       intel_parser.in_bracket = 0;
7806       intel_parser.reg = NULL;
7807       intel_parser.disp[0] = '\0';
7808       intel_parser.next_operand = NULL;
7809
7810       /* Read the first token and start the parser.  */
7811       intel_get_token ();
7812       ret = intel_expr ();
7813
7814       if (!ret)
7815         break;
7816
7817       if (cur_token.code != T_NIL)
7818         {
7819           as_bad (_("invalid operand for '%s' ('%s' unexpected)"),
7820                   current_templates->start->name, cur_token.str);
7821           ret = 0;
7822         }
7823       /* If we found a memory reference, hand it over to i386_displacement
7824          to fill in the rest of the operand fields.  */
7825       else if (intel_parser.is_mem)
7826         {
7827           if ((i.mem_operands == 1
7828                && !current_templates->start->opcode_modifier.isstring)
7829               || i.mem_operands == 2)
7830             {
7831               as_bad (_("too many memory references for '%s'"),
7832                       current_templates->start->name);
7833               ret = 0;
7834             }
7835           else
7836             {
7837               char *s = intel_parser.disp;
7838               i.mem_operands++;
7839
7840               if (!quiet_warnings && intel_parser.is_mem < 0)
7841                 /* See the comments in intel_bracket_expr.  */
7842                 as_warn (_("Treating `%s' as memory reference"), operand_string);
7843
7844               /* Add the displacement expression.  */
7845               if (*s != '\0')
7846                 ret = i386_displacement (s, s + strlen (s));
7847               if (ret)
7848                 {
7849                   /* Swap base and index in 16-bit memory operands like
7850                      [si+bx]. Since i386_index_check is also used in AT&T
7851                      mode we have to do that here.  */
7852                   if (i.base_reg
7853                       && i.index_reg
7854                       && i.base_reg->reg_type.bitfield.reg16
7855                       && i.index_reg->reg_type.bitfield.reg16
7856                       && i.base_reg->reg_num >= 6
7857                       && i.index_reg->reg_num < 6)
7858                     {
7859                       const reg_entry *base = i.index_reg;
7860
7861                       i.index_reg = i.base_reg;
7862                       i.base_reg = base;
7863                     }
7864                   ret = i386_index_check (operand_string);
7865                 }
7866             }
7867         }
7868
7869       /* Constant and OFFSET expressions are handled by i386_immediate.  */
7870       else if ((intel_parser.op_modifier & (1 << T_OFFSET))
7871                || intel_parser.reg == NULL)
7872         ret = i386_immediate (intel_parser.disp);
7873
7874       if (intel_parser.next_operand && this_operand >= MAX_OPERANDS - 1)
7875         ret = 0;
7876       if (!ret || !intel_parser.next_operand)
7877         break;
7878       intel_parser.op_string = intel_parser.next_operand;
7879       this_operand = i.operands++;
7880     }
7881
7882   free (p);
7883   free (intel_parser.disp);
7884
7885   return ret;
7886 }
7887
7888 #define NUM_ADDRESS_REGS (!!i.base_reg + !!i.index_reg)
7889
7890 /* expr e04 expr'
7891
7892    expr'  cmpOp e04 expr'
7893         | Empty  */
7894 static int
7895 intel_expr (void)
7896 {
7897   /* XXX Implement the comparison operators.  */
7898   return intel_e04 ();
7899 }
7900
7901 /* e04  e05 e04'
7902
7903    e04' addOp e05 e04'
7904         | Empty  */
7905 static int
7906 intel_e04 (void)
7907 {
7908   int nregs = -1;
7909
7910   for (;;)
7911     {
7912       if (!intel_e05())
7913         return 0;
7914
7915       if (nregs >= 0 && NUM_ADDRESS_REGS > nregs)
7916         i.base_reg = i386_regtab + REGNAM_AL; /* al is invalid as base */
7917
7918       if (cur_token.code == '+')
7919         nregs = -1;
7920       else if (cur_token.code == '-')
7921         nregs = NUM_ADDRESS_REGS;
7922       else
7923         return 1;
7924
7925       strcat (intel_parser.disp, cur_token.str);
7926       intel_match_token (cur_token.code);
7927     }
7928 }
7929
7930 /* e05  e06 e05'
7931
7932    e05' binOp e06 e05'
7933         | Empty  */
7934 static int
7935 intel_e05 (void)
7936 {
7937   int nregs = ~NUM_ADDRESS_REGS;
7938
7939   for (;;)
7940     {
7941       if (!intel_e06())
7942         return 0;
7943
7944       if (cur_token.code == '&'
7945           || cur_token.code == '|'
7946           || cur_token.code == '^')
7947         {
7948           char str[2];
7949
7950           str[0] = cur_token.code;
7951           str[1] = 0;
7952           strcat (intel_parser.disp, str);
7953         }
7954       else
7955         break;
7956
7957       intel_match_token (cur_token.code);
7958
7959       if (nregs < 0)
7960         nregs = ~nregs;
7961     }
7962   if (nregs >= 0 && NUM_ADDRESS_REGS > nregs)
7963     i.base_reg = i386_regtab + REGNAM_AL + 1; /* cl is invalid as base */
7964   return 1;
7965 }
7966
7967 /* e06  e09 e06'
7968
7969    e06' mulOp e09 e06'
7970         | Empty  */
7971 static int
7972 intel_e06 (void)
7973 {
7974   int nregs = ~NUM_ADDRESS_REGS;
7975
7976   for (;;)
7977     {
7978       if (!intel_e09())
7979         return 0;
7980
7981       if (cur_token.code == '*'
7982           || cur_token.code == '/'
7983           || cur_token.code == '%')
7984         {
7985           char str[2];
7986
7987           str[0] = cur_token.code;
7988           str[1] = 0;
7989           strcat (intel_parser.disp, str);
7990         }
7991       else if (cur_token.code == T_SHL)
7992         strcat (intel_parser.disp, "<<");
7993       else if (cur_token.code == T_SHR)
7994         strcat (intel_parser.disp, ">>");
7995       else
7996         break;
7997
7998       intel_match_token (cur_token.code);
7999
8000       if (nregs < 0)
8001         nregs = ~nregs;
8002     }
8003   if (nregs >= 0 && NUM_ADDRESS_REGS > nregs)
8004     i.base_reg = i386_regtab + REGNAM_AL + 2; /* dl is invalid as base */
8005   return 1;
8006 }
8007
8008 /* e09  OFFSET e09
8009         | SHORT e09
8010         | + e09
8011         | - e09
8012         | ~ e09
8013         | NOT e09
8014         | e10 e09'
8015
8016    e09' PTR e10 e09'
8017         | : e10 e09'
8018         | Empty */
8019 static int
8020 intel_e09 (void)
8021 {
8022   int nregs = ~NUM_ADDRESS_REGS;
8023   int in_offset = 0;
8024
8025   for (;;)
8026     {
8027       /* Don't consume constants here.  */
8028       if (cur_token.code == '+' || cur_token.code == '-')
8029         {
8030           /* Need to look one token ahead - if the next token
8031              is a constant, the current token is its sign.  */
8032           int next_code;
8033
8034           intel_match_token (cur_token.code);
8035           next_code = cur_token.code;
8036           intel_putback_token ();
8037           if (next_code == T_CONST)
8038             break;
8039         }
8040
8041       /* e09  OFFSET e09  */
8042       if (cur_token.code == T_OFFSET)
8043         {
8044           if (!in_offset++)
8045             ++intel_parser.in_offset;
8046         }
8047
8048       /* e09  SHORT e09  */
8049       else if (cur_token.code == T_SHORT)
8050         intel_parser.op_modifier |= 1 << T_SHORT;
8051
8052       /* e09  + e09  */
8053       else if (cur_token.code == '+')
8054         strcat (intel_parser.disp, "+");
8055
8056       /* e09  - e09
8057               | ~ e09
8058               | NOT e09  */
8059       else if (cur_token.code == '-' || cur_token.code == '~')
8060         {
8061           char str[2];
8062
8063           if (nregs < 0)
8064             nregs = ~nregs;
8065           str[0] = cur_token.code;
8066           str[1] = 0;
8067           strcat (intel_parser.disp, str);
8068         }
8069
8070       /* e09  e10 e09'  */
8071       else
8072         break;
8073
8074       intel_match_token (cur_token.code);
8075     }
8076
8077   for (;;)
8078     {
8079       if (!intel_e10 ())
8080         return 0;
8081
8082       /* e09'  PTR e10 e09' */
8083       if (cur_token.code == T_PTR)
8084         {
8085           char suffix;
8086
8087           if (prev_token.code == T_BYTE)
8088             suffix = BYTE_MNEM_SUFFIX;
8089
8090           else if (prev_token.code == T_WORD)
8091             {
8092               if (current_templates->start->name[0] == 'l'
8093                   && current_templates->start->name[2] == 's'
8094                   && current_templates->start->name[3] == 0)
8095                 suffix = BYTE_MNEM_SUFFIX; /* so it will cause an error */
8096               else if (intel_parser.got_a_float == 2)   /* "fi..." */
8097                 suffix = SHORT_MNEM_SUFFIX;
8098               else
8099                 suffix = WORD_MNEM_SUFFIX;
8100             }
8101
8102           else if (prev_token.code == T_DWORD)
8103             {
8104               if (current_templates->start->name[0] == 'l'
8105                   && current_templates->start->name[2] == 's'
8106                   && current_templates->start->name[3] == 0)
8107                 suffix = WORD_MNEM_SUFFIX;
8108               else if (flag_code == CODE_16BIT
8109                        && (current_templates->start->opcode_modifier.jump
8110                            || current_templates->start->opcode_modifier.jumpdword))
8111                 suffix = LONG_DOUBLE_MNEM_SUFFIX;
8112               else if (intel_parser.got_a_float == 1)   /* "f..." */
8113                 suffix = SHORT_MNEM_SUFFIX;
8114               else
8115                 suffix = LONG_MNEM_SUFFIX;
8116             }
8117
8118           else if (prev_token.code == T_FWORD)
8119             {
8120               if (current_templates->start->name[0] == 'l'
8121                   && current_templates->start->name[2] == 's'
8122                   && current_templates->start->name[3] == 0)
8123                 suffix = LONG_MNEM_SUFFIX;
8124               else if (!intel_parser.got_a_float)
8125                 {
8126                   if (flag_code == CODE_16BIT)
8127                     add_prefix (DATA_PREFIX_OPCODE);
8128                   suffix = LONG_DOUBLE_MNEM_SUFFIX;
8129                 }
8130               else
8131                 suffix = BYTE_MNEM_SUFFIX; /* so it will cause an error */
8132             }
8133
8134           else if (prev_token.code == T_QWORD)
8135             {
8136               if (intel_parser.got_a_float == 1)        /* "f..." */
8137                 suffix = LONG_MNEM_SUFFIX;
8138               else
8139                 suffix = QWORD_MNEM_SUFFIX;
8140             }
8141
8142           else if (prev_token.code == T_TBYTE)
8143             {
8144               if (intel_parser.got_a_float == 1)
8145                 suffix = LONG_DOUBLE_MNEM_SUFFIX;
8146               else
8147                 suffix = BYTE_MNEM_SUFFIX; /* so it will cause an error */
8148             }
8149
8150           else if (prev_token.code == T_XMMWORD)
8151             {
8152               /* XXX ignored for now, but accepted since gcc uses it */
8153               suffix = 0;
8154             }
8155
8156           else
8157             {
8158               as_bad (_("Unknown operand modifier `%s'"), prev_token.str);
8159               return 0;
8160             }
8161
8162           /* Operands for jump/call using 'ptr' notation denote absolute
8163              addresses.  */
8164           if (current_templates->start->opcode_modifier.jump
8165               || current_templates->start->opcode_modifier.jumpdword)
8166             i.types[this_operand].bitfield.jumpabsolute = 1;
8167
8168           if (current_templates->start->base_opcode == 0x8d /* lea */)
8169             ;
8170           else if (!i.suffix)
8171             i.suffix = suffix;
8172           else if (i.suffix != suffix)
8173             {
8174               as_bad (_("Conflicting operand modifiers"));
8175               return 0;
8176             }
8177
8178         }
8179
8180       /* e09'  : e10 e09'  */
8181       else if (cur_token.code == ':')
8182         {
8183           if (prev_token.code != T_REG)
8184             {
8185               /* While {call,jmp} SSSS:OOOO is MASM syntax only when SSSS is a
8186                  segment/group identifier (which we don't have), using comma
8187                  as the operand separator there is even less consistent, since
8188                  there all branches only have a single operand.  */
8189               if (this_operand != 0
8190                   || intel_parser.in_offset
8191                   || intel_parser.in_bracket
8192                   || (!current_templates->start->opcode_modifier.jump
8193                       && !current_templates->start->opcode_modifier.jumpdword
8194                       && !current_templates->start->opcode_modifier.jumpintersegment
8195                       && !current_templates->start->operand_types[0].bitfield.jumpabsolute))
8196                 return intel_match_token (T_NIL);
8197               /* Remember the start of the 2nd operand and terminate 1st
8198                  operand here.
8199                  XXX This isn't right, yet (when SSSS:OOOO is right operand of
8200                  another expression), but it gets at least the simplest case
8201                  (a plain number or symbol on the left side) right.  */
8202               intel_parser.next_operand = intel_parser.op_string;
8203               *--intel_parser.op_string = '\0';
8204               return intel_match_token (':');
8205             }
8206         }
8207
8208       /* e09'  Empty  */
8209       else
8210         break;
8211
8212       intel_match_token (cur_token.code);
8213
8214     }
8215
8216   if (in_offset)
8217     {
8218       --intel_parser.in_offset;
8219       if (nregs < 0)
8220         nregs = ~nregs;
8221       if (NUM_ADDRESS_REGS > nregs)
8222         {
8223           as_bad (_("Invalid operand to `OFFSET'"));
8224           return 0;
8225         }
8226       intel_parser.op_modifier |= 1 << T_OFFSET;
8227     }
8228
8229   if (nregs >= 0 && NUM_ADDRESS_REGS > nregs)
8230     i.base_reg = i386_regtab + REGNAM_AL + 3; /* bl is invalid as base */
8231   return 1;
8232 }
8233
8234 static int
8235 intel_bracket_expr (void)
8236 {
8237   int was_offset = intel_parser.op_modifier & (1 << T_OFFSET);
8238   const char *start = intel_parser.op_string;
8239   int len;
8240
8241   if (i.op[this_operand].regs)
8242     return intel_match_token (T_NIL);
8243
8244   intel_match_token ('[');
8245
8246   /* Mark as a memory operand only if it's not already known to be an
8247      offset expression.  If it's an offset expression, we need to keep
8248      the brace in.  */
8249   if (!intel_parser.in_offset)
8250     {
8251       ++intel_parser.in_bracket;
8252
8253       /* Operands for jump/call inside brackets denote absolute addresses.  */
8254       if (current_templates->start->opcode_modifier.jump
8255           || current_templates->start->opcode_modifier.jumpdword)
8256         i.types[this_operand].bitfield.jumpabsolute = 1;
8257
8258       /* Unfortunately gas always diverged from MASM in a respect that can't
8259          be easily fixed without risking to break code sequences likely to be
8260          encountered (the testsuite even check for this): MASM doesn't consider
8261          an expression inside brackets unconditionally as a memory reference.
8262          When that is e.g. a constant, an offset expression, or the sum of the
8263          two, this is still taken as a constant load. gas, however, always
8264          treated these as memory references. As a compromise, we'll try to make
8265          offset expressions inside brackets work the MASM way (since that's
8266          less likely to be found in real world code), but make constants alone
8267          continue to work the traditional gas way. In either case, issue a
8268          warning.  */
8269       intel_parser.op_modifier &= ~was_offset;
8270     }
8271   else
8272     strcat (intel_parser.disp, "[");
8273
8274   /* Add a '+' to the displacement string if necessary.  */
8275   if (*intel_parser.disp != '\0'
8276       && *(intel_parser.disp + strlen (intel_parser.disp) - 1) != '+')
8277     strcat (intel_parser.disp, "+");
8278
8279   if (intel_expr ()
8280       && (len = intel_parser.op_string - start - 1,
8281           intel_match_token (']')))
8282     {
8283       /* Preserve brackets when the operand is an offset expression.  */
8284       if (intel_parser.in_offset)
8285         strcat (intel_parser.disp, "]");
8286       else
8287         {
8288           --intel_parser.in_bracket;
8289           if (i.base_reg || i.index_reg)
8290             intel_parser.is_mem = 1;
8291           if (!intel_parser.is_mem)
8292             {
8293               if (!(intel_parser.op_modifier & (1 << T_OFFSET)))
8294                 /* Defer the warning until all of the operand was parsed.  */
8295                 intel_parser.is_mem = -1;
8296               else if (!quiet_warnings)
8297                 as_warn (_("`[%.*s]' taken to mean just `%.*s'"),
8298                          len, start, len, start);
8299             }
8300         }
8301       intel_parser.op_modifier |= was_offset;
8302
8303       return 1;
8304     }
8305   return 0;
8306 }
8307
8308 /* e10  e11 e10'
8309
8310    e10' [ expr ] e10'
8311         | Empty  */
8312 static int
8313 intel_e10 (void)
8314 {
8315   if (!intel_e11 ())
8316     return 0;
8317
8318   while (cur_token.code == '[')
8319     {
8320       if (!intel_bracket_expr ())
8321         return 0;
8322     }
8323
8324   return 1;
8325 }
8326
8327 /* e11  ( expr )
8328         | [ expr ]
8329         | BYTE
8330         | WORD
8331         | DWORD
8332         | FWORD
8333         | QWORD
8334         | TBYTE
8335         | OWORD
8336         | XMMWORD
8337         | $
8338         | .
8339         | register
8340         | id
8341         | constant  */
8342 static int
8343 intel_e11 (void)
8344 {
8345   switch (cur_token.code)
8346     {
8347     /* e11  ( expr ) */
8348     case '(':
8349       intel_match_token ('(');
8350       strcat (intel_parser.disp, "(");
8351
8352       if (intel_expr () && intel_match_token (')'))
8353         {
8354           strcat (intel_parser.disp, ")");
8355           return 1;
8356         }
8357       return 0;
8358
8359     /* e11  [ expr ] */
8360     case '[':
8361       return intel_bracket_expr ();
8362
8363     /* e11  $
8364             | .  */
8365     case '.':
8366       strcat (intel_parser.disp, cur_token.str);
8367       intel_match_token (cur_token.code);
8368
8369       /* Mark as a memory operand only if it's not already known to be an
8370          offset expression.  */
8371       if (!intel_parser.in_offset)
8372         intel_parser.is_mem = 1;
8373
8374       return 1;
8375
8376     /* e11  register  */
8377     case T_REG:
8378       {
8379         const reg_entry *reg = intel_parser.reg = cur_token.reg;
8380
8381         intel_match_token (T_REG);
8382
8383         /* Check for segment change.  */
8384         if (cur_token.code == ':')
8385           {
8386             if (!reg->reg_type.bitfield.sreg2
8387                 && !reg->reg_type.bitfield.sreg3)
8388               {
8389                 as_bad (_("`%s' is not a valid segment register"),
8390                         reg->reg_name);
8391                 return 0;
8392               }
8393             else if (i.seg[i.mem_operands])
8394               as_warn (_("Extra segment override ignored"));
8395             else
8396               {
8397                 if (!intel_parser.in_offset)
8398                   intel_parser.is_mem = 1;
8399                 switch (reg->reg_num)
8400                   {
8401                   case 0:
8402                     i.seg[i.mem_operands] = &es;
8403                     break;
8404                   case 1:
8405                     i.seg[i.mem_operands] = &cs;
8406                     break;
8407                   case 2:
8408                     i.seg[i.mem_operands] = &ss;
8409                     break;
8410                   case 3:
8411                     i.seg[i.mem_operands] = &ds;
8412                     break;
8413                   case 4:
8414                     i.seg[i.mem_operands] = &fs;
8415                     break;
8416                   case 5:
8417                     i.seg[i.mem_operands] = &gs;
8418                     break;
8419                   }
8420               }
8421           }
8422
8423         /* Not a segment register. Check for register scaling.  */
8424         else if (cur_token.code == '*')
8425           {
8426             if (!intel_parser.in_bracket)
8427               {
8428                 as_bad (_("Register scaling only allowed in memory operands"));
8429                 return 0;
8430               }
8431
8432             if (reg->reg_type.bitfield.reg16) /* Disallow things like [si*1]. */
8433               reg = i386_regtab + REGNAM_AX + 4; /* sp is invalid as index */
8434             else if (i.index_reg)
8435               reg = i386_regtab + REGNAM_EAX + 4; /* esp is invalid as index */
8436
8437             /* What follows must be a valid scale.  */
8438             intel_match_token ('*');
8439             i.index_reg = reg;
8440             i.types[this_operand].bitfield.baseindex = 1;
8441
8442             /* Set the scale after setting the register (otherwise,
8443                i386_scale will complain)  */
8444             if (cur_token.code == '+' || cur_token.code == '-')
8445               {
8446                 char *str, sign = cur_token.code;
8447                 intel_match_token (cur_token.code);
8448                 if (cur_token.code != T_CONST)
8449                   {
8450                     as_bad (_("Syntax error: Expecting a constant, got `%s'"),
8451                             cur_token.str);
8452                     return 0;
8453                   }
8454                 str = (char *) xmalloc (strlen (cur_token.str) + 2);
8455                 strcpy (str + 1, cur_token.str);
8456                 *str = sign;
8457                 if (!i386_scale (str))
8458                   return 0;
8459                 free (str);
8460               }
8461             else if (!i386_scale (cur_token.str))
8462               return 0;
8463             intel_match_token (cur_token.code);
8464           }
8465
8466         /* No scaling. If this is a memory operand, the register is either a
8467            base register (first occurrence) or an index register (second
8468            occurrence).  */
8469         else if (intel_parser.in_bracket)
8470           {
8471
8472             if (!i.base_reg)
8473               i.base_reg = reg;
8474             else if (!i.index_reg)
8475               i.index_reg = reg;
8476             else
8477               {
8478                 as_bad (_("Too many register references in memory operand"));
8479                 return 0;
8480               }
8481
8482             i.types[this_operand].bitfield.baseindex = 1;
8483           }
8484
8485         /* It's neither base nor index.  */
8486         else if (!intel_parser.in_offset && !intel_parser.is_mem)
8487           {
8488             i386_operand_type temp = reg->reg_type;
8489             temp.bitfield.baseindex = 0;
8490             i.types[this_operand] = operand_type_or (i.types[this_operand],
8491                                                      temp);
8492             i.op[this_operand].regs = reg;
8493             i.reg_operands++;
8494           }
8495         else
8496           {
8497             as_bad (_("Invalid use of register"));
8498             return 0;
8499           }
8500
8501         /* Since registers are not part of the displacement string (except
8502            when we're parsing offset operands), we may need to remove any
8503            preceding '+' from the displacement string.  */
8504         if (*intel_parser.disp != '\0'
8505             && !intel_parser.in_offset)
8506           {
8507             char *s = intel_parser.disp;
8508             s += strlen (s) - 1;
8509             if (*s == '+')
8510               *s = '\0';
8511           }
8512
8513         return 1;
8514       }
8515
8516     /* e11  BYTE
8517             | WORD
8518             | DWORD
8519             | FWORD
8520             | QWORD
8521             | TBYTE
8522             | OWORD
8523             | XMMWORD  */
8524     case T_BYTE:
8525     case T_WORD:
8526     case T_DWORD:
8527     case T_FWORD:
8528     case T_QWORD:
8529     case T_TBYTE:
8530     case T_XMMWORD:
8531       intel_match_token (cur_token.code);
8532
8533       if (cur_token.code == T_PTR)
8534         return 1;
8535
8536       /* It must have been an identifier.  */
8537       intel_putback_token ();
8538       cur_token.code = T_ID;
8539       /* FALLTHRU */
8540
8541     /* e11  id
8542             | constant  */
8543     case T_ID:
8544       if (!intel_parser.in_offset && intel_parser.is_mem <= 0)
8545         {
8546           symbolS *symbolP;
8547
8548           /* The identifier represents a memory reference only if it's not
8549              preceded by an offset modifier and if it's not an equate.  */
8550           symbolP = symbol_find(cur_token.str);
8551           if (!symbolP || S_GET_SEGMENT(symbolP) != absolute_section)
8552             intel_parser.is_mem = 1;
8553         }
8554         /* FALLTHRU */
8555
8556     case T_CONST:
8557     case '-':
8558     case '+':
8559       {
8560         char *save_str, sign = 0;
8561
8562         /* Allow constants that start with `+' or `-'.  */
8563         if (cur_token.code == '-' || cur_token.code == '+')
8564           {
8565             sign = cur_token.code;
8566             intel_match_token (cur_token.code);
8567             if (cur_token.code != T_CONST)
8568               {
8569                 as_bad (_("Syntax error: Expecting a constant, got `%s'"),
8570                         cur_token.str);
8571                 return 0;
8572               }
8573           }
8574
8575         save_str = (char *) xmalloc (strlen (cur_token.str) + 2);
8576         strcpy (save_str + !!sign, cur_token.str);
8577         if (sign)
8578           *save_str = sign;
8579
8580         /* Get the next token to check for register scaling.  */
8581         intel_match_token (cur_token.code);
8582
8583         /* Check if this constant is a scaling factor for an
8584            index register.  */
8585         if (cur_token.code == '*')
8586           {
8587             if (intel_match_token ('*') && cur_token.code == T_REG)
8588               {
8589                 const reg_entry *reg = cur_token.reg;
8590
8591                 if (!intel_parser.in_bracket)
8592                   {
8593                     as_bad (_("Register scaling only allowed "
8594                               "in memory operands"));
8595                     return 0;
8596                   }
8597
8598                  /* Disallow things like [1*si].
8599                     sp and esp are invalid as index.  */
8600                 if (reg->reg_type.bitfield.reg16)
8601                   reg = i386_regtab + REGNAM_AX + 4;
8602                 else if (i.index_reg)
8603                   reg = i386_regtab + REGNAM_EAX + 4;
8604
8605                 /* The constant is followed by `* reg', so it must be
8606                    a valid scale.  */
8607                 i.index_reg = reg;
8608                 i.types[this_operand].bitfield.baseindex = 1;
8609
8610                 /* Set the scale after setting the register (otherwise,
8611                    i386_scale will complain)  */
8612                 if (!i386_scale (save_str))
8613                   return 0;
8614                 intel_match_token (T_REG);
8615
8616                 /* Since registers are not part of the displacement
8617                    string, we may need to remove any preceding '+' from
8618                    the displacement string.  */
8619                 if (*intel_parser.disp != '\0')
8620                   {
8621                     char *s = intel_parser.disp;
8622                     s += strlen (s) - 1;
8623                     if (*s == '+')
8624                       *s = '\0';
8625                   }
8626
8627                 free (save_str);
8628
8629                 return 1;
8630               }
8631
8632             /* The constant was not used for register scaling. Since we have
8633                already consumed the token following `*' we now need to put it
8634                back in the stream.  */
8635             intel_putback_token ();
8636           }
8637
8638         /* Add the constant to the displacement string.  */
8639         strcat (intel_parser.disp, save_str);
8640         free (save_str);
8641
8642         return 1;
8643       }
8644     }
8645
8646   as_bad (_("Unrecognized token '%s'"), cur_token.str);
8647   return 0;
8648 }
8649
8650 /* Match the given token against cur_token. If they match, read the next
8651    token from the operand string.  */
8652 static int
8653 intel_match_token (int code)
8654 {
8655   if (cur_token.code == code)
8656     {
8657       intel_get_token ();
8658       return 1;
8659     }
8660   else
8661     {
8662       as_bad (_("Unexpected token `%s'"), cur_token.str);
8663       return 0;
8664     }
8665 }
8666
8667 /* Read a new token from intel_parser.op_string and store it in cur_token.  */
8668 static void
8669 intel_get_token (void)
8670 {
8671   char *end_op;
8672   const reg_entry *reg;
8673   struct intel_token new_token;
8674
8675   new_token.code = T_NIL;
8676   new_token.reg = NULL;
8677   new_token.str = NULL;
8678
8679   /* Free the memory allocated to the previous token and move
8680      cur_token to prev_token.  */
8681   if (prev_token.str)
8682     free (prev_token.str);
8683
8684   prev_token = cur_token;
8685
8686   /* Skip whitespace.  */
8687   while (is_space_char (*intel_parser.op_string))
8688     intel_parser.op_string++;
8689
8690   /* Return an empty token if we find nothing else on the line.  */
8691   if (*intel_parser.op_string == '\0')
8692     {
8693       cur_token = new_token;
8694       return;
8695     }
8696
8697   /* The new token cannot be larger than the remainder of the operand
8698      string.  */
8699   new_token.str = (char *) xmalloc (strlen (intel_parser.op_string) + 1);
8700   new_token.str[0] = '\0';
8701
8702   if (strchr ("0123456789", *intel_parser.op_string))
8703     {
8704       char *p = new_token.str;
8705       char *q = intel_parser.op_string;
8706       new_token.code = T_CONST;
8707
8708       /* Allow any kind of identifier char to encompass floating point and
8709          hexadecimal numbers.  */
8710       while (is_identifier_char (*q))
8711         *p++ = *q++;
8712       *p = '\0';
8713
8714       /* Recognize special symbol names [0-9][bf].  */
8715       if (strlen (intel_parser.op_string) == 2
8716           && (intel_parser.op_string[1] == 'b'
8717               || intel_parser.op_string[1] == 'f'))
8718         new_token.code = T_ID;
8719     }
8720
8721   else if ((reg = parse_register (intel_parser.op_string, &end_op)) != NULL)
8722     {
8723       size_t len = end_op - intel_parser.op_string;
8724
8725       new_token.code = T_REG;
8726       new_token.reg = reg;
8727
8728       memcpy (new_token.str, intel_parser.op_string, len);
8729       new_token.str[len] = '\0';
8730     }
8731
8732   else if (is_identifier_char (*intel_parser.op_string))
8733     {
8734       char *p = new_token.str;
8735       char *q = intel_parser.op_string;
8736
8737       /* A '.' or '$' followed by an identifier char is an identifier.
8738          Otherwise, it's operator '.' followed by an expression.  */
8739       if ((*q == '.' || *q == '$') && !is_identifier_char (*(q + 1)))
8740         {
8741           new_token.code = '.';
8742           new_token.str[0] = '.';
8743           new_token.str[1] = '\0';
8744         }
8745       else
8746         {
8747           while (is_identifier_char (*q) || *q == '@')
8748             *p++ = *q++;
8749           *p = '\0';
8750
8751           if (strcasecmp (new_token.str, "NOT") == 0)
8752             new_token.code = '~';
8753
8754           else if (strcasecmp (new_token.str, "MOD") == 0)
8755             new_token.code = '%';
8756
8757           else if (strcasecmp (new_token.str, "AND") == 0)
8758             new_token.code = '&';
8759
8760           else if (strcasecmp (new_token.str, "OR") == 0)
8761             new_token.code = '|';
8762
8763           else if (strcasecmp (new_token.str, "XOR") == 0)
8764             new_token.code = '^';
8765
8766           else if (strcasecmp (new_token.str, "SHL") == 0)
8767             new_token.code = T_SHL;
8768
8769           else if (strcasecmp (new_token.str, "SHR") == 0)
8770             new_token.code = T_SHR;
8771
8772           else if (strcasecmp (new_token.str, "BYTE") == 0)
8773             new_token.code = T_BYTE;
8774
8775           else if (strcasecmp (new_token.str, "WORD") == 0)
8776             new_token.code = T_WORD;
8777
8778           else if (strcasecmp (new_token.str, "DWORD") == 0)
8779             new_token.code = T_DWORD;
8780
8781           else if (strcasecmp (new_token.str, "FWORD") == 0)
8782             new_token.code = T_FWORD;
8783
8784           else if (strcasecmp (new_token.str, "QWORD") == 0)
8785             new_token.code = T_QWORD;
8786
8787           else if (strcasecmp (new_token.str, "TBYTE") == 0
8788                    /* XXX remove (gcc still uses it) */
8789                    || strcasecmp (new_token.str, "XWORD") == 0)
8790             new_token.code = T_TBYTE;
8791
8792           else if (strcasecmp (new_token.str, "XMMWORD") == 0
8793                    || strcasecmp (new_token.str, "OWORD") == 0)
8794             new_token.code = T_XMMWORD;
8795
8796           else if (strcasecmp (new_token.str, "PTR") == 0)
8797             new_token.code = T_PTR;
8798
8799           else if (strcasecmp (new_token.str, "SHORT") == 0)
8800             new_token.code = T_SHORT;
8801
8802           else if (strcasecmp (new_token.str, "OFFSET") == 0)
8803             {
8804               new_token.code = T_OFFSET;
8805
8806               /* ??? This is not mentioned in the MASM grammar but gcc
8807                      makes use of it with -mintel-syntax.  OFFSET may be
8808                      followed by FLAT:  */
8809               if (strncasecmp (q, " FLAT:", 6) == 0)
8810                 strcat (new_token.str, " FLAT:");
8811             }
8812
8813           /* ??? This is not mentioned in the MASM grammar.  */
8814           else if (strcasecmp (new_token.str, "FLAT") == 0)
8815             {
8816               new_token.code = T_OFFSET;
8817               if (*q == ':')
8818                 strcat (new_token.str, ":");
8819               else
8820                 as_bad (_("`:' expected"));
8821             }
8822
8823           else
8824             new_token.code = T_ID;
8825         }
8826     }
8827
8828   else if (strchr ("+-/*%|&^:[]()~", *intel_parser.op_string))
8829     {
8830       new_token.code = *intel_parser.op_string;
8831       new_token.str[0] = *intel_parser.op_string;
8832       new_token.str[1] = '\0';
8833     }
8834
8835   else if (strchr ("<>", *intel_parser.op_string)
8836            && *intel_parser.op_string == *(intel_parser.op_string + 1))
8837     {
8838       new_token.code = *intel_parser.op_string == '<' ? T_SHL : T_SHR;
8839       new_token.str[0] = *intel_parser.op_string;
8840       new_token.str[1] = *intel_parser.op_string;
8841       new_token.str[2] = '\0';
8842     }
8843
8844   else
8845     as_bad (_("Unrecognized token `%s'"), intel_parser.op_string);
8846
8847   intel_parser.op_string += strlen (new_token.str);
8848   cur_token = new_token;
8849 }
8850
8851 /* Put cur_token back into the token stream and make cur_token point to
8852    prev_token.  */
8853 static void
8854 intel_putback_token (void)
8855 {
8856   if (cur_token.code != T_NIL)
8857     {
8858       intel_parser.op_string -= strlen (cur_token.str);
8859       free (cur_token.str);
8860     }
8861   cur_token = prev_token;
8862
8863   /* Forget prev_token.  */
8864   prev_token.code = T_NIL;
8865   prev_token.reg = NULL;
8866   prev_token.str = NULL;
8867 }
8868
8869 int
8870 tc_x86_regname_to_dw2regnum (char *regname)
8871 {
8872   unsigned int regnum;
8873   unsigned int regnames_count;
8874   static const char *const regnames_32[] =
8875     {
8876       "eax", "ecx", "edx", "ebx",
8877       "esp", "ebp", "esi", "edi",
8878       "eip", "eflags", NULL,
8879       "st0", "st1", "st2", "st3",
8880       "st4", "st5", "st6", "st7",
8881       NULL, NULL,
8882       "xmm0", "xmm1", "xmm2", "xmm3",
8883       "xmm4", "xmm5", "xmm6", "xmm7",
8884       "mm0", "mm1", "mm2", "mm3",
8885       "mm4", "mm5", "mm6", "mm7",
8886       "fcw", "fsw", "mxcsr",
8887       "es", "cs", "ss", "ds", "fs", "gs", NULL, NULL,
8888       "tr", "ldtr"
8889     };
8890   static const char *const regnames_64[] =
8891     {
8892       "rax", "rdx", "rcx", "rbx",
8893       "rsi", "rdi", "rbp", "rsp",
8894       "r8",  "r9",  "r10", "r11",
8895       "r12", "r13", "r14", "r15",
8896       "rip",
8897       "xmm0",  "xmm1",  "xmm2",  "xmm3",
8898       "xmm4",  "xmm5",  "xmm6",  "xmm7",
8899       "xmm8",  "xmm9",  "xmm10", "xmm11",
8900       "xmm12", "xmm13", "xmm14", "xmm15",
8901       "st0", "st1", "st2", "st3",
8902       "st4", "st5", "st6", "st7",
8903       "mm0", "mm1", "mm2", "mm3",
8904       "mm4", "mm5", "mm6", "mm7",
8905       "rflags",
8906       "es", "cs", "ss", "ds", "fs", "gs", NULL, NULL,
8907       "fs.base", "gs.base", NULL, NULL,
8908       "tr", "ldtr",
8909       "mxcsr", "fcw", "fsw"
8910     };
8911   const char *const *regnames;
8912
8913   if (flag_code == CODE_64BIT)
8914     {
8915       regnames = regnames_64;
8916       regnames_count = ARRAY_SIZE (regnames_64);
8917     }
8918   else
8919     {
8920       regnames = regnames_32;
8921       regnames_count = ARRAY_SIZE (regnames_32);
8922     }
8923
8924   for (regnum = 0; regnum < regnames_count; regnum++)
8925     if (regnames[regnum] != NULL
8926         && strcmp (regname, regnames[regnum]) == 0)
8927       return regnum;
8928
8929   return -1;
8930 }
8931
8932 void
8933 tc_x86_frame_initial_instructions (void)
8934 {
8935   static unsigned int sp_regno;
8936
8937   if (!sp_regno)
8938     sp_regno = tc_x86_regname_to_dw2regnum (flag_code == CODE_64BIT
8939                                             ? "rsp" : "esp");
8940
8941   cfi_add_CFA_def_cfa (sp_regno, -x86_cie_data_alignment);
8942   cfi_add_CFA_offset (x86_dwarf2_return_column, x86_cie_data_alignment);
8943 }
8944
8945 int
8946 i386_elf_section_type (const char *str, size_t len)
8947 {
8948   if (flag_code == CODE_64BIT
8949       && len == sizeof ("unwind") - 1
8950       && strncmp (str, "unwind", 6) == 0)
8951     return SHT_X86_64_UNWIND;
8952
8953   return -1;
8954 }
8955
8956 #ifdef TE_PE
8957 void
8958 tc_pe_dwarf2_emit_offset (symbolS *symbol, unsigned int size)
8959 {
8960   expressionS expr;
8961
8962   expr.X_op = O_secrel;
8963   expr.X_add_symbol = symbol;
8964   expr.X_add_number = 0;
8965   emit_expr (&expr, size);
8966 }
8967 #endif
8968
8969 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
8970 /* For ELF on x86-64, add support for SHF_X86_64_LARGE.  */
8971
8972 int
8973 x86_64_section_letter (int letter, char **ptr_msg)
8974 {
8975   if (flag_code == CODE_64BIT)
8976     {
8977       if (letter == 'l')
8978         return SHF_X86_64_LARGE;
8979
8980       *ptr_msg = _("Bad .section directive: want a,l,w,x,M,S,G,T in string");
8981     }
8982   else
8983     *ptr_msg = _("Bad .section directive: want a,w,x,M,S,G,T in string");
8984   return -1;
8985 }
8986
8987 int
8988 x86_64_section_word (char *str, size_t len)
8989 {
8990   if (len == 5 && flag_code == CODE_64BIT && CONST_STRNEQ (str, "large"))
8991     return SHF_X86_64_LARGE;
8992
8993   return -1;
8994 }
8995
8996 static void
8997 handle_large_common (int small ATTRIBUTE_UNUSED)
8998 {
8999   if (flag_code != CODE_64BIT)
9000     {
9001       s_comm_internal (0, elf_common_parse);
9002       as_warn (_(".largecomm supported only in 64bit mode, producing .comm"));
9003     }
9004   else
9005     {
9006       static segT lbss_section;
9007       asection *saved_com_section_ptr = elf_com_section_ptr;
9008       asection *saved_bss_section = bss_section;
9009
9010       if (lbss_section == NULL)
9011         {
9012           flagword applicable;
9013           segT seg = now_seg;
9014           subsegT subseg = now_subseg;
9015
9016           /* The .lbss section is for local .largecomm symbols.  */
9017           lbss_section = subseg_new (".lbss", 0);
9018           applicable = bfd_applicable_section_flags (stdoutput);
9019           bfd_set_section_flags (stdoutput, lbss_section,
9020                                  applicable & SEC_ALLOC);
9021           seg_info (lbss_section)->bss = 1;
9022
9023           subseg_set (seg, subseg);
9024         }
9025
9026       elf_com_section_ptr = &_bfd_elf_large_com_section;
9027       bss_section = lbss_section;
9028
9029       s_comm_internal (0, elf_common_parse);
9030
9031       elf_com_section_ptr = saved_com_section_ptr;
9032       bss_section = saved_bss_section;
9033     }
9034 }
9035 #endif /* OBJ_ELF || OBJ_MAYBE_ELF */