2007-10-05 H.J. Lu <hongjiu.lu@intel.com>
[platform/upstream/binutils.git] / gas / config / tc-i386.c
1 /* tc-i386.c -- Assemble code for the Intel 80386
2    Copyright 1989, 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999,
3    2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007
4    Free Software Foundation, Inc.
5
6    This file is part of GAS, the GNU Assembler.
7
8    GAS is free software; you can redistribute it and/or modify
9    it under the terms of the GNU General Public License as published by
10    the Free Software Foundation; either version 3, or (at your option)
11    any later version.
12
13    GAS is distributed in the hope that it will be useful,
14    but WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16    GNU General Public License for more details.
17
18    You should have received a copy of the GNU General Public License
19    along with GAS; see the file COPYING.  If not, write to the Free
20    Software Foundation, 51 Franklin Street - Fifth Floor, Boston, MA
21    02110-1301, USA.  */
22
23 /* Intel 80386 machine specific gas.
24    Written by Eliot Dresselhaus (eliot@mgm.mit.edu).
25    x86_64 support by Jan Hubicka (jh@suse.cz)
26    VIA PadLock support by Michal Ludvig (mludvig@suse.cz)
27    Bugs & suggestions are completely welcome.  This is free software.
28    Please help us make it better.  */
29
30 #include "as.h"
31 #include "safe-ctype.h"
32 #include "subsegs.h"
33 #include "dwarf2dbg.h"
34 #include "dw2gencfi.h"
35 #include "elf/x86-64.h"
36 #include "opcodes/i386-init.h"
37
38 #ifndef REGISTER_WARNINGS
39 #define REGISTER_WARNINGS 1
40 #endif
41
42 #ifndef INFER_ADDR_PREFIX
43 #define INFER_ADDR_PREFIX 1
44 #endif
45
46 #ifndef DEFAULT_ARCH
47 #define DEFAULT_ARCH "i386"
48 #endif
49
50 #ifndef INLINE
51 #if __GNUC__ >= 2
52 #define INLINE __inline__
53 #else
54 #define INLINE
55 #endif
56 #endif
57
58 static void set_code_flag (int);
59 static void set_16bit_gcc_code_flag (int);
60 static void set_intel_syntax (int);
61 static void set_allow_index_reg (int);
62 static void set_cpu_arch (int);
63 #ifdef TE_PE
64 static void pe_directive_secrel (int);
65 #endif
66 static void signed_cons (int);
67 static char *output_invalid (int c);
68 static int i386_operand (char *);
69 static int i386_intel_operand (char *, int);
70 static const reg_entry *parse_register (char *, char **);
71 static char *parse_insn (char *, char *);
72 static char *parse_operands (char *, const char *);
73 static void swap_operands (void);
74 static void swap_2_operands (int, int);
75 static void optimize_imm (void);
76 static void optimize_disp (void);
77 static int match_template (void);
78 static int check_string (void);
79 static int process_suffix (void);
80 static int check_byte_reg (void);
81 static int check_long_reg (void);
82 static int check_qword_reg (void);
83 static int check_word_reg (void);
84 static int finalize_imm (void);
85 static void process_drex (void);
86 static int process_operands (void);
87 static const seg_entry *build_modrm_byte (void);
88 static void output_insn (void);
89 static void output_imm (fragS *, offsetT);
90 static void output_disp (fragS *, offsetT);
91 #ifndef I386COFF
92 static void s_bss (int);
93 #endif
94 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
95 static void handle_large_common (int small ATTRIBUTE_UNUSED);
96 #endif
97
98 static const char *default_arch = DEFAULT_ARCH;
99
100 /* 'md_assemble ()' gathers together information and puts it into a
101    i386_insn.  */
102
103 union i386_op
104   {
105     expressionS *disps;
106     expressionS *imms;
107     const reg_entry *regs;
108   };
109
110 struct _i386_insn
111   {
112     /* TM holds the template for the insn were currently assembling.  */
113     template tm;
114
115     /* SUFFIX holds the instruction mnemonic suffix if given.
116        (e.g. 'l' for 'movl')  */
117     char suffix;
118
119     /* OPERANDS gives the number of given operands.  */
120     unsigned int operands;
121
122     /* REG_OPERANDS, DISP_OPERANDS, MEM_OPERANDS, IMM_OPERANDS give the number
123        of given register, displacement, memory operands and immediate
124        operands.  */
125     unsigned int reg_operands, disp_operands, mem_operands, imm_operands;
126
127     /* TYPES [i] is the type (see above #defines) which tells us how to
128        use OP[i] for the corresponding operand.  */
129     i386_operand_type types[MAX_OPERANDS];
130
131     /* Displacement expression, immediate expression, or register for each
132        operand.  */
133     union i386_op op[MAX_OPERANDS];
134
135     /* Flags for operands.  */
136     unsigned int flags[MAX_OPERANDS];
137 #define Operand_PCrel 1
138
139     /* Relocation type for operand */
140     enum bfd_reloc_code_real reloc[MAX_OPERANDS];
141
142     /* BASE_REG, INDEX_REG, and LOG2_SCALE_FACTOR are used to encode
143        the base index byte below.  */
144     const reg_entry *base_reg;
145     const reg_entry *index_reg;
146     unsigned int log2_scale_factor;
147
148     /* SEG gives the seg_entries of this insn.  They are zero unless
149        explicit segment overrides are given.  */
150     const seg_entry *seg[2];
151
152     /* PREFIX holds all the given prefix opcodes (usually null).
153        PREFIXES is the number of prefix opcodes.  */
154     unsigned int prefixes;
155     unsigned char prefix[MAX_PREFIXES];
156
157     /* RM and SIB are the modrm byte and the sib byte where the
158        addressing modes of this insn are encoded.  DREX is the byte
159        added by the SSE5 instructions.  */
160
161     modrm_byte rm;
162     rex_byte rex;
163     sib_byte sib;
164     drex_byte drex;
165   };
166
167 typedef struct _i386_insn i386_insn;
168
169 /* List of chars besides those in app.c:symbol_chars that can start an
170    operand.  Used to prevent the scrubber eating vital white-space.  */
171 const char extra_symbol_chars[] = "*%-(["
172 #ifdef LEX_AT
173         "@"
174 #endif
175 #ifdef LEX_QM
176         "?"
177 #endif
178         ;
179
180 #if (defined (TE_I386AIX)                               \
181      || ((defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)) \
182          && !defined (TE_GNU)                           \
183          && !defined (TE_LINUX)                         \
184          && !defined (TE_NETWARE)                       \
185          && !defined (TE_FreeBSD)                       \
186          && !defined (TE_NetBSD)))
187 /* This array holds the chars that always start a comment.  If the
188    pre-processor is disabled, these aren't very useful.  The option
189    --divide will remove '/' from this list.  */
190 const char *i386_comment_chars = "#/";
191 #define SVR4_COMMENT_CHARS 1
192 #define PREFIX_SEPARATOR '\\'
193
194 #else
195 const char *i386_comment_chars = "#";
196 #define PREFIX_SEPARATOR '/'
197 #endif
198
199 /* This array holds the chars that only start a comment at the beginning of
200    a line.  If the line seems to have the form '# 123 filename'
201    .line and .file directives will appear in the pre-processed output.
202    Note that input_file.c hand checks for '#' at the beginning of the
203    first line of the input file.  This is because the compiler outputs
204    #NO_APP at the beginning of its output.
205    Also note that comments started like this one will always work if
206    '/' isn't otherwise defined.  */
207 const char line_comment_chars[] = "#/";
208
209 const char line_separator_chars[] = ";";
210
211 /* Chars that can be used to separate mant from exp in floating point
212    nums.  */
213 const char EXP_CHARS[] = "eE";
214
215 /* Chars that mean this number is a floating point constant
216    As in 0f12.456
217    or    0d1.2345e12.  */
218 const char FLT_CHARS[] = "fFdDxX";
219
220 /* Tables for lexical analysis.  */
221 static char mnemonic_chars[256];
222 static char register_chars[256];
223 static char operand_chars[256];
224 static char identifier_chars[256];
225 static char digit_chars[256];
226
227 /* Lexical macros.  */
228 #define is_mnemonic_char(x) (mnemonic_chars[(unsigned char) x])
229 #define is_operand_char(x) (operand_chars[(unsigned char) x])
230 #define is_register_char(x) (register_chars[(unsigned char) x])
231 #define is_space_char(x) ((x) == ' ')
232 #define is_identifier_char(x) (identifier_chars[(unsigned char) x])
233 #define is_digit_char(x) (digit_chars[(unsigned char) x])
234
235 /* All non-digit non-letter characters that may occur in an operand.  */
236 static char operand_special_chars[] = "%$-+(,)*._~/<>|&^!:[@]";
237
238 /* md_assemble() always leaves the strings it's passed unaltered.  To
239    effect this we maintain a stack of saved characters that we've smashed
240    with '\0's (indicating end of strings for various sub-fields of the
241    assembler instruction).  */
242 static char save_stack[32];
243 static char *save_stack_p;
244 #define END_STRING_AND_SAVE(s) \
245         do { *save_stack_p++ = *(s); *(s) = '\0'; } while (0)
246 #define RESTORE_END_STRING(s) \
247         do { *(s) = *--save_stack_p; } while (0)
248
249 /* The instruction we're assembling.  */
250 static i386_insn i;
251
252 /* Possible templates for current insn.  */
253 static const templates *current_templates;
254
255 /* Per instruction expressionS buffers: max displacements & immediates.  */
256 static expressionS disp_expressions[MAX_MEMORY_OPERANDS];
257 static expressionS im_expressions[MAX_IMMEDIATE_OPERANDS];
258
259 /* Current operand we are working on.  */
260 static int this_operand;
261
262 /* We support four different modes.  FLAG_CODE variable is used to distinguish
263    these.  */
264
265 enum flag_code {
266         CODE_32BIT,
267         CODE_16BIT,
268         CODE_64BIT };
269
270 static enum flag_code flag_code;
271 static unsigned int object_64bit;
272 static int use_rela_relocations = 0;
273
274 /* The names used to print error messages.  */
275 static const char *flag_code_names[] =
276   {
277     "32",
278     "16",
279     "64"
280   };
281
282 /* 1 for intel syntax,
283    0 if att syntax.  */
284 static int intel_syntax = 0;
285
286 /* 1 if register prefix % not required.  */
287 static int allow_naked_reg = 0;
288
289 /* 1 if fake index register, eiz/riz, is allowed .  */
290 static int allow_index_reg = 0;
291
292 /* Register prefix used for error message.  */
293 static const char *register_prefix = "%";
294
295 /* Used in 16 bit gcc mode to add an l suffix to call, ret, enter,
296    leave, push, and pop instructions so that gcc has the same stack
297    frame as in 32 bit mode.  */
298 static char stackop_size = '\0';
299
300 /* Non-zero to optimize code alignment.  */
301 int optimize_align_code = 1;
302
303 /* Non-zero to quieten some warnings.  */
304 static int quiet_warnings = 0;
305
306 /* CPU name.  */
307 static const char *cpu_arch_name = NULL;
308 static const char *cpu_sub_arch_name = NULL;
309
310 /* CPU feature flags.  */
311 static i386_cpu_flags cpu_arch_flags = CPU_UNKNOWN_FLAGS;
312
313 /* Bitwise NOT of cpu_arch_flags.  */
314 static i386_cpu_flags cpu_arch_flags_not;
315
316 /* If we have selected a cpu we are generating instructions for.  */
317 static int cpu_arch_tune_set = 0;
318
319 /* Cpu we are generating instructions for.  */
320 static enum processor_type cpu_arch_tune = PROCESSOR_UNKNOWN;
321
322 /* CPU feature flags of cpu we are generating instructions for.  */
323 static i386_cpu_flags cpu_arch_tune_flags;
324
325 /* CPU instruction set architecture used.  */
326 static enum processor_type cpu_arch_isa = PROCESSOR_UNKNOWN;
327
328 /* CPU feature flags of instruction set architecture used.  */
329 static i386_cpu_flags cpu_arch_isa_flags;
330
331 /* If set, conditional jumps are not automatically promoted to handle
332    larger than a byte offset.  */
333 static unsigned int no_cond_jump_promotion = 0;
334
335 /* Pre-defined "_GLOBAL_OFFSET_TABLE_".  */
336 static symbolS *GOT_symbol;
337
338 /* The dwarf2 return column, adjusted for 32 or 64 bit.  */
339 unsigned int x86_dwarf2_return_column;
340
341 /* The dwarf2 data alignment, adjusted for 32 or 64 bit.  */
342 int x86_cie_data_alignment;
343
344 /* Interface to relax_segment.
345    There are 3 major relax states for 386 jump insns because the
346    different types of jumps add different sizes to frags when we're
347    figuring out what sort of jump to choose to reach a given label.  */
348
349 /* Types.  */
350 #define UNCOND_JUMP 0
351 #define COND_JUMP 1
352 #define COND_JUMP86 2
353
354 /* Sizes.  */
355 #define CODE16  1
356 #define SMALL   0
357 #define SMALL16 (SMALL | CODE16)
358 #define BIG     2
359 #define BIG16   (BIG | CODE16)
360
361 #ifndef INLINE
362 #ifdef __GNUC__
363 #define INLINE __inline__
364 #else
365 #define INLINE
366 #endif
367 #endif
368
369 #define ENCODE_RELAX_STATE(type, size) \
370   ((relax_substateT) (((type) << 2) | (size)))
371 #define TYPE_FROM_RELAX_STATE(s) \
372   ((s) >> 2)
373 #define DISP_SIZE_FROM_RELAX_STATE(s) \
374     ((((s) & 3) == BIG ? 4 : (((s) & 3) == BIG16 ? 2 : 1)))
375
376 /* This table is used by relax_frag to promote short jumps to long
377    ones where necessary.  SMALL (short) jumps may be promoted to BIG
378    (32 bit long) ones, and SMALL16 jumps to BIG16 (16 bit long).  We
379    don't allow a short jump in a 32 bit code segment to be promoted to
380    a 16 bit offset jump because it's slower (requires data size
381    prefix), and doesn't work, unless the destination is in the bottom
382    64k of the code segment (The top 16 bits of eip are zeroed).  */
383
384 const relax_typeS md_relax_table[] =
385 {
386   /* The fields are:
387      1) most positive reach of this state,
388      2) most negative reach of this state,
389      3) how many bytes this mode will have in the variable part of the frag
390      4) which index into the table to try if we can't fit into this one.  */
391
392   /* UNCOND_JUMP states.  */
393   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (UNCOND_JUMP, BIG)},
394   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (UNCOND_JUMP, BIG16)},
395   /* dword jmp adds 4 bytes to frag:
396      0 extra opcode bytes, 4 displacement bytes.  */
397   {0, 0, 4, 0},
398   /* word jmp adds 2 byte2 to frag:
399      0 extra opcode bytes, 2 displacement bytes.  */
400   {0, 0, 2, 0},
401
402   /* COND_JUMP states.  */
403   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (COND_JUMP, BIG)},
404   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (COND_JUMP, BIG16)},
405   /* dword conditionals adds 5 bytes to frag:
406      1 extra opcode byte, 4 displacement bytes.  */
407   {0, 0, 5, 0},
408   /* word conditionals add 3 bytes to frag:
409      1 extra opcode byte, 2 displacement bytes.  */
410   {0, 0, 3, 0},
411
412   /* COND_JUMP86 states.  */
413   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (COND_JUMP86, BIG)},
414   {127 + 1, -128 + 1, 1, ENCODE_RELAX_STATE (COND_JUMP86, BIG16)},
415   /* dword conditionals adds 5 bytes to frag:
416      1 extra opcode byte, 4 displacement bytes.  */
417   {0, 0, 5, 0},
418   /* word conditionals add 4 bytes to frag:
419      1 displacement byte and a 3 byte long branch insn.  */
420   {0, 0, 4, 0}
421 };
422
423 static const arch_entry cpu_arch[] =
424 {
425   {"generic32", PROCESSOR_GENERIC32,
426    CPU_GENERIC32_FLAGS },
427   {"generic64", PROCESSOR_GENERIC64,
428    CPU_GENERIC64_FLAGS },
429   {"i8086", PROCESSOR_UNKNOWN,
430    CPU_NONE_FLAGS },
431   {"i186", PROCESSOR_UNKNOWN,
432    CPU_I186_FLAGS },
433   {"i286", PROCESSOR_UNKNOWN,
434    CPU_I286_FLAGS },
435   {"i386", PROCESSOR_I386,
436    CPU_I386_FLAGS },
437   {"i486", PROCESSOR_I486,
438    CPU_I486_FLAGS },
439   {"i586", PROCESSOR_PENTIUM,
440    CPU_I586_FLAGS },
441   {"i686", PROCESSOR_PENTIUMPRO,
442    CPU_I686_FLAGS },
443   {"pentium", PROCESSOR_PENTIUM,
444    CPU_I586_FLAGS },
445   {"pentiumpro",PROCESSOR_PENTIUMPRO,
446    CPU_I686_FLAGS },
447   {"pentiumii", PROCESSOR_PENTIUMPRO,
448    CPU_P2_FLAGS },
449   {"pentiumiii",PROCESSOR_PENTIUMPRO,
450    CPU_P3_FLAGS },
451   {"pentium4", PROCESSOR_PENTIUM4,
452    CPU_P4_FLAGS },
453   {"prescott", PROCESSOR_NOCONA,
454    CPU_CORE_FLAGS },
455   {"nocona", PROCESSOR_NOCONA,
456    CPU_NOCONA_FLAGS },
457   {"yonah", PROCESSOR_CORE,
458    CPU_CORE_FLAGS },
459   {"core", PROCESSOR_CORE,
460    CPU_CORE_FLAGS },
461   {"merom", PROCESSOR_CORE2,
462    CPU_CORE2_FLAGS },
463   {"core2", PROCESSOR_CORE2,
464    CPU_CORE2_FLAGS },
465   {"k6", PROCESSOR_K6,
466    CPU_K6_FLAGS },
467   {"k6_2", PROCESSOR_K6,
468    CPU_K6_2_FLAGS },
469   {"athlon", PROCESSOR_ATHLON,
470    CPU_ATHLON_FLAGS },
471   {"sledgehammer", PROCESSOR_K8,
472    CPU_K8_FLAGS },
473   {"opteron", PROCESSOR_K8,
474    CPU_K8_FLAGS },
475   {"k8", PROCESSOR_K8,
476    CPU_K8_FLAGS },
477   {"amdfam10", PROCESSOR_AMDFAM10,
478    CPU_AMDFAM10_FLAGS },
479   {".mmx", PROCESSOR_UNKNOWN,
480    CPU_MMX_FLAGS },
481   {".sse", PROCESSOR_UNKNOWN,
482    CPU_SSE_FLAGS },
483   {".sse2", PROCESSOR_UNKNOWN,
484    CPU_SSE2_FLAGS },
485   {".sse3", PROCESSOR_UNKNOWN,
486    CPU_SSE3_FLAGS },
487   {".ssse3", PROCESSOR_UNKNOWN,
488    CPU_SSSE3_FLAGS },
489   {".sse4.1", PROCESSOR_UNKNOWN,
490    CPU_SSE4_1_FLAGS },
491   {".sse4.2", PROCESSOR_UNKNOWN,
492    CPU_SSE4_2_FLAGS },
493   {".sse4", PROCESSOR_UNKNOWN,
494    CPU_SSE4_2_FLAGS },
495   {".3dnow", PROCESSOR_UNKNOWN,
496    CPU_3DNOW_FLAGS },
497   {".3dnowa", PROCESSOR_UNKNOWN,
498    CPU_3DNOWA_FLAGS },
499   {".padlock", PROCESSOR_UNKNOWN,
500    CPU_PADLOCK_FLAGS },
501   {".pacifica", PROCESSOR_UNKNOWN,
502    CPU_SVME_FLAGS },
503   {".svme", PROCESSOR_UNKNOWN,
504    CPU_SVME_FLAGS },
505   {".sse4a", PROCESSOR_UNKNOWN,
506    CPU_SSE4A_FLAGS },
507   {".abm", PROCESSOR_UNKNOWN,
508    CPU_ABM_FLAGS },
509   {".sse5", PROCESSOR_UNKNOWN,
510    CPU_SSE5_FLAGS },
511 };
512
513 const pseudo_typeS md_pseudo_table[] =
514 {
515 #if !defined(OBJ_AOUT) && !defined(USE_ALIGN_PTWO)
516   {"align", s_align_bytes, 0},
517 #else
518   {"align", s_align_ptwo, 0},
519 #endif
520   {"arch", set_cpu_arch, 0},
521 #ifndef I386COFF
522   {"bss", s_bss, 0},
523 #endif
524   {"ffloat", float_cons, 'f'},
525   {"dfloat", float_cons, 'd'},
526   {"tfloat", float_cons, 'x'},
527   {"value", cons, 2},
528   {"slong", signed_cons, 4},
529   {"noopt", s_ignore, 0},
530   {"optim", s_ignore, 0},
531   {"code16gcc", set_16bit_gcc_code_flag, CODE_16BIT},
532   {"code16", set_code_flag, CODE_16BIT},
533   {"code32", set_code_flag, CODE_32BIT},
534   {"code64", set_code_flag, CODE_64BIT},
535   {"intel_syntax", set_intel_syntax, 1},
536   {"att_syntax", set_intel_syntax, 0},
537   {"allow_index_reg", set_allow_index_reg, 1},
538   {"disallow_index_reg", set_allow_index_reg, 0},
539 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
540   {"largecomm", handle_large_common, 0},
541 #else
542   {"file", (void (*) (int)) dwarf2_directive_file, 0},
543   {"loc", dwarf2_directive_loc, 0},
544   {"loc_mark_labels", dwarf2_directive_loc_mark_labels, 0},
545 #endif
546 #ifdef TE_PE
547   {"secrel32", pe_directive_secrel, 0},
548 #endif
549   {0, 0, 0}
550 };
551
552 /* For interface with expression ().  */
553 extern char *input_line_pointer;
554
555 /* Hash table for instruction mnemonic lookup.  */
556 static struct hash_control *op_hash;
557
558 /* Hash table for register lookup.  */
559 static struct hash_control *reg_hash;
560 \f
561 void
562 i386_align_code (fragS *fragP, int count)
563 {
564   /* Various efficient no-op patterns for aligning code labels.
565      Note: Don't try to assemble the instructions in the comments.
566      0L and 0w are not legal.  */
567   static const char f32_1[] =
568     {0x90};                                     /* nop                  */
569   static const char f32_2[] =
570     {0x66,0x90};                                /* xchg %ax,%ax */
571   static const char f32_3[] =
572     {0x8d,0x76,0x00};                           /* leal 0(%esi),%esi    */
573   static const char f32_4[] =
574     {0x8d,0x74,0x26,0x00};                      /* leal 0(%esi,1),%esi  */
575   static const char f32_5[] =
576     {0x90,                                      /* nop                  */
577      0x8d,0x74,0x26,0x00};                      /* leal 0(%esi,1),%esi  */
578   static const char f32_6[] =
579     {0x8d,0xb6,0x00,0x00,0x00,0x00};            /* leal 0L(%esi),%esi   */
580   static const char f32_7[] =
581     {0x8d,0xb4,0x26,0x00,0x00,0x00,0x00};       /* leal 0L(%esi,1),%esi */
582   static const char f32_8[] =
583     {0x90,                                      /* nop                  */
584      0x8d,0xb4,0x26,0x00,0x00,0x00,0x00};       /* leal 0L(%esi,1),%esi */
585   static const char f32_9[] =
586     {0x89,0xf6,                                 /* movl %esi,%esi       */
587      0x8d,0xbc,0x27,0x00,0x00,0x00,0x00};       /* leal 0L(%edi,1),%edi */
588   static const char f32_10[] =
589     {0x8d,0x76,0x00,                            /* leal 0(%esi),%esi    */
590      0x8d,0xbc,0x27,0x00,0x00,0x00,0x00};       /* leal 0L(%edi,1),%edi */
591   static const char f32_11[] =
592     {0x8d,0x74,0x26,0x00,                       /* leal 0(%esi,1),%esi  */
593      0x8d,0xbc,0x27,0x00,0x00,0x00,0x00};       /* leal 0L(%edi,1),%edi */
594   static const char f32_12[] =
595     {0x8d,0xb6,0x00,0x00,0x00,0x00,             /* leal 0L(%esi),%esi   */
596      0x8d,0xbf,0x00,0x00,0x00,0x00};            /* leal 0L(%edi),%edi   */
597   static const char f32_13[] =
598     {0x8d,0xb6,0x00,0x00,0x00,0x00,             /* leal 0L(%esi),%esi   */
599      0x8d,0xbc,0x27,0x00,0x00,0x00,0x00};       /* leal 0L(%edi,1),%edi */
600   static const char f32_14[] =
601     {0x8d,0xb4,0x26,0x00,0x00,0x00,0x00,        /* leal 0L(%esi,1),%esi */
602      0x8d,0xbc,0x27,0x00,0x00,0x00,0x00};       /* leal 0L(%edi,1),%edi */
603   static const char f16_3[] =
604     {0x8d,0x74,0x00};                           /* lea 0(%esi),%esi     */
605   static const char f16_4[] =
606     {0x8d,0xb4,0x00,0x00};                      /* lea 0w(%si),%si      */
607   static const char f16_5[] =
608     {0x90,                                      /* nop                  */
609      0x8d,0xb4,0x00,0x00};                      /* lea 0w(%si),%si      */
610   static const char f16_6[] =
611     {0x89,0xf6,                                 /* mov %si,%si          */
612      0x8d,0xbd,0x00,0x00};                      /* lea 0w(%di),%di      */
613   static const char f16_7[] =
614     {0x8d,0x74,0x00,                            /* lea 0(%si),%si       */
615      0x8d,0xbd,0x00,0x00};                      /* lea 0w(%di),%di      */
616   static const char f16_8[] =
617     {0x8d,0xb4,0x00,0x00,                       /* lea 0w(%si),%si      */
618      0x8d,0xbd,0x00,0x00};                      /* lea 0w(%di),%di      */
619   static const char jump_31[] =
620     {0xeb,0x1d,0x90,0x90,0x90,0x90,0x90,        /* jmp .+31; lotsa nops */
621      0x90,0x90,0x90,0x90,0x90,0x90,0x90,0x90,
622      0x90,0x90,0x90,0x90,0x90,0x90,0x90,0x90,
623      0x90,0x90,0x90,0x90,0x90,0x90,0x90,0x90};
624   static const char *const f32_patt[] = {
625     f32_1, f32_2, f32_3, f32_4, f32_5, f32_6, f32_7, f32_8,
626     f32_9, f32_10, f32_11, f32_12, f32_13, f32_14
627   };
628   static const char *const f16_patt[] = {
629     f32_1, f32_2, f16_3, f16_4, f16_5, f16_6, f16_7, f16_8
630   };
631   /* nopl (%[re]ax) */
632   static const char alt_3[] =
633     {0x0f,0x1f,0x00};
634   /* nopl 0(%[re]ax) */
635   static const char alt_4[] =
636     {0x0f,0x1f,0x40,0x00};
637   /* nopl 0(%[re]ax,%[re]ax,1) */
638   static const char alt_5[] =
639     {0x0f,0x1f,0x44,0x00,0x00};
640   /* nopw 0(%[re]ax,%[re]ax,1) */
641   static const char alt_6[] =
642     {0x66,0x0f,0x1f,0x44,0x00,0x00};
643   /* nopl 0L(%[re]ax) */
644   static const char alt_7[] =
645     {0x0f,0x1f,0x80,0x00,0x00,0x00,0x00};
646   /* nopl 0L(%[re]ax,%[re]ax,1) */
647   static const char alt_8[] =
648     {0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
649   /* nopw 0L(%[re]ax,%[re]ax,1) */
650   static const char alt_9[] =
651     {0x66,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
652   /* nopw %cs:0L(%[re]ax,%[re]ax,1) */
653   static const char alt_10[] =
654     {0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
655   /* data16
656      nopw %cs:0L(%[re]ax,%[re]ax,1) */
657   static const char alt_long_11[] =
658     {0x66,
659      0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
660   /* data16
661      data16
662      nopw %cs:0L(%[re]ax,%[re]ax,1) */
663   static const char alt_long_12[] =
664     {0x66,
665      0x66,
666      0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
667   /* data16
668      data16
669      data16
670      nopw %cs:0L(%[re]ax,%[re]ax,1) */
671   static const char alt_long_13[] =
672     {0x66,
673      0x66,
674      0x66,
675      0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
676   /* data16
677      data16
678      data16
679      data16
680      nopw %cs:0L(%[re]ax,%[re]ax,1) */
681   static const char alt_long_14[] =
682     {0x66,
683      0x66,
684      0x66,
685      0x66,
686      0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
687   /* data16
688      data16
689      data16
690      data16
691      data16
692      nopw %cs:0L(%[re]ax,%[re]ax,1) */
693   static const char alt_long_15[] =
694     {0x66,
695      0x66,
696      0x66,
697      0x66,
698      0x66,
699      0x66,0x2e,0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
700   /* nopl 0(%[re]ax,%[re]ax,1)
701      nopw 0(%[re]ax,%[re]ax,1) */
702   static const char alt_short_11[] =
703     {0x0f,0x1f,0x44,0x00,0x00,
704      0x66,0x0f,0x1f,0x44,0x00,0x00};
705   /* nopw 0(%[re]ax,%[re]ax,1)
706      nopw 0(%[re]ax,%[re]ax,1) */
707   static const char alt_short_12[] =
708     {0x66,0x0f,0x1f,0x44,0x00,0x00,
709      0x66,0x0f,0x1f,0x44,0x00,0x00};
710   /* nopw 0(%[re]ax,%[re]ax,1)
711      nopl 0L(%[re]ax) */
712   static const char alt_short_13[] =
713     {0x66,0x0f,0x1f,0x44,0x00,0x00,
714      0x0f,0x1f,0x80,0x00,0x00,0x00,0x00};
715   /* nopl 0L(%[re]ax)
716      nopl 0L(%[re]ax) */
717   static const char alt_short_14[] =
718     {0x0f,0x1f,0x80,0x00,0x00,0x00,0x00,
719      0x0f,0x1f,0x80,0x00,0x00,0x00,0x00};
720   /* nopl 0L(%[re]ax)
721      nopl 0L(%[re]ax,%[re]ax,1) */
722   static const char alt_short_15[] =
723     {0x0f,0x1f,0x80,0x00,0x00,0x00,0x00,
724      0x0f,0x1f,0x84,0x00,0x00,0x00,0x00,0x00};
725   static const char *const alt_short_patt[] = {
726     f32_1, f32_2, alt_3, alt_4, alt_5, alt_6, alt_7, alt_8,
727     alt_9, alt_10, alt_short_11, alt_short_12, alt_short_13,
728     alt_short_14, alt_short_15
729   };
730   static const char *const alt_long_patt[] = {
731     f32_1, f32_2, alt_3, alt_4, alt_5, alt_6, alt_7, alt_8,
732     alt_9, alt_10, alt_long_11, alt_long_12, alt_long_13,
733     alt_long_14, alt_long_15
734   };
735
736   /* Only align for at least a positive non-zero boundary. */
737   if (count <= 0 || count > MAX_MEM_FOR_RS_ALIGN_CODE)
738     return;
739
740   /* We need to decide which NOP sequence to use for 32bit and
741      64bit. When -mtune= is used:
742
743      1. For PROCESSOR_I386, PROCESSOR_I486, PROCESSOR_PENTIUM and
744      PROCESSOR_GENERIC32, f32_patt will be used.
745      2. For PROCESSOR_PENTIUMPRO, PROCESSOR_PENTIUM4, PROCESSOR_NOCONA,
746      PROCESSOR_CORE, PROCESSOR_CORE2, and PROCESSOR_GENERIC64,
747      alt_long_patt will be used.
748      3. For PROCESSOR_ATHLON, PROCESSOR_K6, PROCESSOR_K8 and
749      PROCESSOR_AMDFAM10, alt_short_patt will be used.
750
751      When -mtune= isn't used, alt_long_patt will be used if
752      cpu_arch_isa_flags has Cpu686. Otherwise, f32_patt will
753      be used.
754
755      When -march= or .arch is used, we can't use anything beyond
756      cpu_arch_isa_flags.   */
757
758   if (flag_code == CODE_16BIT)
759     {
760       if (count > 8)
761         {
762           memcpy (fragP->fr_literal + fragP->fr_fix,
763                   jump_31, count);
764           /* Adjust jump offset.  */
765           fragP->fr_literal[fragP->fr_fix + 1] = count - 2;
766         }
767       else
768         memcpy (fragP->fr_literal + fragP->fr_fix,
769                 f16_patt[count - 1], count);
770     }
771   else
772     {
773       const char *const *patt = NULL;
774
775       if (cpu_arch_isa == PROCESSOR_UNKNOWN)
776         {
777           /* PROCESSOR_UNKNOWN means that all ISAs may be used.  */
778           switch (cpu_arch_tune)
779             {
780             case PROCESSOR_UNKNOWN:
781               /* We use cpu_arch_isa_flags to check if we SHOULD
782                  optimize for Cpu686.  */
783               if (cpu_arch_isa_flags.bitfield.cpui686)
784                 patt = alt_long_patt;
785               else
786                 patt = f32_patt;
787               break;
788             case PROCESSOR_PENTIUMPRO:
789             case PROCESSOR_PENTIUM4:
790             case PROCESSOR_NOCONA:
791             case PROCESSOR_CORE:
792             case PROCESSOR_CORE2:
793             case PROCESSOR_GENERIC64:
794               patt = alt_long_patt;
795               break;
796             case PROCESSOR_K6:
797             case PROCESSOR_ATHLON:
798             case PROCESSOR_K8:
799             case PROCESSOR_AMDFAM10:
800               patt = alt_short_patt;
801               break;
802             case PROCESSOR_I386:
803             case PROCESSOR_I486:
804             case PROCESSOR_PENTIUM:
805             case PROCESSOR_GENERIC32:
806               patt = f32_patt;
807               break;
808             }
809         }
810       else
811         {
812           switch (cpu_arch_tune)
813             {
814             case PROCESSOR_UNKNOWN:
815               /* When cpu_arch_isa is net, cpu_arch_tune shouldn't be
816                  PROCESSOR_UNKNOWN.  */
817               abort ();
818               break;
819
820             case PROCESSOR_I386:
821             case PROCESSOR_I486:
822             case PROCESSOR_PENTIUM:
823             case PROCESSOR_K6:
824             case PROCESSOR_ATHLON:
825             case PROCESSOR_K8:
826             case PROCESSOR_AMDFAM10:
827             case PROCESSOR_GENERIC32:
828               /* We use cpu_arch_isa_flags to check if we CAN optimize
829                  for Cpu686.  */
830               if (cpu_arch_isa_flags.bitfield.cpui686)
831                 patt = alt_short_patt;
832               else
833                 patt = f32_patt;
834               break;
835             case PROCESSOR_PENTIUMPRO:
836             case PROCESSOR_PENTIUM4:
837             case PROCESSOR_NOCONA:
838             case PROCESSOR_CORE:
839             case PROCESSOR_CORE2:
840               if (cpu_arch_isa_flags.bitfield.cpui686)
841                 patt = alt_long_patt;
842               else
843                 patt = f32_patt;
844               break;
845             case PROCESSOR_GENERIC64:
846               patt = alt_long_patt;
847               break;
848             }
849         }
850
851       if (patt == f32_patt)
852         {
853           /* If the padding is less than 15 bytes, we use the normal
854              ones.  Otherwise, we use a jump instruction and adjust
855              its offset.  */
856           if (count < 15)
857             memcpy (fragP->fr_literal + fragP->fr_fix,
858                     patt[count - 1], count);
859           else
860             {
861               memcpy (fragP->fr_literal + fragP->fr_fix,
862                       jump_31, count);
863               /* Adjust jump offset.  */
864               fragP->fr_literal[fragP->fr_fix + 1] = count - 2;
865             }
866         }
867       else
868         {
869           /* Maximum length of an instruction is 15 byte.  If the
870              padding is greater than 15 bytes and we don't use jump,
871              we have to break it into smaller pieces.  */
872           int padding = count;
873           while (padding > 15)
874             {
875               padding -= 15;
876               memcpy (fragP->fr_literal + fragP->fr_fix + padding,
877                       patt [14], 15);
878             }
879
880           if (padding)
881             memcpy (fragP->fr_literal + fragP->fr_fix,
882                     patt [padding - 1], padding);
883         }
884     }
885   fragP->fr_var = count;
886 }
887
888 static INLINE int
889 uints_all_zero (const unsigned int *x, unsigned int size)
890 {
891   switch (size)
892     {
893     case 3:
894       if (x[2])
895         return 0;
896     case 2:
897       if (x[1])
898         return 0;
899     case 1:
900       return !x[0];
901     default:
902       abort ();
903     }
904 }
905
906 static INLINE void
907 uints_set (unsigned int *x, unsigned int v, unsigned int size)
908 {
909   switch (size)
910     {
911     case 3:
912       x[2] = v;
913     case 2:
914       x[1] = v;
915     case 1:
916       x[0] = v;
917       break;
918     default:
919       abort ();
920     }
921 }
922
923 static INLINE int
924 uints_equal (const unsigned int *x, const unsigned int *y,
925              unsigned int size)
926 {
927   switch (size)
928     {
929     case 3:
930       if (x[2] != y [2])
931         return 0;
932     case 2:
933       if (x[1] != y [1])
934         return 0;
935     case 1:
936       return x[0] == y [0];
937       break;
938     default:
939       abort ();
940     }
941 }
942
943 #define UINTS_ALL_ZERO(x) \
944   uints_all_zero ((x).array, ARRAY_SIZE ((x).array))
945 #define UINTS_SET(x, v) \
946   uints_set ((x).array, v, ARRAY_SIZE ((x).array))
947 #define UINTS_CLEAR(x) \
948   uints_set ((x).array, 0, ARRAY_SIZE ((x).array))
949 #define UINTS_EQUAL(x, y) \
950   uints_equal ((x).array, (y).array, ARRAY_SIZE ((x).array))
951
952 static INLINE int
953 cpu_flags_check_cpu64 (i386_cpu_flags f)
954 {
955   return !((flag_code == CODE_64BIT && f.bitfield.cpuno64)
956            || (flag_code != CODE_64BIT && f.bitfield.cpu64));
957 }
958
959 static INLINE i386_cpu_flags
960 cpu_flags_not (i386_cpu_flags x)
961 {
962   switch (ARRAY_SIZE (x.array))
963     {
964     case 3:
965       x.array [2] = ~x.array [2];
966     case 2:
967       x.array [1] = ~x.array [1];
968     case 1:
969       x.array [0] = ~x.array [0];
970       break;
971     default:
972       abort ();
973     }
974
975 #ifdef CpuUnused
976   x.bitfield.unused = 0;
977 #endif
978
979   return x;
980 }
981
982 static INLINE i386_cpu_flags
983 cpu_flags_and (i386_cpu_flags x, i386_cpu_flags y)
984 {
985   switch (ARRAY_SIZE (x.array))
986     {
987     case 3:
988       x.array [2] &= y.array [2];
989     case 2:
990       x.array [1] &= y.array [1];
991     case 1:
992       x.array [0] &= y.array [0];
993       break;
994     default:
995       abort ();
996     }
997   return x;
998 }
999
1000 static INLINE i386_cpu_flags
1001 cpu_flags_or (i386_cpu_flags x, i386_cpu_flags y)
1002 {
1003   switch (ARRAY_SIZE (x.array))
1004     {
1005     case 3:
1006       x.array [2] |= y.array [2];
1007     case 2:
1008       x.array [1] |= y.array [1];
1009     case 1:
1010       x.array [0] |= y.array [0];
1011       break;
1012     default:
1013       abort ();
1014     }
1015   return x;
1016 }
1017
1018 static int
1019 cpu_flags_match (i386_cpu_flags x)
1020 {
1021   i386_cpu_flags not = cpu_arch_flags_not;
1022
1023   not.bitfield.cpu64 = 1;
1024   not.bitfield.cpuno64 = 1;
1025
1026   x.bitfield.cpu64 = 0;
1027   x.bitfield.cpuno64 = 0;
1028
1029   not = cpu_flags_and (x, not);
1030   return UINTS_ALL_ZERO (not);
1031 }
1032
1033 static INLINE i386_operand_type
1034 operand_type_and (i386_operand_type x, i386_operand_type y)
1035 {
1036   switch (ARRAY_SIZE (x.array))
1037     {
1038     case 3:
1039       x.array [2] &= y.array [2];
1040     case 2:
1041       x.array [1] &= y.array [1];
1042     case 1:
1043       x.array [0] &= y.array [0];
1044       break;
1045     default:
1046       abort ();
1047     }
1048   return x;
1049 }
1050
1051 static INLINE i386_operand_type
1052 operand_type_or (i386_operand_type x, i386_operand_type y)
1053 {
1054   switch (ARRAY_SIZE (x.array))
1055     {
1056     case 3:
1057       x.array [2] |= y.array [2];
1058     case 2:
1059       x.array [1] |= y.array [1];
1060     case 1:
1061       x.array [0] |= y.array [0];
1062       break;
1063     default:
1064       abort ();
1065     }
1066   return x;
1067 }
1068
1069 static INLINE i386_operand_type
1070 operand_type_xor (i386_operand_type x, i386_operand_type y)
1071 {
1072   switch (ARRAY_SIZE (x.array))
1073     {
1074     case 3:
1075       x.array [2] ^= y.array [2];
1076     case 2:
1077       x.array [1] ^= y.array [1];
1078     case 1:
1079       x.array [0] ^= y.array [0];
1080       break;
1081     default:
1082       abort ();
1083     }
1084   return x;
1085 }
1086
1087 static const i386_operand_type acc32 = OPERAND_TYPE_ACC32;
1088 static const i386_operand_type acc64 = OPERAND_TYPE_ACC64;
1089 static const i386_operand_type control = OPERAND_TYPE_CONTROL;
1090 static const i386_operand_type reg16_inoutportreg
1091   = OPERAND_TYPE_REG16_INOUTPORTREG;
1092 static const i386_operand_type disp16 = OPERAND_TYPE_DISP16;
1093 static const i386_operand_type disp32 = OPERAND_TYPE_DISP32;
1094 static const i386_operand_type disp32s = OPERAND_TYPE_DISP32S;
1095 static const i386_operand_type disp16_32 = OPERAND_TYPE_DISP16_32;
1096 static const i386_operand_type anydisp
1097   = OPERAND_TYPE_ANYDISP;
1098 static const i386_operand_type regxmm = OPERAND_TYPE_REGXMM;
1099 static const i386_operand_type imm8 = OPERAND_TYPE_IMM8;
1100 static const i386_operand_type imm8s = OPERAND_TYPE_IMM8S;
1101 static const i386_operand_type imm16 = OPERAND_TYPE_IMM16;
1102 static const i386_operand_type imm32 = OPERAND_TYPE_IMM32;
1103 static const i386_operand_type imm32s = OPERAND_TYPE_IMM32S;
1104 static const i386_operand_type imm64 = OPERAND_TYPE_IMM64;
1105 static const i386_operand_type imm16_32 = OPERAND_TYPE_IMM16_32;
1106 static const i386_operand_type imm16_32s = OPERAND_TYPE_IMM16_32S;
1107 static const i386_operand_type imm16_32_32s = OPERAND_TYPE_IMM16_32_32S;
1108
1109 enum operand_type
1110 {
1111   reg,
1112   imm,
1113   disp,
1114   anymem
1115 };
1116
1117 static INLINE int
1118 operand_type_check (i386_operand_type t, enum operand_type c)
1119 {
1120   switch (c)
1121     {
1122     case reg:
1123       return (t.bitfield.reg8
1124               || t.bitfield.reg16
1125               || t.bitfield.reg32
1126               || t.bitfield.reg64);
1127
1128     case imm:
1129       return (t.bitfield.imm8
1130               || t.bitfield.imm8s
1131               || t.bitfield.imm16
1132               || t.bitfield.imm32
1133               || t.bitfield.imm32s
1134               || t.bitfield.imm64);
1135
1136     case disp:
1137       return (t.bitfield.disp8
1138               || t.bitfield.disp16
1139               || t.bitfield.disp32
1140               || t.bitfield.disp32s
1141               || t.bitfield.disp64);
1142
1143     case anymem:
1144       return (t.bitfield.disp8
1145               || t.bitfield.disp16
1146               || t.bitfield.disp32
1147               || t.bitfield.disp32s
1148               || t.bitfield.disp64
1149               || t.bitfield.baseindex);
1150
1151     default:
1152       abort ();
1153     }
1154 }
1155
1156 static INLINE int
1157 operand_type_match (i386_operand_type overlap,
1158                     i386_operand_type given)
1159 {
1160   i386_operand_type temp = overlap;
1161
1162   temp.bitfield.jumpabsolute = 0;
1163   if (UINTS_ALL_ZERO (temp))
1164     return 0;
1165
1166   return (given.bitfield.baseindex == overlap.bitfield.baseindex
1167           && given.bitfield.jumpabsolute == overlap.bitfield.jumpabsolute);
1168 }
1169
1170 /* If given types r0 and r1 are registers they must be of the same type
1171    unless the expected operand type register overlap is null.
1172    Note that Acc in a template matches every size of reg.  */
1173
1174 static INLINE int
1175 operand_type_register_match (i386_operand_type m0,
1176                              i386_operand_type g0,
1177                              i386_operand_type t0,
1178                              i386_operand_type m1,
1179                              i386_operand_type g1,
1180                              i386_operand_type t1)
1181 {
1182   if (!operand_type_check (g0, reg))
1183     return 1;
1184
1185   if (!operand_type_check (g1, reg))
1186     return 1;
1187
1188   if (g0.bitfield.reg8 == g1.bitfield.reg8
1189       && g0.bitfield.reg16 == g1.bitfield.reg16
1190       && g0.bitfield.reg32 == g1.bitfield.reg32
1191       && g0.bitfield.reg64 == g1.bitfield.reg64)
1192     return 1;
1193
1194   if (m0.bitfield.acc)
1195     {
1196       t0.bitfield.reg8 = 1;
1197       t0.bitfield.reg16 = 1;
1198       t0.bitfield.reg32 = 1;
1199       t0.bitfield.reg64 = 1;
1200     }
1201
1202   if (m1.bitfield.acc)
1203     {
1204       t1.bitfield.reg8 = 1;
1205       t1.bitfield.reg16 = 1;
1206       t1.bitfield.reg32 = 1;
1207       t1.bitfield.reg64 = 1;
1208     }
1209
1210   return (!(t0.bitfield.reg8 & t1.bitfield.reg8)
1211           && !(t0.bitfield.reg16 & t1.bitfield.reg16)
1212           && !(t0.bitfield.reg32 & t1.bitfield.reg32)
1213           && !(t0.bitfield.reg64 & t1.bitfield.reg64));
1214 }
1215
1216 static INLINE unsigned int
1217 mode_from_disp_size (i386_operand_type t)
1218 {
1219   if (t.bitfield.disp8)
1220     return 1;
1221   else if (t.bitfield.disp16
1222            || t.bitfield.disp32
1223            || t.bitfield.disp32s)
1224     return 2;
1225   else
1226     return 0;
1227 }
1228
1229 static INLINE int
1230 fits_in_signed_byte (offsetT num)
1231 {
1232   return (num >= -128) && (num <= 127);
1233 }
1234
1235 static INLINE int
1236 fits_in_unsigned_byte (offsetT num)
1237 {
1238   return (num & 0xff) == num;
1239 }
1240
1241 static INLINE int
1242 fits_in_unsigned_word (offsetT num)
1243 {
1244   return (num & 0xffff) == num;
1245 }
1246
1247 static INLINE int
1248 fits_in_signed_word (offsetT num)
1249 {
1250   return (-32768 <= num) && (num <= 32767);
1251 }
1252
1253 static INLINE int
1254 fits_in_signed_long (offsetT num ATTRIBUTE_UNUSED)
1255 {
1256 #ifndef BFD64
1257   return 1;
1258 #else
1259   return (!(((offsetT) -1 << 31) & num)
1260           || (((offsetT) -1 << 31) & num) == ((offsetT) -1 << 31));
1261 #endif
1262 }                               /* fits_in_signed_long() */
1263
1264 static INLINE int
1265 fits_in_unsigned_long (offsetT num ATTRIBUTE_UNUSED)
1266 {
1267 #ifndef BFD64
1268   return 1;
1269 #else
1270   return (num & (((offsetT) 2 << 31) - 1)) == num;
1271 #endif
1272 }                               /* fits_in_unsigned_long() */
1273
1274 static i386_operand_type
1275 smallest_imm_type (offsetT num)
1276 {
1277   i386_operand_type t;
1278  
1279   UINTS_CLEAR (t);
1280   t.bitfield.imm64 = 1;
1281
1282   if (cpu_arch_tune != PROCESSOR_I486 && num == 1)
1283     {
1284       /* This code is disabled on the 486 because all the Imm1 forms
1285          in the opcode table are slower on the i486.  They're the
1286          versions with the implicitly specified single-position
1287          displacement, which has another syntax if you really want to
1288          use that form.  */
1289       t.bitfield.imm1 = 1;
1290       t.bitfield.imm8 = 1;
1291       t.bitfield.imm8s = 1;
1292       t.bitfield.imm16 = 1;
1293       t.bitfield.imm32 = 1;
1294       t.bitfield.imm32s = 1;
1295     }
1296   else if (fits_in_signed_byte (num))
1297     {
1298       t.bitfield.imm8 = 1;
1299       t.bitfield.imm8s = 1;
1300       t.bitfield.imm16 = 1;
1301       t.bitfield.imm32 = 1;
1302       t.bitfield.imm32s = 1;
1303     }
1304   else if (fits_in_unsigned_byte (num))
1305     {
1306       t.bitfield.imm8 = 1;
1307       t.bitfield.imm16 = 1;
1308       t.bitfield.imm32 = 1;
1309       t.bitfield.imm32s = 1;
1310     }
1311   else if (fits_in_signed_word (num) || fits_in_unsigned_word (num))
1312     {
1313       t.bitfield.imm16 = 1;
1314       t.bitfield.imm32 = 1;
1315       t.bitfield.imm32s = 1;
1316     }
1317   else if (fits_in_signed_long (num))
1318     {
1319       t.bitfield.imm32 = 1;
1320       t.bitfield.imm32s = 1;
1321     }
1322   else if (fits_in_unsigned_long (num))
1323     t.bitfield.imm32 = 1;
1324
1325   return t;
1326 }
1327
1328 static offsetT
1329 offset_in_range (offsetT val, int size)
1330 {
1331   addressT mask;
1332
1333   switch (size)
1334     {
1335     case 1: mask = ((addressT) 1 <<  8) - 1; break;
1336     case 2: mask = ((addressT) 1 << 16) - 1; break;
1337     case 4: mask = ((addressT) 2 << 31) - 1; break;
1338 #ifdef BFD64
1339     case 8: mask = ((addressT) 2 << 63) - 1; break;
1340 #endif
1341     default: abort ();
1342     }
1343
1344   /* If BFD64, sign extend val.  */
1345   if (!use_rela_relocations)
1346     if ((val & ~(((addressT) 2 << 31) - 1)) == 0)
1347       val = (val ^ ((addressT) 1 << 31)) - ((addressT) 1 << 31);
1348
1349   if ((val & ~mask) != 0 && (val & ~mask) != ~mask)
1350     {
1351       char buf1[40], buf2[40];
1352
1353       sprint_value (buf1, val);
1354       sprint_value (buf2, val & mask);
1355       as_warn (_("%s shortened to %s"), buf1, buf2);
1356     }
1357   return val & mask;
1358 }
1359
1360 /* Returns 0 if attempting to add a prefix where one from the same
1361    class already exists, 1 if non rep/repne added, 2 if rep/repne
1362    added.  */
1363 static int
1364 add_prefix (unsigned int prefix)
1365 {
1366   int ret = 1;
1367   unsigned int q;
1368
1369   if (prefix >= REX_OPCODE && prefix < REX_OPCODE + 16
1370       && flag_code == CODE_64BIT)
1371     {
1372       if ((i.prefix[REX_PREFIX] & prefix & REX_W)
1373           || ((i.prefix[REX_PREFIX] & (REX_R | REX_X | REX_B))
1374               && (prefix & (REX_R | REX_X | REX_B))))
1375         ret = 0;
1376       q = REX_PREFIX;
1377     }
1378   else
1379     {
1380       switch (prefix)
1381         {
1382         default:
1383           abort ();
1384
1385         case CS_PREFIX_OPCODE:
1386         case DS_PREFIX_OPCODE:
1387         case ES_PREFIX_OPCODE:
1388         case FS_PREFIX_OPCODE:
1389         case GS_PREFIX_OPCODE:
1390         case SS_PREFIX_OPCODE:
1391           q = SEG_PREFIX;
1392           break;
1393
1394         case REPNE_PREFIX_OPCODE:
1395         case REPE_PREFIX_OPCODE:
1396           ret = 2;
1397           /* fall thru */
1398         case LOCK_PREFIX_OPCODE:
1399           q = LOCKREP_PREFIX;
1400           break;
1401
1402         case FWAIT_OPCODE:
1403           q = WAIT_PREFIX;
1404           break;
1405
1406         case ADDR_PREFIX_OPCODE:
1407           q = ADDR_PREFIX;
1408           break;
1409
1410         case DATA_PREFIX_OPCODE:
1411           q = DATA_PREFIX;
1412           break;
1413         }
1414       if (i.prefix[q] != 0)
1415         ret = 0;
1416     }
1417
1418   if (ret)
1419     {
1420       if (!i.prefix[q])
1421         ++i.prefixes;
1422       i.prefix[q] |= prefix;
1423     }
1424   else
1425     as_bad (_("same type of prefix used twice"));
1426
1427   return ret;
1428 }
1429
1430 static void
1431 set_code_flag (int value)
1432 {
1433   flag_code = value;
1434   if (flag_code == CODE_64BIT)
1435     {
1436       cpu_arch_flags.bitfield.cpu64 = 1;
1437       cpu_arch_flags.bitfield.cpuno64 = 0;
1438       cpu_arch_flags_not.bitfield.cpu64 = 0;
1439       cpu_arch_flags_not.bitfield.cpuno64 = 1;
1440     }
1441   else
1442     {
1443       cpu_arch_flags.bitfield.cpu64 = 0;
1444       cpu_arch_flags.bitfield.cpuno64 = 1;
1445       cpu_arch_flags_not.bitfield.cpu64 = 1;
1446       cpu_arch_flags_not.bitfield.cpuno64 = 0;
1447     }
1448   if (value == CODE_64BIT && !cpu_arch_flags.bitfield.cpulm )
1449     {
1450       as_bad (_("64bit mode not supported on this CPU."));
1451     }
1452   if (value == CODE_32BIT && !cpu_arch_flags.bitfield.cpui386)
1453     {
1454       as_bad (_("32bit mode not supported on this CPU."));
1455     }
1456   stackop_size = '\0';
1457 }
1458
1459 static void
1460 set_16bit_gcc_code_flag (int new_code_flag)
1461 {
1462   flag_code = new_code_flag;
1463   if (flag_code != CODE_16BIT)
1464     abort ();
1465   cpu_arch_flags.bitfield.cpu64 = 0;
1466   cpu_arch_flags.bitfield.cpuno64 = 1;
1467   cpu_arch_flags_not.bitfield.cpu64 = 1;
1468   cpu_arch_flags_not.bitfield.cpuno64 = 0;
1469   stackop_size = LONG_MNEM_SUFFIX;
1470 }
1471
1472 static void
1473 set_intel_syntax (int syntax_flag)
1474 {
1475   /* Find out if register prefixing is specified.  */
1476   int ask_naked_reg = 0;
1477
1478   SKIP_WHITESPACE ();
1479   if (!is_end_of_line[(unsigned char) *input_line_pointer])
1480     {
1481       char *string = input_line_pointer;
1482       int e = get_symbol_end ();
1483
1484       if (strcmp (string, "prefix") == 0)
1485         ask_naked_reg = 1;
1486       else if (strcmp (string, "noprefix") == 0)
1487         ask_naked_reg = -1;
1488       else
1489         as_bad (_("bad argument to syntax directive."));
1490       *input_line_pointer = e;
1491     }
1492   demand_empty_rest_of_line ();
1493
1494   intel_syntax = syntax_flag;
1495
1496   if (ask_naked_reg == 0)
1497     allow_naked_reg = (intel_syntax
1498                        && (bfd_get_symbol_leading_char (stdoutput) != '\0'));
1499   else
1500     allow_naked_reg = (ask_naked_reg < 0);
1501
1502   identifier_chars['%'] = intel_syntax && allow_naked_reg ? '%' : 0;
1503   identifier_chars['$'] = intel_syntax ? '$' : 0;
1504   register_prefix = allow_naked_reg ? "" : "%";
1505 }
1506
1507 static void
1508 set_allow_index_reg (int flag)
1509 {
1510   allow_index_reg = flag;
1511 }
1512
1513 static void
1514 set_cpu_arch (int dummy ATTRIBUTE_UNUSED)
1515 {
1516   SKIP_WHITESPACE ();
1517
1518   if (!is_end_of_line[(unsigned char) *input_line_pointer])
1519     {
1520       char *string = input_line_pointer;
1521       int e = get_symbol_end ();
1522       unsigned int i;
1523       i386_cpu_flags flags;
1524
1525       for (i = 0; i < ARRAY_SIZE (cpu_arch); i++)
1526         {
1527           if (strcmp (string, cpu_arch[i].name) == 0)
1528             {
1529               if (*string != '.')
1530                 {
1531                   cpu_arch_name = cpu_arch[i].name;
1532                   cpu_sub_arch_name = NULL;
1533                   cpu_arch_flags = cpu_arch[i].flags;
1534                   if (flag_code == CODE_64BIT)
1535                     {
1536                       cpu_arch_flags.bitfield.cpu64 = 1;
1537                       cpu_arch_flags.bitfield.cpuno64 = 0;
1538                     }
1539                   else
1540                     {
1541                       cpu_arch_flags.bitfield.cpu64 = 0;
1542                       cpu_arch_flags.bitfield.cpuno64 = 1;
1543                     }
1544                   cpu_arch_flags_not = cpu_flags_not (cpu_arch_flags);
1545                   cpu_arch_isa = cpu_arch[i].type;
1546                   cpu_arch_isa_flags = cpu_arch[i].flags;
1547                   if (!cpu_arch_tune_set)
1548                     {
1549                       cpu_arch_tune = cpu_arch_isa;
1550                       cpu_arch_tune_flags = cpu_arch_isa_flags;
1551                     }
1552                   break;
1553                 }
1554
1555               flags = cpu_flags_or (cpu_arch_flags,
1556                                     cpu_arch[i].flags);
1557               if (!UINTS_EQUAL (flags, cpu_arch_flags))
1558                 {
1559                   cpu_sub_arch_name = cpu_arch[i].name;
1560                   cpu_arch_flags = flags;
1561                   cpu_arch_flags_not = cpu_flags_not (cpu_arch_flags);
1562                 }
1563               *input_line_pointer = e;
1564               demand_empty_rest_of_line ();
1565               return;
1566             }
1567         }
1568       if (i >= ARRAY_SIZE (cpu_arch))
1569         as_bad (_("no such architecture: `%s'"), string);
1570
1571       *input_line_pointer = e;
1572     }
1573   else
1574     as_bad (_("missing cpu architecture"));
1575
1576   no_cond_jump_promotion = 0;
1577   if (*input_line_pointer == ','
1578       && !is_end_of_line[(unsigned char) input_line_pointer[1]])
1579     {
1580       char *string = ++input_line_pointer;
1581       int e = get_symbol_end ();
1582
1583       if (strcmp (string, "nojumps") == 0)
1584         no_cond_jump_promotion = 1;
1585       else if (strcmp (string, "jumps") == 0)
1586         ;
1587       else
1588         as_bad (_("no such architecture modifier: `%s'"), string);
1589
1590       *input_line_pointer = e;
1591     }
1592
1593   demand_empty_rest_of_line ();
1594 }
1595
1596 unsigned long
1597 i386_mach ()
1598 {
1599   if (!strcmp (default_arch, "x86_64"))
1600     return bfd_mach_x86_64;
1601   else if (!strcmp (default_arch, "i386"))
1602     return bfd_mach_i386_i386;
1603   else
1604     as_fatal (_("Unknown architecture"));
1605 }
1606 \f
1607 void
1608 md_begin ()
1609 {
1610   const char *hash_err;
1611
1612   cpu_arch_flags_not = cpu_flags_not (cpu_arch_flags);
1613
1614   /* Initialize op_hash hash table.  */
1615   op_hash = hash_new ();
1616
1617   {
1618     const template *optab;
1619     templates *core_optab;
1620
1621     /* Setup for loop.  */
1622     optab = i386_optab;
1623     core_optab = (templates *) xmalloc (sizeof (templates));
1624     core_optab->start = optab;
1625
1626     while (1)
1627       {
1628         ++optab;
1629         if (optab->name == NULL
1630             || strcmp (optab->name, (optab - 1)->name) != 0)
1631           {
1632             /* different name --> ship out current template list;
1633                add to hash table; & begin anew.  */
1634             core_optab->end = optab;
1635             hash_err = hash_insert (op_hash,
1636                                     (optab - 1)->name,
1637                                     (PTR) core_optab);
1638             if (hash_err)
1639               {
1640                 as_fatal (_("Internal Error:  Can't hash %s: %s"),
1641                           (optab - 1)->name,
1642                           hash_err);
1643               }
1644             if (optab->name == NULL)
1645               break;
1646             core_optab = (templates *) xmalloc (sizeof (templates));
1647             core_optab->start = optab;
1648           }
1649       }
1650   }
1651
1652   /* Initialize reg_hash hash table.  */
1653   reg_hash = hash_new ();
1654   {
1655     const reg_entry *regtab;
1656     unsigned int regtab_size = i386_regtab_size;
1657
1658     for (regtab = i386_regtab; regtab_size--; regtab++)
1659       {
1660         hash_err = hash_insert (reg_hash, regtab->reg_name, (PTR) regtab);
1661         if (hash_err)
1662           as_fatal (_("Internal Error:  Can't hash %s: %s"),
1663                     regtab->reg_name,
1664                     hash_err);
1665       }
1666   }
1667
1668   /* Fill in lexical tables:  mnemonic_chars, operand_chars.  */
1669   {
1670     int c;
1671     char *p;
1672
1673     for (c = 0; c < 256; c++)
1674       {
1675         if (ISDIGIT (c))
1676           {
1677             digit_chars[c] = c;
1678             mnemonic_chars[c] = c;
1679             register_chars[c] = c;
1680             operand_chars[c] = c;
1681           }
1682         else if (ISLOWER (c))
1683           {
1684             mnemonic_chars[c] = c;
1685             register_chars[c] = c;
1686             operand_chars[c] = c;
1687           }
1688         else if (ISUPPER (c))
1689           {
1690             mnemonic_chars[c] = TOLOWER (c);
1691             register_chars[c] = mnemonic_chars[c];
1692             operand_chars[c] = c;
1693           }
1694
1695         if (ISALPHA (c) || ISDIGIT (c))
1696           identifier_chars[c] = c;
1697         else if (c >= 128)
1698           {
1699             identifier_chars[c] = c;
1700             operand_chars[c] = c;
1701           }
1702       }
1703
1704 #ifdef LEX_AT
1705     identifier_chars['@'] = '@';
1706 #endif
1707 #ifdef LEX_QM
1708     identifier_chars['?'] = '?';
1709     operand_chars['?'] = '?';
1710 #endif
1711     digit_chars['-'] = '-';
1712     mnemonic_chars['-'] = '-';
1713     mnemonic_chars['.'] = '.';
1714     identifier_chars['_'] = '_';
1715     identifier_chars['.'] = '.';
1716
1717     for (p = operand_special_chars; *p != '\0'; p++)
1718       operand_chars[(unsigned char) *p] = *p;
1719   }
1720
1721 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
1722   if (IS_ELF)
1723     {
1724       record_alignment (text_section, 2);
1725       record_alignment (data_section, 2);
1726       record_alignment (bss_section, 2);
1727     }
1728 #endif
1729
1730   if (flag_code == CODE_64BIT)
1731     {
1732       x86_dwarf2_return_column = 16;
1733       x86_cie_data_alignment = -8;
1734     }
1735   else
1736     {
1737       x86_dwarf2_return_column = 8;
1738       x86_cie_data_alignment = -4;
1739     }
1740 }
1741
1742 void
1743 i386_print_statistics (FILE *file)
1744 {
1745   hash_print_statistics (file, "i386 opcode", op_hash);
1746   hash_print_statistics (file, "i386 register", reg_hash);
1747 }
1748 \f
1749 #ifdef DEBUG386
1750
1751 /* Debugging routines for md_assemble.  */
1752 static void pte (template *);
1753 static void pt (i386_operand_type);
1754 static void pe (expressionS *);
1755 static void ps (symbolS *);
1756
1757 static void
1758 pi (char *line, i386_insn *x)
1759 {
1760   unsigned int i;
1761
1762   fprintf (stdout, "%s: template ", line);
1763   pte (&x->tm);
1764   fprintf (stdout, "  address: base %s  index %s  scale %x\n",
1765            x->base_reg ? x->base_reg->reg_name : "none",
1766            x->index_reg ? x->index_reg->reg_name : "none",
1767            x->log2_scale_factor);
1768   fprintf (stdout, "  modrm:  mode %x  reg %x  reg/mem %x\n",
1769            x->rm.mode, x->rm.reg, x->rm.regmem);
1770   fprintf (stdout, "  sib:  base %x  index %x  scale %x\n",
1771            x->sib.base, x->sib.index, x->sib.scale);
1772   fprintf (stdout, "  rex: 64bit %x  extX %x  extY %x  extZ %x\n",
1773            (x->rex & REX_W) != 0,
1774            (x->rex & REX_R) != 0,
1775            (x->rex & REX_X) != 0,
1776            (x->rex & REX_B) != 0);
1777   fprintf (stdout, "  drex:  reg %d rex 0x%x\n", 
1778            x->drex.reg, x->drex.rex);
1779   for (i = 0; i < x->operands; i++)
1780     {
1781       fprintf (stdout, "    #%d:  ", i + 1);
1782       pt (x->types[i]);
1783       fprintf (stdout, "\n");
1784       if (x->types[i].bitfield.reg8
1785           || x->types[i].bitfield.reg16
1786           || x->types[i].bitfield.reg32
1787           || x->types[i].bitfield.reg64
1788           || x->types[i].bitfield.regmmx
1789           || x->types[i].bitfield.regxmm
1790           || x->types[i].bitfield.sreg2
1791           || x->types[i].bitfield.sreg3
1792           || x->types[i].bitfield.control
1793           || x->types[i].bitfield.debug
1794           || x->types[i].bitfield.test)
1795         fprintf (stdout, "%s\n", x->op[i].regs->reg_name);
1796       if (operand_type_check (x->types[i], imm))
1797         pe (x->op[i].imms);
1798       if (operand_type_check (x->types[i], disp))
1799         pe (x->op[i].disps);
1800     }
1801 }
1802
1803 static void
1804 pte (template *t)
1805 {
1806   unsigned int i;
1807   fprintf (stdout, " %d operands ", t->operands);
1808   fprintf (stdout, "opcode %x ", t->base_opcode);
1809   if (t->extension_opcode != None)
1810     fprintf (stdout, "ext %x ", t->extension_opcode);
1811   if (t->opcode_modifier.d)
1812     fprintf (stdout, "D");
1813   if (t->opcode_modifier.w)
1814     fprintf (stdout, "W");
1815   fprintf (stdout, "\n");
1816   for (i = 0; i < t->operands; i++)
1817     {
1818       fprintf (stdout, "    #%d type ", i + 1);
1819       pt (t->operand_types[i]);
1820       fprintf (stdout, "\n");
1821     }
1822 }
1823
1824 static void
1825 pe (expressionS *e)
1826 {
1827   fprintf (stdout, "    operation     %d\n", e->X_op);
1828   fprintf (stdout, "    add_number    %ld (%lx)\n",
1829            (long) e->X_add_number, (long) e->X_add_number);
1830   if (e->X_add_symbol)
1831     {
1832       fprintf (stdout, "    add_symbol    ");
1833       ps (e->X_add_symbol);
1834       fprintf (stdout, "\n");
1835     }
1836   if (e->X_op_symbol)
1837     {
1838       fprintf (stdout, "    op_symbol    ");
1839       ps (e->X_op_symbol);
1840       fprintf (stdout, "\n");
1841     }
1842 }
1843
1844 static void
1845 ps (symbolS *s)
1846 {
1847   fprintf (stdout, "%s type %s%s",
1848            S_GET_NAME (s),
1849            S_IS_EXTERNAL (s) ? "EXTERNAL " : "",
1850            segment_name (S_GET_SEGMENT (s)));
1851 }
1852
1853 static struct type_name
1854   {
1855     i386_operand_type mask;
1856     const char *name;
1857   }
1858 const type_names[] =
1859 {
1860   { OPERAND_TYPE_REG8, "r8" },
1861   { OPERAND_TYPE_REG16, "r16" },
1862   { OPERAND_TYPE_REG32, "r32" },
1863   { OPERAND_TYPE_REG64, "r64" },
1864   { OPERAND_TYPE_IMM8, "i8" },
1865   { OPERAND_TYPE_IMM8, "i8s" },
1866   { OPERAND_TYPE_IMM16, "i16" },
1867   { OPERAND_TYPE_IMM32, "i32" },
1868   { OPERAND_TYPE_IMM32S, "i32s" },
1869   { OPERAND_TYPE_IMM64, "i64" },
1870   { OPERAND_TYPE_IMM1, "i1" },
1871   { OPERAND_TYPE_BASEINDEX, "BaseIndex" },
1872   { OPERAND_TYPE_DISP8, "d8" },
1873   { OPERAND_TYPE_DISP16, "d16" },
1874   { OPERAND_TYPE_DISP32, "d32" },
1875   { OPERAND_TYPE_DISP32S, "d32s" },
1876   { OPERAND_TYPE_DISP64, "d64" },
1877   { OPERAND_TYPE_INOUTPORTREG, "InOutPortReg" },
1878   { OPERAND_TYPE_SHIFTCOUNT, "ShiftCount" },
1879   { OPERAND_TYPE_CONTROL, "control reg" },
1880   { OPERAND_TYPE_TEST, "test reg" },
1881   { OPERAND_TYPE_DEBUG, "debug reg" },
1882   { OPERAND_TYPE_FLOATREG, "FReg" },
1883   { OPERAND_TYPE_FLOATACC, "FAcc" },
1884   { OPERAND_TYPE_SREG2, "SReg2" },
1885   { OPERAND_TYPE_SREG3, "SReg3" },
1886   { OPERAND_TYPE_ACC, "Acc" },
1887   { OPERAND_TYPE_JUMPABSOLUTE, "Jump Absolute" },
1888   { OPERAND_TYPE_REGMMX, "rMMX" },
1889   { OPERAND_TYPE_REGXMM, "rXMM" },
1890   { OPERAND_TYPE_ESSEG, "es" },
1891 };
1892
1893 static void
1894 pt (i386_operand_type t)
1895 {
1896   unsigned int j;
1897   i386_operand_type a;
1898
1899   for (j = 0; j < ARRAY_SIZE (type_names); j++)
1900     {
1901       a = operand_type_and (t, type_names[j].mask);
1902       if (!UINTS_ALL_ZERO (a))
1903         fprintf (stdout, "%s, ",  type_names[j].name);
1904     }
1905   fflush (stdout);
1906 }
1907
1908 #endif /* DEBUG386 */
1909 \f
1910 static bfd_reloc_code_real_type
1911 reloc (unsigned int size,
1912        int pcrel,
1913        int sign,
1914        bfd_reloc_code_real_type other)
1915 {
1916   if (other != NO_RELOC)
1917     {
1918       reloc_howto_type *reloc;
1919
1920       if (size == 8)
1921         switch (other)
1922           {
1923           case BFD_RELOC_X86_64_GOT32:
1924             return BFD_RELOC_X86_64_GOT64;
1925             break;
1926           case BFD_RELOC_X86_64_PLTOFF64:
1927             return BFD_RELOC_X86_64_PLTOFF64;
1928             break;
1929           case BFD_RELOC_X86_64_GOTPC32:
1930             other = BFD_RELOC_X86_64_GOTPC64;
1931             break;
1932           case BFD_RELOC_X86_64_GOTPCREL:
1933             other = BFD_RELOC_X86_64_GOTPCREL64;
1934             break;
1935           case BFD_RELOC_X86_64_TPOFF32:
1936             other = BFD_RELOC_X86_64_TPOFF64;
1937             break;
1938           case BFD_RELOC_X86_64_DTPOFF32:
1939             other = BFD_RELOC_X86_64_DTPOFF64;
1940             break;
1941           default:
1942             break;
1943           }
1944
1945       /* Sign-checking 4-byte relocations in 16-/32-bit code is pointless.  */
1946       if (size == 4 && flag_code != CODE_64BIT)
1947         sign = -1;
1948
1949       reloc = bfd_reloc_type_lookup (stdoutput, other);
1950       if (!reloc)
1951         as_bad (_("unknown relocation (%u)"), other);
1952       else if (size != bfd_get_reloc_size (reloc))
1953         as_bad (_("%u-byte relocation cannot be applied to %u-byte field"),
1954                 bfd_get_reloc_size (reloc),
1955                 size);
1956       else if (pcrel && !reloc->pc_relative)
1957         as_bad (_("non-pc-relative relocation for pc-relative field"));
1958       else if ((reloc->complain_on_overflow == complain_overflow_signed
1959                 && !sign)
1960                || (reloc->complain_on_overflow == complain_overflow_unsigned
1961                    && sign > 0))
1962         as_bad (_("relocated field and relocation type differ in signedness"));
1963       else
1964         return other;
1965       return NO_RELOC;
1966     }
1967
1968   if (pcrel)
1969     {
1970       if (!sign)
1971         as_bad (_("there are no unsigned pc-relative relocations"));
1972       switch (size)
1973         {
1974         case 1: return BFD_RELOC_8_PCREL;
1975         case 2: return BFD_RELOC_16_PCREL;
1976         case 4: return BFD_RELOC_32_PCREL;
1977         case 8: return BFD_RELOC_64_PCREL;
1978         }
1979       as_bad (_("cannot do %u byte pc-relative relocation"), size);
1980     }
1981   else
1982     {
1983       if (sign > 0)
1984         switch (size)
1985           {
1986           case 4: return BFD_RELOC_X86_64_32S;
1987           }
1988       else
1989         switch (size)
1990           {
1991           case 1: return BFD_RELOC_8;
1992           case 2: return BFD_RELOC_16;
1993           case 4: return BFD_RELOC_32;
1994           case 8: return BFD_RELOC_64;
1995           }
1996       as_bad (_("cannot do %s %u byte relocation"),
1997               sign > 0 ? "signed" : "unsigned", size);
1998     }
1999
2000   abort ();
2001   return BFD_RELOC_NONE;
2002 }
2003
2004 /* Here we decide which fixups can be adjusted to make them relative to
2005    the beginning of the section instead of the symbol.  Basically we need
2006    to make sure that the dynamic relocations are done correctly, so in
2007    some cases we force the original symbol to be used.  */
2008
2009 int
2010 tc_i386_fix_adjustable (fixS *fixP ATTRIBUTE_UNUSED)
2011 {
2012 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
2013   if (!IS_ELF)
2014     return 1;
2015
2016   /* Don't adjust pc-relative references to merge sections in 64-bit
2017      mode.  */
2018   if (use_rela_relocations
2019       && (S_GET_SEGMENT (fixP->fx_addsy)->flags & SEC_MERGE) != 0
2020       && fixP->fx_pcrel)
2021     return 0;
2022
2023   /* The x86_64 GOTPCREL are represented as 32bit PCrel relocations
2024      and changed later by validate_fix.  */
2025   if (GOT_symbol && fixP->fx_subsy == GOT_symbol
2026       && fixP->fx_r_type == BFD_RELOC_32_PCREL)
2027     return 0;
2028
2029   /* adjust_reloc_syms doesn't know about the GOT.  */
2030   if (fixP->fx_r_type == BFD_RELOC_386_GOTOFF
2031       || fixP->fx_r_type == BFD_RELOC_386_PLT32
2032       || fixP->fx_r_type == BFD_RELOC_386_GOT32
2033       || fixP->fx_r_type == BFD_RELOC_386_TLS_GD
2034       || fixP->fx_r_type == BFD_RELOC_386_TLS_LDM
2035       || fixP->fx_r_type == BFD_RELOC_386_TLS_LDO_32
2036       || fixP->fx_r_type == BFD_RELOC_386_TLS_IE_32
2037       || fixP->fx_r_type == BFD_RELOC_386_TLS_IE
2038       || fixP->fx_r_type == BFD_RELOC_386_TLS_GOTIE
2039       || fixP->fx_r_type == BFD_RELOC_386_TLS_LE_32
2040       || fixP->fx_r_type == BFD_RELOC_386_TLS_LE
2041       || fixP->fx_r_type == BFD_RELOC_386_TLS_GOTDESC
2042       || fixP->fx_r_type == BFD_RELOC_386_TLS_DESC_CALL
2043       || fixP->fx_r_type == BFD_RELOC_X86_64_PLT32
2044       || fixP->fx_r_type == BFD_RELOC_X86_64_GOT32
2045       || fixP->fx_r_type == BFD_RELOC_X86_64_GOTPCREL
2046       || fixP->fx_r_type == BFD_RELOC_X86_64_TLSGD
2047       || fixP->fx_r_type == BFD_RELOC_X86_64_TLSLD
2048       || fixP->fx_r_type == BFD_RELOC_X86_64_DTPOFF32
2049       || fixP->fx_r_type == BFD_RELOC_X86_64_DTPOFF64
2050       || fixP->fx_r_type == BFD_RELOC_X86_64_GOTTPOFF
2051       || fixP->fx_r_type == BFD_RELOC_X86_64_TPOFF32
2052       || fixP->fx_r_type == BFD_RELOC_X86_64_TPOFF64
2053       || fixP->fx_r_type == BFD_RELOC_X86_64_GOTOFF64
2054       || fixP->fx_r_type == BFD_RELOC_X86_64_GOTPC32_TLSDESC
2055       || fixP->fx_r_type == BFD_RELOC_X86_64_TLSDESC_CALL
2056       || fixP->fx_r_type == BFD_RELOC_VTABLE_INHERIT
2057       || fixP->fx_r_type == BFD_RELOC_VTABLE_ENTRY)
2058     return 0;
2059 #endif
2060   return 1;
2061 }
2062
2063 static int
2064 intel_float_operand (const char *mnemonic)
2065 {
2066   /* Note that the value returned is meaningful only for opcodes with (memory)
2067      operands, hence the code here is free to improperly handle opcodes that
2068      have no operands (for better performance and smaller code). */
2069
2070   if (mnemonic[0] != 'f')
2071     return 0; /* non-math */
2072
2073   switch (mnemonic[1])
2074     {
2075     /* fclex, fdecstp, fdisi, femms, feni, fincstp, finit, fsetpm, and
2076        the fs segment override prefix not currently handled because no
2077        call path can make opcodes without operands get here */
2078     case 'i':
2079       return 2 /* integer op */;
2080     case 'l':
2081       if (mnemonic[2] == 'd' && (mnemonic[3] == 'c' || mnemonic[3] == 'e'))
2082         return 3; /* fldcw/fldenv */
2083       break;
2084     case 'n':
2085       if (mnemonic[2] != 'o' /* fnop */)
2086         return 3; /* non-waiting control op */
2087       break;
2088     case 'r':
2089       if (mnemonic[2] == 's')
2090         return 3; /* frstor/frstpm */
2091       break;
2092     case 's':
2093       if (mnemonic[2] == 'a')
2094         return 3; /* fsave */
2095       if (mnemonic[2] == 't')
2096         {
2097           switch (mnemonic[3])
2098             {
2099             case 'c': /* fstcw */
2100             case 'd': /* fstdw */
2101             case 'e': /* fstenv */
2102             case 's': /* fsts[gw] */
2103               return 3;
2104             }
2105         }
2106       break;
2107     case 'x':
2108       if (mnemonic[2] == 'r' || mnemonic[2] == 's')
2109         return 0; /* fxsave/fxrstor are not really math ops */
2110       break;
2111     }
2112
2113   return 1;
2114 }
2115
2116 /* This is the guts of the machine-dependent assembler.  LINE points to a
2117    machine dependent instruction.  This function is supposed to emit
2118    the frags/bytes it assembles to.  */
2119
2120 void
2121 md_assemble (line)
2122      char *line;
2123 {
2124   unsigned int j;
2125   char mnemonic[MAX_MNEM_SIZE];
2126
2127   /* Initialize globals.  */
2128   memset (&i, '\0', sizeof (i));
2129   for (j = 0; j < MAX_OPERANDS; j++)
2130     i.reloc[j] = NO_RELOC;
2131   memset (disp_expressions, '\0', sizeof (disp_expressions));
2132   memset (im_expressions, '\0', sizeof (im_expressions));
2133   save_stack_p = save_stack;
2134
2135   /* First parse an instruction mnemonic & call i386_operand for the operands.
2136      We assume that the scrubber has arranged it so that line[0] is the valid
2137      start of a (possibly prefixed) mnemonic.  */
2138
2139   line = parse_insn (line, mnemonic);
2140   if (line == NULL)
2141     return;
2142
2143   line = parse_operands (line, mnemonic);
2144   if (line == NULL)
2145     return;
2146
2147   /* Now we've parsed the mnemonic into a set of templates, and have the
2148      operands at hand.  */
2149
2150   /* All intel opcodes have reversed operands except for "bound" and
2151      "enter".  We also don't reverse intersegment "jmp" and "call"
2152      instructions with 2 immediate operands so that the immediate segment
2153      precedes the offset, as it does when in AT&T mode. */
2154   if (intel_syntax
2155       && i.operands > 1
2156       && (strcmp (mnemonic, "bound") != 0)
2157       && (strcmp (mnemonic, "invlpga") != 0)
2158       && !(operand_type_check (i.types[0], imm)
2159            && operand_type_check (i.types[1], imm)))
2160     swap_operands ();
2161
2162   /* The order of the immediates should be reversed
2163      for 2 immediates extrq and insertq instructions */
2164   if (i.imm_operands == 2
2165       && (strcmp (mnemonic, "extrq") == 0
2166           || strcmp (mnemonic, "insertq") == 0))
2167       swap_2_operands (0, 1);
2168
2169   if (i.imm_operands)
2170     optimize_imm ();
2171
2172   /* Don't optimize displacement for movabs since it only takes 64bit
2173      displacement.  */
2174   if (i.disp_operands
2175       && (flag_code != CODE_64BIT
2176           || strcmp (mnemonic, "movabs") != 0))
2177     optimize_disp ();
2178
2179   /* Next, we find a template that matches the given insn,
2180      making sure the overlap of the given operands types is consistent
2181      with the template operand types.  */
2182
2183   if (!match_template ())
2184     return;
2185
2186   if (intel_syntax)
2187     {
2188       /* Undo SYSV386_COMPAT brokenness when in Intel mode.  See i386.h  */
2189       if (SYSV386_COMPAT
2190           && (i.tm.base_opcode & 0xfffffde0) == 0xdce0)
2191         i.tm.base_opcode ^= Opcode_FloatR;
2192
2193       /* Zap movzx and movsx suffix.  The suffix may have been set from
2194          "word ptr" or "byte ptr" on the source operand, but we'll use
2195          the suffix later to choose the destination register.  */
2196       if ((i.tm.base_opcode & ~9) == 0x0fb6)
2197         {
2198           if (i.reg_operands < 2
2199               && !i.suffix
2200               && (!i.tm.opcode_modifier.no_bsuf
2201                   || !i.tm.opcode_modifier.no_wsuf
2202                   || !i.tm.opcode_modifier.no_lsuf
2203                   || !i.tm.opcode_modifier.no_ssuf
2204                   || !i.tm.opcode_modifier.no_xsuf
2205                   || !i.tm.opcode_modifier.no_qsuf))
2206             as_bad (_("ambiguous operand size for `%s'"), i.tm.name);
2207
2208           i.suffix = 0;
2209         }
2210     }
2211
2212   if (i.tm.opcode_modifier.fwait)
2213     if (!add_prefix (FWAIT_OPCODE))
2214       return;
2215
2216   /* Check string instruction segment overrides.  */
2217   if (i.tm.opcode_modifier.isstring && i.mem_operands != 0)
2218     {
2219       if (!check_string ())
2220         return;
2221     }
2222
2223   if (!process_suffix ())
2224     return;
2225
2226   /* Make still unresolved immediate matches conform to size of immediate
2227      given in i.suffix.  */
2228   if (!finalize_imm ())
2229     return;
2230
2231   if (i.types[0].bitfield.imm1)
2232     i.imm_operands = 0; /* kludge for shift insns.  */
2233
2234   for (j = 0; j < 3; j++)
2235     if (i.types[j].bitfield.inoutportreg
2236         || i.types[j].bitfield.shiftcount
2237         || i.types[j].bitfield.acc
2238         || i.types[j].bitfield.floatacc)
2239       i.reg_operands--;
2240
2241   if (i.tm.opcode_modifier.immext)
2242     {
2243       expressionS *exp;
2244
2245       if (i.tm.cpu_flags.bitfield.cpusse3 && i.operands > 0)
2246         {
2247           /* Streaming SIMD extensions 3 Instructions have the fixed
2248              operands with an opcode suffix which is coded in the same
2249              place as an 8-bit immediate field would be. Here we check
2250              those operands and remove them afterwards.  */
2251           unsigned int x;
2252
2253           for (x = 0; x < i.operands; x++)
2254             if (i.op[x].regs->reg_num != x)
2255               as_bad (_("can't use register '%s%s' as operand %d in '%s'."),
2256                       register_prefix,
2257                       i.op[x].regs->reg_name,
2258                       x + 1,
2259                       i.tm.name);
2260           i.operands = 0;
2261         }
2262
2263       /* These AMD 3DNow! and Intel Katmai New Instructions have an
2264          opcode suffix which is coded in the same place as an 8-bit
2265          immediate field would be.  Here we fake an 8-bit immediate
2266          operand from the opcode suffix stored in tm.extension_opcode.
2267          SSE5 also uses this encoding, for some of its 3 argument
2268          instructions.  */
2269
2270       assert (i.imm_operands == 0
2271               && (i.operands <= 2
2272                   || (i.tm.cpu_flags.bitfield.cpusse5
2273                       && i.operands <= 3)));
2274
2275       exp = &im_expressions[i.imm_operands++];
2276       i.op[i.operands].imms = exp;
2277       UINTS_CLEAR (i.types[i.operands]);
2278       i.types[i.operands].bitfield.imm8 = 1;
2279       i.operands++;
2280       exp->X_op = O_constant;
2281       exp->X_add_number = i.tm.extension_opcode;
2282       i.tm.extension_opcode = None;
2283     }
2284
2285   /* For insns with operands there are more diddles to do to the opcode.  */
2286   if (i.operands)
2287     {
2288       if (!process_operands ())
2289         return;
2290     }
2291   else if (!quiet_warnings && i.tm.opcode_modifier.ugh)
2292     {
2293       /* UnixWare fsub no args is alias for fsubp, fadd -> faddp, etc.  */
2294       as_warn (_("translating to `%sp'"), i.tm.name);
2295     }
2296
2297   /* Handle conversion of 'int $3' --> special int3 insn.  */
2298   if (i.tm.base_opcode == INT_OPCODE && i.op[0].imms->X_add_number == 3)
2299     {
2300       i.tm.base_opcode = INT3_OPCODE;
2301       i.imm_operands = 0;
2302     }
2303
2304   if ((i.tm.opcode_modifier.jump
2305        || i.tm.opcode_modifier.jumpbyte
2306        || i.tm.opcode_modifier.jumpdword)
2307       && i.op[0].disps->X_op == O_constant)
2308     {
2309       /* Convert "jmp constant" (and "call constant") to a jump (call) to
2310          the absolute address given by the constant.  Since ix86 jumps and
2311          calls are pc relative, we need to generate a reloc.  */
2312       i.op[0].disps->X_add_symbol = &abs_symbol;
2313       i.op[0].disps->X_op = O_symbol;
2314     }
2315
2316   if (i.tm.opcode_modifier.rex64)
2317     i.rex |= REX_W;
2318
2319   /* For 8 bit registers we need an empty rex prefix.  Also if the
2320      instruction already has a prefix, we need to convert old
2321      registers to new ones.  */
2322
2323   if ((i.types[0].bitfield.reg8
2324        && (i.op[0].regs->reg_flags & RegRex64) != 0)
2325       || (i.types[1].bitfield.reg8
2326           && (i.op[1].regs->reg_flags & RegRex64) != 0)
2327       || ((i.types[0].bitfield.reg8
2328            || i.types[1].bitfield.reg8)
2329           && i.rex != 0))
2330     {
2331       int x;
2332
2333       i.rex |= REX_OPCODE;
2334       for (x = 0; x < 2; x++)
2335         {
2336           /* Look for 8 bit operand that uses old registers.  */
2337           if (i.types[x].bitfield.reg8
2338               && (i.op[x].regs->reg_flags & RegRex64) == 0)
2339             {
2340               /* In case it is "hi" register, give up.  */
2341               if (i.op[x].regs->reg_num > 3)
2342                 as_bad (_("can't encode register '%s%s' in an "
2343                           "instruction requiring REX prefix."),
2344                         register_prefix, i.op[x].regs->reg_name);
2345
2346               /* Otherwise it is equivalent to the extended register.
2347                  Since the encoding doesn't change this is merely
2348                  cosmetic cleanup for debug output.  */
2349
2350               i.op[x].regs = i.op[x].regs + 8;
2351             }
2352         }
2353     }
2354
2355   /* If the instruction has the DREX attribute (aka SSE5), don't emit a
2356      REX prefix.  */
2357   if (i.tm.opcode_modifier.drex || i.tm.opcode_modifier.drexc)
2358     {
2359       i.drex.rex = i.rex;
2360       i.rex = 0;
2361     }
2362   else if (i.rex != 0)
2363     add_prefix (REX_OPCODE | i.rex);
2364
2365   /* We are ready to output the insn.  */
2366   output_insn ();
2367 }
2368
2369 static char *
2370 parse_insn (char *line, char *mnemonic)
2371 {
2372   char *l = line;
2373   char *token_start = l;
2374   char *mnem_p;
2375   int supported;
2376   const template *t;
2377
2378   /* Non-zero if we found a prefix only acceptable with string insns.  */
2379   const char *expecting_string_instruction = NULL;
2380
2381   while (1)
2382     {
2383       mnem_p = mnemonic;
2384       while ((*mnem_p = mnemonic_chars[(unsigned char) *l]) != 0)
2385         {
2386           mnem_p++;
2387           if (mnem_p >= mnemonic + MAX_MNEM_SIZE)
2388             {
2389               as_bad (_("no such instruction: `%s'"), token_start);
2390               return NULL;
2391             }
2392           l++;
2393         }
2394       if (!is_space_char (*l)
2395           && *l != END_OF_INSN
2396           && (intel_syntax
2397               || (*l != PREFIX_SEPARATOR
2398                   && *l != ',')))
2399         {
2400           as_bad (_("invalid character %s in mnemonic"),
2401                   output_invalid (*l));
2402           return NULL;
2403         }
2404       if (token_start == l)
2405         {
2406           if (!intel_syntax && *l == PREFIX_SEPARATOR)
2407             as_bad (_("expecting prefix; got nothing"));
2408           else
2409             as_bad (_("expecting mnemonic; got nothing"));
2410           return NULL;
2411         }
2412
2413       /* Look up instruction (or prefix) via hash table.  */
2414       current_templates = hash_find (op_hash, mnemonic);
2415
2416       if (*l != END_OF_INSN
2417           && (!is_space_char (*l) || l[1] != END_OF_INSN)
2418           && current_templates
2419           && current_templates->start->opcode_modifier.isprefix)
2420         {
2421           if (!cpu_flags_check_cpu64 (current_templates->start->cpu_flags))
2422             {
2423               as_bad ((flag_code != CODE_64BIT
2424                        ? _("`%s' is only supported in 64-bit mode")
2425                        : _("`%s' is not supported in 64-bit mode")),
2426                       current_templates->start->name);
2427               return NULL;
2428             }
2429           /* If we are in 16-bit mode, do not allow addr16 or data16.
2430              Similarly, in 32-bit mode, do not allow addr32 or data32.  */
2431           if ((current_templates->start->opcode_modifier.size16
2432                || current_templates->start->opcode_modifier.size32)
2433               && flag_code != CODE_64BIT
2434               && (current_templates->start->opcode_modifier.size32
2435                   ^ (flag_code == CODE_16BIT)))
2436             {
2437               as_bad (_("redundant %s prefix"),
2438                       current_templates->start->name);
2439               return NULL;
2440             }
2441           /* Add prefix, checking for repeated prefixes.  */
2442           switch (add_prefix (current_templates->start->base_opcode))
2443             {
2444             case 0:
2445               return NULL;
2446             case 2:
2447               expecting_string_instruction = current_templates->start->name;
2448               break;
2449             }
2450           /* Skip past PREFIX_SEPARATOR and reset token_start.  */
2451           token_start = ++l;
2452         }
2453       else
2454         break;
2455     }
2456
2457   if (!current_templates)
2458     {
2459       /* See if we can get a match by trimming off a suffix.  */
2460       switch (mnem_p[-1])
2461         {
2462         case WORD_MNEM_SUFFIX:
2463           if (intel_syntax && (intel_float_operand (mnemonic) & 2))
2464             i.suffix = SHORT_MNEM_SUFFIX;
2465           else
2466         case BYTE_MNEM_SUFFIX:
2467         case QWORD_MNEM_SUFFIX:
2468           i.suffix = mnem_p[-1];
2469           mnem_p[-1] = '\0';
2470           current_templates = hash_find (op_hash, mnemonic);
2471           break;
2472         case SHORT_MNEM_SUFFIX:
2473         case LONG_MNEM_SUFFIX:
2474           if (!intel_syntax)
2475             {
2476               i.suffix = mnem_p[-1];
2477               mnem_p[-1] = '\0';
2478               current_templates = hash_find (op_hash, mnemonic);
2479             }
2480           break;
2481
2482           /* Intel Syntax.  */
2483         case 'd':
2484           if (intel_syntax)
2485             {
2486               if (intel_float_operand (mnemonic) == 1)
2487                 i.suffix = SHORT_MNEM_SUFFIX;
2488               else
2489                 i.suffix = LONG_MNEM_SUFFIX;
2490               mnem_p[-1] = '\0';
2491               current_templates = hash_find (op_hash, mnemonic);
2492             }
2493           break;
2494         }
2495       if (!current_templates)
2496         {
2497           as_bad (_("no such instruction: `%s'"), token_start);
2498           return NULL;
2499         }
2500     }
2501
2502   if (current_templates->start->opcode_modifier.jump
2503       || current_templates->start->opcode_modifier.jumpbyte)
2504     {
2505       /* Check for a branch hint.  We allow ",pt" and ",pn" for
2506          predict taken and predict not taken respectively.
2507          I'm not sure that branch hints actually do anything on loop
2508          and jcxz insns (JumpByte) for current Pentium4 chips.  They
2509          may work in the future and it doesn't hurt to accept them
2510          now.  */
2511       if (l[0] == ',' && l[1] == 'p')
2512         {
2513           if (l[2] == 't')
2514             {
2515               if (!add_prefix (DS_PREFIX_OPCODE))
2516                 return NULL;
2517               l += 3;
2518             }
2519           else if (l[2] == 'n')
2520             {
2521               if (!add_prefix (CS_PREFIX_OPCODE))
2522                 return NULL;
2523               l += 3;
2524             }
2525         }
2526     }
2527   /* Any other comma loses.  */
2528   if (*l == ',')
2529     {
2530       as_bad (_("invalid character %s in mnemonic"),
2531               output_invalid (*l));
2532       return NULL;
2533     }
2534
2535   /* Check if instruction is supported on specified architecture.  */
2536   supported = 0;
2537   for (t = current_templates->start; t < current_templates->end; ++t)
2538     {
2539       if (cpu_flags_match (t->cpu_flags))
2540         supported |= 1;
2541       if (cpu_flags_check_cpu64 (t->cpu_flags))
2542         supported |= 2;
2543     }
2544   if (!(supported & 2))
2545     {
2546       as_bad (flag_code == CODE_64BIT
2547               ? _("`%s' is not supported in 64-bit mode")
2548               : _("`%s' is only supported in 64-bit mode"),
2549               current_templates->start->name);
2550       return NULL;
2551     }
2552   if (!(supported & 1))
2553     {
2554       as_warn (_("`%s' is not supported on `%s%s'"),
2555                current_templates->start->name,
2556                cpu_arch_name,
2557                cpu_sub_arch_name ? cpu_sub_arch_name : "");
2558     }
2559   else if (!cpu_arch_flags.bitfield.cpui386
2560            && (flag_code != CODE_16BIT))
2561     {
2562       as_warn (_("use .code16 to ensure correct addressing mode"));
2563     }
2564
2565   /* Check for rep/repne without a string instruction.  */
2566   if (expecting_string_instruction)
2567     {
2568       static templates override;
2569
2570       for (t = current_templates->start; t < current_templates->end; ++t)
2571         if (t->opcode_modifier.isstring)
2572           break;
2573       if (t >= current_templates->end)
2574         {
2575           as_bad (_("expecting string instruction after `%s'"),
2576                   expecting_string_instruction);
2577           return NULL;
2578         }
2579       for (override.start = t; t < current_templates->end; ++t)
2580         if (!t->opcode_modifier.isstring)
2581           break;
2582       override.end = t;
2583       current_templates = &override;
2584     }
2585
2586   return l;
2587 }
2588
2589 static char *
2590 parse_operands (char *l, const char *mnemonic)
2591 {
2592   char *token_start;
2593
2594   /* 1 if operand is pending after ','.  */
2595   unsigned int expecting_operand = 0;
2596
2597   /* Non-zero if operand parens not balanced.  */
2598   unsigned int paren_not_balanced;
2599
2600   while (*l != END_OF_INSN)
2601     {
2602       /* Skip optional white space before operand.  */
2603       if (is_space_char (*l))
2604         ++l;
2605       if (!is_operand_char (*l) && *l != END_OF_INSN)
2606         {
2607           as_bad (_("invalid character %s before operand %d"),
2608                   output_invalid (*l),
2609                   i.operands + 1);
2610           return NULL;
2611         }
2612       token_start = l;  /* after white space */
2613       paren_not_balanced = 0;
2614       while (paren_not_balanced || *l != ',')
2615         {
2616           if (*l == END_OF_INSN)
2617             {
2618               if (paren_not_balanced)
2619                 {
2620                   if (!intel_syntax)
2621                     as_bad (_("unbalanced parenthesis in operand %d."),
2622                             i.operands + 1);
2623                   else
2624                     as_bad (_("unbalanced brackets in operand %d."),
2625                             i.operands + 1);
2626                   return NULL;
2627                 }
2628               else
2629                 break;  /* we are done */
2630             }
2631           else if (!is_operand_char (*l) && !is_space_char (*l))
2632             {
2633               as_bad (_("invalid character %s in operand %d"),
2634                       output_invalid (*l),
2635                       i.operands + 1);
2636               return NULL;
2637             }
2638           if (!intel_syntax)
2639             {
2640               if (*l == '(')
2641                 ++paren_not_balanced;
2642               if (*l == ')')
2643                 --paren_not_balanced;
2644             }
2645           else
2646             {
2647               if (*l == '[')
2648                 ++paren_not_balanced;
2649               if (*l == ']')
2650                 --paren_not_balanced;
2651             }
2652           l++;
2653         }
2654       if (l != token_start)
2655         {                       /* Yes, we've read in another operand.  */
2656           unsigned int operand_ok;
2657           this_operand = i.operands++;
2658           if (i.operands > MAX_OPERANDS)
2659             {
2660               as_bad (_("spurious operands; (%d operands/instruction max)"),
2661                       MAX_OPERANDS);
2662               return NULL;
2663             }
2664           /* Now parse operand adding info to 'i' as we go along.  */
2665           END_STRING_AND_SAVE (l);
2666
2667           if (intel_syntax)
2668             operand_ok =
2669               i386_intel_operand (token_start,
2670                                   intel_float_operand (mnemonic));
2671           else
2672             operand_ok = i386_operand (token_start);
2673
2674           RESTORE_END_STRING (l);
2675           if (!operand_ok)
2676             return NULL;
2677         }
2678       else
2679         {
2680           if (expecting_operand)
2681             {
2682             expecting_operand_after_comma:
2683               as_bad (_("expecting operand after ','; got nothing"));
2684               return NULL;
2685             }
2686           if (*l == ',')
2687             {
2688               as_bad (_("expecting operand before ','; got nothing"));
2689               return NULL;
2690             }
2691         }
2692
2693       /* Now *l must be either ',' or END_OF_INSN.  */
2694       if (*l == ',')
2695         {
2696           if (*++l == END_OF_INSN)
2697             {
2698               /* Just skip it, if it's \n complain.  */
2699               goto expecting_operand_after_comma;
2700             }
2701           expecting_operand = 1;
2702         }
2703     }
2704   return l;
2705 }
2706
2707 static void
2708 swap_2_operands (int xchg1, int xchg2)
2709 {
2710   union i386_op temp_op;
2711   i386_operand_type temp_type;
2712   enum bfd_reloc_code_real temp_reloc;
2713
2714   temp_type = i.types[xchg2];
2715   i.types[xchg2] = i.types[xchg1];
2716   i.types[xchg1] = temp_type;
2717   temp_op = i.op[xchg2];
2718   i.op[xchg2] = i.op[xchg1];
2719   i.op[xchg1] = temp_op;
2720   temp_reloc = i.reloc[xchg2];
2721   i.reloc[xchg2] = i.reloc[xchg1];
2722   i.reloc[xchg1] = temp_reloc;
2723 }
2724
2725 static void
2726 swap_operands (void)
2727 {
2728   switch (i.operands)
2729     {
2730     case 4:
2731       swap_2_operands (1, i.operands - 2);
2732     case 3:
2733     case 2:
2734       swap_2_operands (0, i.operands - 1);
2735       break;
2736     default:
2737       abort ();
2738     }
2739
2740   if (i.mem_operands == 2)
2741     {
2742       const seg_entry *temp_seg;
2743       temp_seg = i.seg[0];
2744       i.seg[0] = i.seg[1];
2745       i.seg[1] = temp_seg;
2746     }
2747 }
2748
2749 /* Try to ensure constant immediates are represented in the smallest
2750    opcode possible.  */
2751 static void
2752 optimize_imm (void)
2753 {
2754   char guess_suffix = 0;
2755   int op;
2756
2757   if (i.suffix)
2758     guess_suffix = i.suffix;
2759   else if (i.reg_operands)
2760     {
2761       /* Figure out a suffix from the last register operand specified.
2762          We can't do this properly yet, ie. excluding InOutPortReg,
2763          but the following works for instructions with immediates.
2764          In any case, we can't set i.suffix yet.  */
2765       for (op = i.operands; --op >= 0;)
2766         if (i.types[op].bitfield.reg8)
2767           { 
2768             guess_suffix = BYTE_MNEM_SUFFIX;
2769             break;
2770           }
2771         else if (i.types[op].bitfield.reg16)
2772           {
2773             guess_suffix = WORD_MNEM_SUFFIX;
2774             break;
2775           }
2776         else if (i.types[op].bitfield.reg32)
2777           {
2778             guess_suffix = LONG_MNEM_SUFFIX;
2779             break;
2780           }
2781         else if (i.types[op].bitfield.reg64)
2782           {
2783             guess_suffix = QWORD_MNEM_SUFFIX;
2784             break;
2785           }
2786     }
2787   else if ((flag_code == CODE_16BIT) ^ (i.prefix[DATA_PREFIX] != 0))
2788     guess_suffix = WORD_MNEM_SUFFIX;
2789
2790   for (op = i.operands; --op >= 0;)
2791     if (operand_type_check (i.types[op], imm))
2792       {
2793         switch (i.op[op].imms->X_op)
2794           {
2795           case O_constant:
2796             /* If a suffix is given, this operand may be shortened.  */
2797             switch (guess_suffix)
2798               {
2799               case LONG_MNEM_SUFFIX:
2800                 i.types[op].bitfield.imm32 = 1;
2801                 i.types[op].bitfield.imm64 = 1;
2802                 break;
2803               case WORD_MNEM_SUFFIX:
2804                 i.types[op].bitfield.imm16 = 1;
2805                 i.types[op].bitfield.imm32 = 1;
2806                 i.types[op].bitfield.imm32s = 1;
2807                 i.types[op].bitfield.imm64 = 1;
2808                 break;
2809               case BYTE_MNEM_SUFFIX:
2810                 i.types[op].bitfield.imm8 = 1;
2811                 i.types[op].bitfield.imm8s = 1;
2812                 i.types[op].bitfield.imm16 = 1;
2813                 i.types[op].bitfield.imm32 = 1;
2814                 i.types[op].bitfield.imm32s = 1;
2815                 i.types[op].bitfield.imm64 = 1;
2816                 break;
2817               }
2818
2819             /* If this operand is at most 16 bits, convert it
2820                to a signed 16 bit number before trying to see
2821                whether it will fit in an even smaller size.
2822                This allows a 16-bit operand such as $0xffe0 to
2823                be recognised as within Imm8S range.  */
2824             if ((i.types[op].bitfield.imm16)
2825                 && (i.op[op].imms->X_add_number & ~(offsetT) 0xffff) == 0)
2826               {
2827                 i.op[op].imms->X_add_number =
2828                   (((i.op[op].imms->X_add_number & 0xffff) ^ 0x8000) - 0x8000);
2829               }
2830             if ((i.types[op].bitfield.imm32)
2831                 && ((i.op[op].imms->X_add_number & ~(((offsetT) 2 << 31) - 1))
2832                     == 0))
2833               {
2834                 i.op[op].imms->X_add_number = ((i.op[op].imms->X_add_number
2835                                                 ^ ((offsetT) 1 << 31))
2836                                                - ((offsetT) 1 << 31));
2837               }
2838             i.types[op]
2839               = operand_type_or (i.types[op],
2840                                  smallest_imm_type (i.op[op].imms->X_add_number));
2841
2842             /* We must avoid matching of Imm32 templates when 64bit
2843                only immediate is available.  */
2844             if (guess_suffix == QWORD_MNEM_SUFFIX)
2845               i.types[op].bitfield.imm32 = 0;
2846             break;
2847
2848           case O_absent:
2849           case O_register:
2850             abort ();
2851
2852             /* Symbols and expressions.  */
2853           default:
2854             /* Convert symbolic operand to proper sizes for matching, but don't
2855                prevent matching a set of insns that only supports sizes other
2856                than those matching the insn suffix.  */
2857             {
2858               i386_operand_type mask, allowed;
2859               const template *t;
2860
2861               UINTS_CLEAR (mask);
2862               UINTS_CLEAR (allowed);
2863
2864               for (t = current_templates->start;
2865                    t < current_templates->end;
2866                    ++t)
2867                 allowed = operand_type_or (allowed,
2868                                            t->operand_types[op]);
2869               switch (guess_suffix)
2870                 {
2871                 case QWORD_MNEM_SUFFIX:
2872                   mask.bitfield.imm64 = 1;
2873                   mask.bitfield.imm32s = 1;
2874                   break;
2875                 case LONG_MNEM_SUFFIX:
2876                   mask.bitfield.imm32 = 1;
2877                   break;
2878                 case WORD_MNEM_SUFFIX:
2879                   mask.bitfield.imm16 = 1;
2880                   break;
2881                 case BYTE_MNEM_SUFFIX:
2882                   mask.bitfield.imm8 = 1;
2883                   break;
2884                 default:
2885                   break;
2886                 }
2887               allowed = operand_type_and (mask, allowed);
2888               if (!UINTS_ALL_ZERO (allowed))
2889                 i.types[op] = operand_type_and (i.types[op], mask);
2890             }
2891             break;
2892           }
2893       }
2894 }
2895
2896 /* Try to use the smallest displacement type too.  */
2897 static void
2898 optimize_disp (void)
2899 {
2900   int op;
2901
2902   for (op = i.operands; --op >= 0;)
2903     if (operand_type_check (i.types[op], disp))
2904       {
2905         if (i.op[op].disps->X_op == O_constant)
2906           {
2907             offsetT disp = i.op[op].disps->X_add_number;
2908
2909             if (i.types[op].bitfield.disp16
2910                 && (disp & ~(offsetT) 0xffff) == 0)
2911               {
2912                 /* If this operand is at most 16 bits, convert
2913                    to a signed 16 bit number and don't use 64bit
2914                    displacement.  */
2915                 disp = (((disp & 0xffff) ^ 0x8000) - 0x8000);
2916                 i.types[op].bitfield.disp64 = 0;
2917               }
2918             if (i.types[op].bitfield.disp32
2919                 && (disp & ~(((offsetT) 2 << 31) - 1)) == 0)
2920               {
2921                 /* If this operand is at most 32 bits, convert
2922                    to a signed 32 bit number and don't use 64bit
2923                    displacement.  */
2924                 disp &= (((offsetT) 2 << 31) - 1);
2925                 disp = (disp ^ ((offsetT) 1 << 31)) - ((addressT) 1 << 31);
2926                 i.types[op].bitfield.disp64 = 0;
2927               }
2928             if (!disp && i.types[op].bitfield.baseindex)
2929               {
2930                 i.types[op].bitfield.disp8 = 0;
2931                 i.types[op].bitfield.disp16 = 0;
2932                 i.types[op].bitfield.disp32 = 0;
2933                 i.types[op].bitfield.disp32s = 0;
2934                 i.types[op].bitfield.disp64 = 0;
2935                 i.op[op].disps = 0;
2936                 i.disp_operands--;
2937               }
2938             else if (flag_code == CODE_64BIT)
2939               {
2940                 if (fits_in_signed_long (disp))
2941                   {
2942                     i.types[op].bitfield.disp64 = 0;
2943                     i.types[op].bitfield.disp32s = 1;
2944                   }
2945                 if (fits_in_unsigned_long (disp))
2946                   i.types[op].bitfield.disp32 = 1;
2947               }
2948             if ((i.types[op].bitfield.disp32
2949                  || i.types[op].bitfield.disp32s
2950                  || i.types[op].bitfield.disp16)
2951                 && fits_in_signed_byte (disp))
2952               i.types[op].bitfield.disp8 = 1;
2953           }
2954         else if (i.reloc[op] == BFD_RELOC_386_TLS_DESC_CALL
2955                  || i.reloc[op] == BFD_RELOC_X86_64_TLSDESC_CALL)
2956           {
2957             fix_new_exp (frag_now, frag_more (0) - frag_now->fr_literal, 0,
2958                          i.op[op].disps, 0, i.reloc[op]);
2959             i.types[op].bitfield.disp8 = 0;
2960             i.types[op].bitfield.disp16 = 0;
2961             i.types[op].bitfield.disp32 = 0;
2962             i.types[op].bitfield.disp32s = 0;
2963             i.types[op].bitfield.disp64 = 0;
2964           }
2965         else
2966           /* We only support 64bit displacement on constants.  */
2967           i.types[op].bitfield.disp64 = 0;
2968       }
2969 }
2970
2971 static int
2972 match_template (void)
2973 {
2974   /* Points to template once we've found it.  */
2975   const template *t;
2976   i386_operand_type overlap0, overlap1, overlap2, overlap3;
2977   unsigned int found_reverse_match;
2978   i386_opcode_modifier suffix_check;
2979   i386_operand_type operand_types [MAX_OPERANDS];
2980   int addr_prefix_disp;
2981   unsigned int j;
2982   i386_cpu_flags overlap;
2983
2984 #if MAX_OPERANDS != 4
2985 # error "MAX_OPERANDS must be 4."
2986 #endif
2987
2988   found_reverse_match = 0;
2989   addr_prefix_disp = -1;
2990
2991   memset (&suffix_check, 0, sizeof (suffix_check));
2992   if (i.suffix == BYTE_MNEM_SUFFIX)
2993     suffix_check.no_bsuf = 1;
2994   else if (i.suffix == WORD_MNEM_SUFFIX)
2995     suffix_check.no_wsuf = 1;
2996   else if (i.suffix == SHORT_MNEM_SUFFIX)
2997     suffix_check.no_ssuf = 1;
2998   else if (i.suffix == LONG_MNEM_SUFFIX)
2999     suffix_check.no_lsuf = 1;
3000   else if (i.suffix == QWORD_MNEM_SUFFIX)
3001     suffix_check.no_qsuf = 1;
3002   else if (i.suffix == LONG_DOUBLE_MNEM_SUFFIX)
3003     suffix_check.no_xsuf = 1;
3004
3005   for (t = current_templates->start; t < current_templates->end; t++)
3006     {
3007       addr_prefix_disp = -1;
3008
3009       /* Must have right number of operands.  */
3010       if (i.operands != t->operands)
3011         continue;
3012
3013       /* Check the suffix, except for some instructions in intel mode.  */
3014       if (((t->opcode_modifier.no_bsuf & suffix_check.no_bsuf)
3015            || (t->opcode_modifier.no_wsuf & suffix_check.no_wsuf)
3016            || (t->opcode_modifier.no_lsuf & suffix_check.no_lsuf)
3017            || (t->opcode_modifier.no_ssuf & suffix_check.no_ssuf)
3018            || (t->opcode_modifier.no_qsuf & suffix_check.no_qsuf)
3019            || (t->opcode_modifier.no_xsuf & suffix_check.no_xsuf))
3020           && !(intel_syntax && t->opcode_modifier.ignoresize))
3021         continue;
3022
3023       for (j = 0; j < MAX_OPERANDS; j++)
3024         operand_types [j] = t->operand_types [j];
3025
3026       /* In general, don't allow 64-bit operands in 32-bit mode.  */
3027       if (i.suffix == QWORD_MNEM_SUFFIX
3028           && flag_code != CODE_64BIT
3029           && (intel_syntax
3030               ? (!t->opcode_modifier.ignoresize
3031                  && !intel_float_operand (t->name))
3032               : intel_float_operand (t->name) != 2)
3033           && ((!operand_types[0].bitfield.regmmx
3034                && !operand_types[0].bitfield.regxmm)
3035               || (!operand_types[t->operands > 1].bitfield.regmmx
3036                   && !!operand_types[t->operands > 1].bitfield.regxmm))
3037           && (t->base_opcode != 0x0fc7
3038               || t->extension_opcode != 1 /* cmpxchg8b */))
3039         continue;
3040
3041       /* Do not verify operands when there are none.  */
3042       else 
3043         {
3044           overlap = cpu_flags_and (t->cpu_flags, cpu_arch_flags_not);
3045           if (!t->operands)
3046             {
3047               if (!UINTS_ALL_ZERO (overlap))
3048                 continue;
3049               /* We've found a match; break out of loop.  */
3050               break;
3051             }
3052         }
3053
3054       /* Address size prefix will turn Disp64/Disp32/Disp16 operand
3055          into Disp32/Disp16/Disp32 operand.  */
3056       if (i.prefix[ADDR_PREFIX] != 0)
3057           {
3058             /* There should be only one Disp operand.  */
3059             switch (flag_code)
3060             {
3061             case CODE_16BIT:
3062               for (j = 0; j < MAX_OPERANDS; j++)
3063                 {
3064                   if (operand_types[j].bitfield.disp16)
3065                     {
3066                       addr_prefix_disp = j;
3067                       operand_types[j].bitfield.disp32 = 1;
3068                       operand_types[j].bitfield.disp16 = 0;
3069                       break;
3070                     }
3071                 }
3072               break;
3073             case CODE_32BIT:
3074               for (j = 0; j < MAX_OPERANDS; j++)
3075                 {
3076                   if (operand_types[j].bitfield.disp32)
3077                     {
3078                       addr_prefix_disp = j;
3079                       operand_types[j].bitfield.disp32 = 0;
3080                       operand_types[j].bitfield.disp16 = 1;
3081                       break;
3082                     }
3083                 }
3084               break;
3085             case CODE_64BIT:
3086               for (j = 0; j < MAX_OPERANDS; j++)
3087                 {
3088                   if (operand_types[j].bitfield.disp64)
3089                     {
3090                       addr_prefix_disp = j;
3091                       operand_types[j].bitfield.disp64 = 0;
3092                       operand_types[j].bitfield.disp32 = 1;
3093                       break;
3094                     }
3095                 }
3096               break;
3097             }
3098           }
3099
3100       overlap0 = operand_type_and (i.types[0], operand_types[0]);
3101       switch (t->operands)
3102         {
3103         case 1:
3104           if (!operand_type_match (overlap0, i.types[0]))
3105             continue;
3106           break;
3107         case 2:
3108           /* xchg %eax, %eax is a special case. It is an aliase for nop
3109              only in 32bit mode and we can use opcode 0x90.  In 64bit
3110              mode, we can't use 0x90 for xchg %eax, %eax since it should
3111              zero-extend %eax to %rax.  */
3112           if (flag_code == CODE_64BIT
3113               && t->base_opcode == 0x90
3114               && UINTS_EQUAL (i.types [0], acc32)
3115               && UINTS_EQUAL (i.types [1], acc32))
3116             continue;
3117         case 3:
3118         case 4:
3119           overlap1 = operand_type_and (i.types[1], operand_types[1]);
3120           if (!operand_type_match (overlap0, i.types[0])
3121               || !operand_type_match (overlap1, i.types[1])
3122               /* monitor in SSE3 is a very special case.  The first
3123                  register and the second register may have different
3124                  sizes.  The same applies to crc32 in SSE4.2.  It is
3125                  also true for invlpga, vmload, vmrun and vmsave in
3126                  SVME.  */
3127               || !((t->base_opcode == 0x0f01
3128                     && (t->extension_opcode == 0xc8
3129                         || t->extension_opcode == 0xd8
3130                         || t->extension_opcode == 0xda
3131                         || t->extension_opcode == 0xdb
3132                         || t->extension_opcode == 0xdf))
3133                    || t->base_opcode == 0xf20f38f1
3134                    || operand_type_register_match (overlap0, i.types[0],
3135                                                    operand_types[0],
3136                                                    overlap1, i.types[1],
3137                                                    operand_types[1])))
3138             {
3139               /* Check if other direction is valid ...  */
3140               if (!t->opcode_modifier.d && !t->opcode_modifier.floatd)
3141                 continue;
3142
3143               /* Try reversing direction of operands.  */
3144               overlap0 = operand_type_and (i.types[0], operand_types[1]);
3145               overlap1 = operand_type_and (i.types[1], operand_types[0]);
3146               if (!operand_type_match (overlap0, i.types[0])
3147                   || !operand_type_match (overlap1, i.types[1])
3148                   || !operand_type_register_match (overlap0, i.types[0],
3149                                                    operand_types[1],
3150                                                    overlap1, i.types[1],
3151                                                    operand_types[0]))
3152                 {
3153                   /* Does not match either direction.  */
3154                   continue;
3155                 }
3156               /* found_reverse_match holds which of D or FloatDR
3157                  we've found.  */
3158               if (t->opcode_modifier.d)
3159                 found_reverse_match = Opcode_D;
3160               else if (t->opcode_modifier.floatd)
3161                 found_reverse_match = Opcode_FloatD;
3162               else
3163                 found_reverse_match = 0;
3164               if (t->opcode_modifier.floatr)
3165                 found_reverse_match |= Opcode_FloatR;
3166             }
3167           else
3168             {
3169               /* Found a forward 2 operand match here.  */
3170               switch (t->operands)
3171                 {
3172                 case 4:
3173                   overlap3 = operand_type_and (i.types[3],
3174                                                operand_types[3]);
3175                 case 3:
3176                   overlap2 = operand_type_and (i.types[2],
3177                                                operand_types[2]);
3178                   break;
3179                 }
3180
3181               switch (t->operands)
3182                 {
3183                 case 4:
3184                   if (!operand_type_match (overlap3, i.types[3])
3185                       || !operand_type_register_match (overlap2,
3186                                                        i.types[2],
3187                                                        operand_types[2],
3188                                                        overlap3,
3189                                                        i.types[3],
3190                                                        operand_types[3]))
3191                     continue;
3192                 case 3:
3193                   /* Here we make use of the fact that there are no
3194                      reverse match 3 operand instructions, and all 3
3195                      operand instructions only need to be checked for
3196                      register consistency between operands 2 and 3.  */
3197                   if (!operand_type_match (overlap2, i.types[2])
3198                       || !operand_type_register_match (overlap1,
3199                                                        i.types[1],
3200                                                        operand_types[1],
3201                                                        overlap2,
3202                                                        i.types[2],
3203                                                        operand_types[2]))
3204                     continue;
3205                   break;
3206                 }
3207             }
3208           /* Found either forward/reverse 2, 3 or 4 operand match here:
3209              slip through to break.  */
3210         }
3211       if (!UINTS_ALL_ZERO (overlap))
3212         {
3213           found_reverse_match = 0;
3214           continue;
3215         }
3216       /* We've found a match; break out of loop.  */
3217       break;
3218     }
3219
3220   if (t == current_templates->end)
3221     {
3222       /* We found no match.  */
3223       as_bad (_("suffix or operands invalid for `%s'"),
3224               current_templates->start->name);
3225       return 0;
3226     }
3227
3228   if (!quiet_warnings)
3229     {
3230       if (!intel_syntax
3231           && (i.types[0].bitfield.jumpabsolute
3232               != operand_types[0].bitfield.jumpabsolute))
3233         {
3234           as_warn (_("indirect %s without `*'"), t->name);
3235         }
3236
3237       if (t->opcode_modifier.isprefix
3238           && t->opcode_modifier.ignoresize)
3239         {
3240           /* Warn them that a data or address size prefix doesn't
3241              affect assembly of the next line of code.  */
3242           as_warn (_("stand-alone `%s' prefix"), t->name);
3243         }
3244     }
3245
3246   /* Copy the template we found.  */
3247   i.tm = *t;
3248
3249   if (addr_prefix_disp != -1)
3250     i.tm.operand_types[addr_prefix_disp]
3251       = operand_types[addr_prefix_disp];
3252
3253   if (found_reverse_match)
3254     {
3255       /* If we found a reverse match we must alter the opcode
3256          direction bit.  found_reverse_match holds bits to change
3257          (different for int & float insns).  */
3258
3259       i.tm.base_opcode ^= found_reverse_match;
3260
3261       i.tm.operand_types[0] = operand_types[1];
3262       i.tm.operand_types[1] = operand_types[0];
3263     }
3264
3265   return 1;
3266 }
3267
3268 static int
3269 check_string (void)
3270 {
3271   int mem_op = operand_type_check (i.types[0], anymem) ? 0 : 1;
3272   if (i.tm.operand_types[mem_op].bitfield.esseg)
3273     {
3274       if (i.seg[0] != NULL && i.seg[0] != &es)
3275         {
3276           as_bad (_("`%s' operand %d must use `%%es' segment"),
3277                   i.tm.name,
3278                   mem_op + 1);
3279           return 0;
3280         }
3281       /* There's only ever one segment override allowed per instruction.
3282          This instruction possibly has a legal segment override on the
3283          second operand, so copy the segment to where non-string
3284          instructions store it, allowing common code.  */
3285       i.seg[0] = i.seg[1];
3286     }
3287   else if (i.tm.operand_types[mem_op + 1].bitfield.esseg)
3288     {
3289       if (i.seg[1] != NULL && i.seg[1] != &es)
3290         {
3291           as_bad (_("`%s' operand %d must use `%%es' segment"),
3292                   i.tm.name,
3293                   mem_op + 2);
3294           return 0;
3295         }
3296     }
3297   return 1;
3298 }
3299
3300 static int
3301 process_suffix (void)
3302 {
3303   /* If matched instruction specifies an explicit instruction mnemonic
3304      suffix, use it.  */
3305   if (i.tm.opcode_modifier.size16)
3306     i.suffix = WORD_MNEM_SUFFIX;
3307   else if (i.tm.opcode_modifier.size32)
3308     i.suffix = LONG_MNEM_SUFFIX;
3309   else if (i.tm.opcode_modifier.size64)
3310     i.suffix = QWORD_MNEM_SUFFIX;
3311   else if (i.reg_operands)
3312     {
3313       /* If there's no instruction mnemonic suffix we try to invent one
3314          based on register operands.  */
3315       if (!i.suffix)
3316         {
3317           /* We take i.suffix from the last register operand specified,
3318              Destination register type is more significant than source
3319              register type.  crc32 in SSE4.2 prefers source register
3320              type. */
3321           if (i.tm.base_opcode == 0xf20f38f1)
3322             {
3323               if (i.types[0].bitfield.reg16)
3324                 i.suffix = WORD_MNEM_SUFFIX;
3325               else if (i.types[0].bitfield.reg32)
3326                 i.suffix = LONG_MNEM_SUFFIX;
3327               else if (i.types[0].bitfield.reg64)
3328                 i.suffix = QWORD_MNEM_SUFFIX;
3329             }
3330           else if (i.tm.base_opcode == 0xf20f38f0)
3331             {
3332               if (i.types[0].bitfield.reg8)
3333                 i.suffix = BYTE_MNEM_SUFFIX;
3334             }
3335
3336           if (!i.suffix)
3337             {
3338               int op;
3339
3340               if (i.tm.base_opcode == 0xf20f38f1
3341                   || i.tm.base_opcode == 0xf20f38f0)
3342                 {
3343                   /* We have to know the operand size for crc32.  */
3344                   as_bad (_("ambiguous memory operand size for `%s`"),
3345                           i.tm.name);
3346                   return 0;
3347                 }
3348
3349               for (op = i.operands; --op >= 0;)
3350                 if (!i.tm.operand_types[op].bitfield.inoutportreg)
3351                   {
3352                     if (i.types[op].bitfield.reg8)
3353                       {
3354                         i.suffix = BYTE_MNEM_SUFFIX;
3355                         break;
3356                       }
3357                     else if (i.types[op].bitfield.reg16)
3358                       {
3359                         i.suffix = WORD_MNEM_SUFFIX;
3360                         break;
3361                       }
3362                     else if (i.types[op].bitfield.reg32)
3363                       {
3364                         i.suffix = LONG_MNEM_SUFFIX;
3365                         break;
3366                       }
3367                     else if (i.types[op].bitfield.reg64)
3368                       {
3369                         i.suffix = QWORD_MNEM_SUFFIX;
3370                         break;
3371                       }
3372                   }
3373             }
3374         }
3375       else if (i.suffix == BYTE_MNEM_SUFFIX)
3376         {
3377           if (!check_byte_reg ())
3378             return 0;
3379         }
3380       else if (i.suffix == LONG_MNEM_SUFFIX)
3381         {
3382           if (!check_long_reg ())
3383             return 0;
3384         }
3385       else if (i.suffix == QWORD_MNEM_SUFFIX)
3386         {
3387           if (intel_syntax
3388               && i.tm.opcode_modifier.ignoresize
3389               && i.tm.opcode_modifier.no_qsuf)
3390             i.suffix = 0;
3391           else if (!check_qword_reg ())
3392             return 0;
3393         }
3394       else if (i.suffix == WORD_MNEM_SUFFIX)
3395         {
3396           if (!check_word_reg ())
3397             return 0;
3398         }
3399       else if (intel_syntax && i.tm.opcode_modifier.ignoresize)
3400         /* Do nothing if the instruction is going to ignore the prefix.  */
3401         ;
3402       else
3403         abort ();
3404     }
3405   else if (i.tm.opcode_modifier.defaultsize
3406            && !i.suffix
3407            /* exclude fldenv/frstor/fsave/fstenv */
3408            && i.tm.opcode_modifier.no_ssuf)
3409     {
3410       i.suffix = stackop_size;
3411     }
3412   else if (intel_syntax
3413            && !i.suffix
3414            && (i.tm.operand_types[0].bitfield.jumpabsolute
3415                || i.tm.opcode_modifier.jumpbyte
3416                || i.tm.opcode_modifier.jumpintersegment
3417                || (i.tm.base_opcode == 0x0f01 /* [ls][gi]dt */
3418                    && i.tm.extension_opcode <= 3)))
3419     {
3420       switch (flag_code)
3421         {
3422         case CODE_64BIT:
3423           if (!i.tm.opcode_modifier.no_qsuf)
3424             {
3425               i.suffix = QWORD_MNEM_SUFFIX;
3426               break;
3427             }
3428         case CODE_32BIT:
3429           if (!i.tm.opcode_modifier.no_lsuf)
3430             i.suffix = LONG_MNEM_SUFFIX;
3431           break;
3432         case CODE_16BIT:
3433           if (!i.tm.opcode_modifier.no_wsuf)
3434             i.suffix = WORD_MNEM_SUFFIX;
3435           break;
3436         }
3437     }
3438
3439   if (!i.suffix)
3440     {
3441       if (!intel_syntax)
3442         {
3443           if (i.tm.opcode_modifier.w)
3444             {
3445               as_bad (_("no instruction mnemonic suffix given and "
3446                         "no register operands; can't size instruction"));
3447               return 0;
3448             }
3449         }
3450       else
3451         {
3452           unsigned int suffixes;
3453           
3454           suffixes = !i.tm.opcode_modifier.no_bsuf;
3455           if (!i.tm.opcode_modifier.no_wsuf)
3456             suffixes |= 1 << 1;
3457           if (!i.tm.opcode_modifier.no_lsuf)
3458             suffixes |= 1 << 2;
3459           if (!i.tm.opcode_modifier.no_lsuf)
3460             suffixes |= 1 << 3;
3461           if (!i.tm.opcode_modifier.no_ssuf)
3462             suffixes |= 1 << 4;
3463           if (!i.tm.opcode_modifier.no_qsuf)
3464             suffixes |= 1 << 5;
3465
3466           /* There are more than suffix matches.  */
3467           if (i.tm.opcode_modifier.w
3468               || ((suffixes & (suffixes - 1))
3469                   && !i.tm.opcode_modifier.defaultsize
3470                   && !i.tm.opcode_modifier.ignoresize))
3471             {
3472               as_bad (_("ambiguous operand size for `%s'"), i.tm.name);
3473               return 0;
3474             }
3475         }
3476     }
3477
3478   /* Change the opcode based on the operand size given by i.suffix;
3479      We don't need to change things for byte insns.  */
3480
3481   if (i.suffix && i.suffix != BYTE_MNEM_SUFFIX)
3482     {
3483       /* It's not a byte, select word/dword operation.  */
3484       if (i.tm.opcode_modifier.w)
3485         {
3486           if (i.tm.opcode_modifier.shortform)
3487             i.tm.base_opcode |= 8;
3488           else
3489             i.tm.base_opcode |= 1;
3490         }
3491
3492       /* Now select between word & dword operations via the operand
3493          size prefix, except for instructions that will ignore this
3494          prefix anyway.  */
3495       if (i.tm.base_opcode == 0x0f01
3496            && (i.tm.extension_opcode == 0xc8
3497                || i.tm.extension_opcode == 0xd8
3498                || i.tm.extension_opcode == 0xda
3499                || i.tm.extension_opcode == 0xdb
3500                || i.tm.extension_opcode == 0xdf))
3501         {
3502           /* monitor in SSE3 is a very special case. The default size
3503              of AX is the size of mode. The address size override
3504              prefix will change the size of AX.  It is also true for
3505              invlpga, vmload, vmrun and vmsave in SVME.  */
3506           if ((flag_code == CODE_32BIT
3507                && i.op->regs[0].reg_type.bitfield.reg16)
3508               || (flag_code != CODE_32BIT
3509                   && i.op->regs[0].reg_type.bitfield.reg32))
3510             if (!add_prefix (ADDR_PREFIX_OPCODE))
3511               return 0;
3512         }
3513       else if (i.suffix != QWORD_MNEM_SUFFIX
3514                && i.suffix != LONG_DOUBLE_MNEM_SUFFIX
3515                && !i.tm.opcode_modifier.ignoresize
3516                && !i.tm.opcode_modifier.floatmf
3517                && ((i.suffix == LONG_MNEM_SUFFIX) == (flag_code == CODE_16BIT)
3518                    || (flag_code == CODE_64BIT
3519                        && i.tm.opcode_modifier.jumpbyte)))
3520         {
3521           unsigned int prefix = DATA_PREFIX_OPCODE;
3522
3523           if (i.tm.opcode_modifier.jumpbyte) /* jcxz, loop */
3524             prefix = ADDR_PREFIX_OPCODE;
3525
3526           if (!add_prefix (prefix))
3527             return 0;
3528         }
3529
3530       /* Set mode64 for an operand.  */
3531       if (i.suffix == QWORD_MNEM_SUFFIX
3532           && flag_code == CODE_64BIT
3533           && !i.tm.opcode_modifier.norex64)
3534         {
3535           /* Special case for xchg %rax,%rax.  It is NOP and doesn't
3536              need rex64.  cmpxchg8b is also a special case. */
3537           if (! (i.operands == 2
3538                  && i.tm.base_opcode == 0x90
3539                  && i.tm.extension_opcode == None
3540                  && UINTS_EQUAL (i.types [0], acc64)
3541                  && UINTS_EQUAL (i.types [1], acc64))
3542               && ! (i.operands == 1
3543                     && i.tm.base_opcode == 0xfc7
3544                     && i.tm.extension_opcode == 1
3545                     && !operand_type_check (i.types [0], reg)
3546                     && operand_type_check (i.types [0], anymem)))
3547             i.rex |= REX_W;
3548         }
3549
3550       /* Size floating point instruction.  */
3551       if (i.suffix == LONG_MNEM_SUFFIX)
3552         if (i.tm.opcode_modifier.floatmf)
3553           i.tm.base_opcode ^= 4;
3554     }
3555
3556   return 1;
3557 }
3558
3559 static int
3560 check_byte_reg (void)
3561 {
3562   int op;
3563
3564   for (op = i.operands; --op >= 0;)
3565     {
3566       /* If this is an eight bit register, it's OK.  If it's the 16 or
3567          32 bit version of an eight bit register, we will just use the
3568          low portion, and that's OK too.  */
3569       if (i.types[op].bitfield.reg8)
3570         continue;
3571
3572       /* movzx, movsx, pextrb and pinsrb should not generate this
3573          warning.  */
3574       if (intel_syntax
3575           && (i.tm.base_opcode == 0xfb7
3576               || i.tm.base_opcode == 0xfb6
3577               || i.tm.base_opcode == 0x63
3578               || i.tm.base_opcode == 0xfbe
3579               || i.tm.base_opcode == 0xfbf
3580               || i.tm.base_opcode == 0x660f3a14
3581               || i.tm.base_opcode == 0x660f3a20))
3582         continue;
3583
3584       /* crc32 doesn't generate this warning.  */
3585       if (i.tm.base_opcode == 0xf20f38f0)
3586         continue;
3587
3588       if ((i.types[op].bitfield.reg16
3589            || i.types[op].bitfield.reg32
3590            || i.types[op].bitfield.reg64)
3591           && i.op[op].regs->reg_num < 4)
3592         {
3593           /* Prohibit these changes in the 64bit mode, since the
3594              lowering is more complicated.  */
3595           if (flag_code == CODE_64BIT
3596               && !i.tm.operand_types[op].bitfield.inoutportreg)
3597             {
3598               as_bad (_("Incorrect register `%s%s' used with `%c' suffix"),
3599                       register_prefix, i.op[op].regs->reg_name,
3600                       i.suffix);
3601               return 0;
3602             }
3603 #if REGISTER_WARNINGS
3604           if (!quiet_warnings
3605               && !i.tm.operand_types[op].bitfield.inoutportreg)
3606             as_warn (_("using `%s%s' instead of `%s%s' due to `%c' suffix"),
3607                      register_prefix,
3608                      (i.op[op].regs + (i.types[op].bitfield.reg16
3609                                        ? REGNAM_AL - REGNAM_AX
3610                                        : REGNAM_AL - REGNAM_EAX))->reg_name,
3611                      register_prefix,
3612                      i.op[op].regs->reg_name,
3613                      i.suffix);
3614 #endif
3615           continue;
3616         }
3617       /* Any other register is bad.  */
3618       if (i.types[op].bitfield.reg16
3619           || i.types[op].bitfield.reg32
3620           || i.types[op].bitfield.reg64
3621           || i.types[op].bitfield.regmmx
3622           || i.types[op].bitfield.regxmm
3623           || i.types[op].bitfield.sreg2
3624           || i.types[op].bitfield.sreg3
3625           || i.types[op].bitfield.control
3626           || i.types[op].bitfield.debug
3627           || i.types[op].bitfield.test
3628           || i.types[op].bitfield.floatreg
3629           || i.types[op].bitfield.floatacc)
3630         {
3631           as_bad (_("`%s%s' not allowed with `%s%c'"),
3632                   register_prefix,
3633                   i.op[op].regs->reg_name,
3634                   i.tm.name,
3635                   i.suffix);
3636           return 0;
3637         }
3638     }
3639   return 1;
3640 }
3641
3642 static int
3643 check_long_reg (void)
3644 {
3645   int op;
3646
3647   for (op = i.operands; --op >= 0;)
3648     /* Reject eight bit registers, except where the template requires
3649        them. (eg. movzb)  */
3650     if (i.types[op].bitfield.reg8
3651         && (i.tm.operand_types[op].bitfield.reg16
3652             || i.tm.operand_types[op].bitfield.reg32
3653             || i.tm.operand_types[op].bitfield.acc))
3654       {
3655         as_bad (_("`%s%s' not allowed with `%s%c'"),
3656                 register_prefix,
3657                 i.op[op].regs->reg_name,
3658                 i.tm.name,
3659                 i.suffix);
3660         return 0;
3661       }
3662   /* Warn if the e prefix on a general reg is missing.  */
3663     else if ((!quiet_warnings || flag_code == CODE_64BIT)
3664              && i.types[op].bitfield.reg16
3665              && (i.tm.operand_types[op].bitfield.reg32
3666                  || i.tm.operand_types[op].bitfield.acc))
3667       {
3668         /* Prohibit these changes in the 64bit mode, since the
3669            lowering is more complicated.  */
3670         if (flag_code == CODE_64BIT)
3671           {
3672             as_bad (_("Incorrect register `%s%s' used with `%c' suffix"),
3673                     register_prefix, i.op[op].regs->reg_name,
3674                     i.suffix);
3675             return 0;
3676           }
3677 #if REGISTER_WARNINGS
3678         else
3679           as_warn (_("using `%s%s' instead of `%s%s' due to `%c' suffix"),
3680                    register_prefix,
3681                    (i.op[op].regs + REGNAM_EAX - REGNAM_AX)->reg_name,
3682                    register_prefix,
3683                    i.op[op].regs->reg_name,
3684                    i.suffix);
3685 #endif
3686       }
3687   /* Warn if the r prefix on a general reg is missing.  */
3688     else if (i.types[op].bitfield.reg64
3689              && (i.tm.operand_types[op].bitfield.reg32
3690                  || i.tm.operand_types[op].bitfield.acc))
3691       {
3692         if (intel_syntax
3693             && (i.tm.base_opcode == 0xf30f2d
3694                 || i.tm.base_opcode == 0xf30f2c)
3695             && !i.types[0].bitfield.regxmm)
3696           {
3697             /* cvtss2si/cvttss2si convert DWORD memory to Reg64.  We
3698                want REX byte. */
3699             i.suffix = QWORD_MNEM_SUFFIX;
3700           }
3701         else
3702           {
3703             as_bad (_("Incorrect register `%s%s' used with `%c' suffix"),
3704                     register_prefix, i.op[op].regs->reg_name,
3705                     i.suffix);
3706             return 0;
3707           }
3708       }
3709   return 1;
3710 }
3711
3712 static int
3713 check_qword_reg (void)
3714 {
3715   int op;
3716
3717   for (op = i.operands; --op >= 0; )
3718     /* Reject eight bit registers, except where the template requires
3719        them. (eg. movzb)  */
3720     if (i.types[op].bitfield.reg8
3721         && (i.tm.operand_types[op].bitfield.reg16
3722             || i.tm.operand_types[op].bitfield.reg32
3723             || i.tm.operand_types[op].bitfield.acc))
3724       {
3725         as_bad (_("`%s%s' not allowed with `%s%c'"),
3726                 register_prefix,
3727                 i.op[op].regs->reg_name,
3728                 i.tm.name,
3729                 i.suffix);
3730         return 0;
3731       }
3732   /* Warn if the e prefix on a general reg is missing.  */
3733     else if ((i.types[op].bitfield.reg16
3734               || i.types[op].bitfield.reg32)
3735              && (i.tm.operand_types[op].bitfield.reg32
3736                  || i.tm.operand_types[op].bitfield.acc))
3737       {
3738         /* Prohibit these changes in the 64bit mode, since the
3739            lowering is more complicated.  */
3740         if (intel_syntax
3741             && (i.tm.base_opcode == 0xf20f2d
3742                 || i.tm.base_opcode == 0xf20f2c)
3743             && !i.types[0].bitfield.regxmm)
3744           {
3745             /* cvtsd2si/cvttsd2si convert QWORD memory to Reg32.  We
3746                don't want REX byte. */
3747             i.suffix = LONG_MNEM_SUFFIX;
3748           }
3749         else
3750           {
3751             as_bad (_("Incorrect register `%s%s' used with `%c' suffix"),
3752                     register_prefix, i.op[op].regs->reg_name,
3753                     i.suffix);
3754             return 0;
3755           }
3756       }
3757   return 1;
3758 }
3759
3760 static int
3761 check_word_reg (void)
3762 {
3763   int op;
3764   for (op = i.operands; --op >= 0;)
3765     /* Reject eight bit registers, except where the template requires
3766        them. (eg. movzb)  */
3767     if (i.types[op].bitfield.reg8
3768         && (i.tm.operand_types[op].bitfield.reg16
3769             || i.tm.operand_types[op].bitfield.reg32
3770             || i.tm.operand_types[op].bitfield.acc))
3771       {
3772         as_bad (_("`%s%s' not allowed with `%s%c'"),
3773                 register_prefix,
3774                 i.op[op].regs->reg_name,
3775                 i.tm.name,
3776                 i.suffix);
3777         return 0;
3778       }
3779   /* Warn if the e prefix on a general reg is present.  */
3780     else if ((!quiet_warnings || flag_code == CODE_64BIT)
3781              && i.types[op].bitfield.reg32
3782              && (i.tm.operand_types[op].bitfield.reg16
3783                  || i.tm.operand_types[op].bitfield.acc))
3784       {
3785         /* Prohibit these changes in the 64bit mode, since the
3786            lowering is more complicated.  */
3787         if (flag_code == CODE_64BIT)
3788           {
3789             as_bad (_("Incorrect register `%s%s' used with `%c' suffix"),
3790                     register_prefix, i.op[op].regs->reg_name,
3791                     i.suffix);
3792             return 0;
3793           }
3794         else
3795 #if REGISTER_WARNINGS
3796           as_warn (_("using `%s%s' instead of `%s%s' due to `%c' suffix"),
3797                    register_prefix,
3798                    (i.op[op].regs + REGNAM_AX - REGNAM_EAX)->reg_name,
3799                    register_prefix,
3800                    i.op[op].regs->reg_name,
3801                    i.suffix);
3802 #endif
3803       }
3804   return 1;
3805 }
3806
3807 static int
3808 update_imm (unsigned int j)
3809 {
3810   i386_operand_type overlap;
3811
3812   overlap = operand_type_and (i.types[j], i.tm.operand_types[j]);
3813   if ((overlap.bitfield.imm8
3814        || overlap.bitfield.imm8s
3815        || overlap.bitfield.imm16
3816        || overlap.bitfield.imm32
3817        || overlap.bitfield.imm32s
3818        || overlap.bitfield.imm64)
3819       && !UINTS_EQUAL (overlap, imm8)
3820       && !UINTS_EQUAL (overlap, imm8s)
3821       && !UINTS_EQUAL (overlap, imm16)
3822       && !UINTS_EQUAL (overlap, imm32)
3823       && !UINTS_EQUAL (overlap, imm32s)
3824       && !UINTS_EQUAL (overlap, imm64))
3825     {
3826       if (i.suffix)
3827         {
3828           i386_operand_type temp;
3829
3830           UINTS_CLEAR (temp);
3831           if (i.suffix == BYTE_MNEM_SUFFIX) 
3832             {
3833               temp.bitfield.imm8 = overlap.bitfield.imm8;
3834               temp.bitfield.imm8s = overlap.bitfield.imm8s;
3835             }
3836           else if (i.suffix == WORD_MNEM_SUFFIX)
3837             temp.bitfield.imm16 = overlap.bitfield.imm16;
3838           else if (i.suffix == QWORD_MNEM_SUFFIX)
3839             {
3840               temp.bitfield.imm64 = overlap.bitfield.imm64;
3841               temp.bitfield.imm32s = overlap.bitfield.imm32s;
3842             }
3843           else
3844             temp.bitfield.imm32 = overlap.bitfield.imm32;
3845           overlap = temp;
3846         }
3847       else if (UINTS_EQUAL (overlap, imm16_32_32s)
3848                || UINTS_EQUAL (overlap, imm16_32)
3849                || UINTS_EQUAL (overlap, imm16_32s))
3850         {
3851           UINTS_CLEAR (overlap);
3852           if ((flag_code == CODE_16BIT) ^ (i.prefix[DATA_PREFIX] != 0))
3853             overlap.bitfield.imm16 = 1;
3854           else
3855             overlap.bitfield.imm32s = 1;
3856         }
3857       if (!UINTS_EQUAL (overlap, imm8)
3858           && !UINTS_EQUAL (overlap, imm8s)
3859           && !UINTS_EQUAL (overlap, imm16)
3860           && !UINTS_EQUAL (overlap, imm32)
3861           && !UINTS_EQUAL (overlap, imm32s)
3862           && !UINTS_EQUAL (overlap, imm64))
3863         {
3864           as_bad (_("no instruction mnemonic suffix given; "
3865                     "can't determine immediate size"));
3866           return 0;
3867         }
3868     }
3869   i.types[j] = overlap;
3870
3871   return 1;
3872 }
3873
3874 static int
3875 finalize_imm (void)
3876 {
3877   unsigned int j;
3878
3879   for (j = 0; j < 2; j++)
3880     if (update_imm (j) == 0)
3881       return 0;
3882
3883   i.types[2] = operand_type_and (i.types[2], i.tm.operand_types[2]);
3884   assert (operand_type_check (i.types[2], imm) == 0);
3885
3886   return 1;
3887 }
3888
3889 static void
3890 process_drex (void)
3891 {
3892   i.drex.modrm_reg = None;
3893   i.drex.modrm_regmem = None;
3894
3895   /* SSE5 4 operand instructions must have the destination the same as 
3896      one of the inputs.  Figure out the destination register and cache
3897      it away in the drex field, and remember which fields to use for 
3898      the modrm byte.  */
3899   if (i.tm.opcode_modifier.drex 
3900       && i.tm.opcode_modifier.drexv 
3901       && i.operands == 4)
3902     {
3903       i.tm.extension_opcode = None;
3904
3905       /* Case 1: 4 operand insn, dest = src1, src3 = register.  */
3906       if (i.types[0].bitfield.regxmm != 0
3907           && i.types[1].bitfield.regxmm != 0
3908           && i.types[2].bitfield.regxmm != 0
3909           && i.types[3].bitfield.regxmm != 0
3910           && i.op[0].regs->reg_num == i.op[3].regs->reg_num
3911           && i.op[0].regs->reg_flags == i.op[3].regs->reg_flags)
3912         {
3913           /* Clear the arguments that are stored in drex.  */
3914           UINTS_CLEAR (i.types[0]); 
3915           UINTS_CLEAR (i.types[3]);
3916           i.reg_operands -= 2;
3917
3918           /* There are two different ways to encode a 4 operand 
3919              instruction with all registers that uses OC1 set to 
3920              0 or 1.  Favor setting OC1 to 0 since this mimics the 
3921              actions of other SSE5 assemblers.  Use modrm encoding 2 
3922              for register/register.  Include the high order bit that 
3923              is normally stored in the REX byte in the register
3924              field.  */
3925           i.tm.extension_opcode = DREX_X1_XMEM_X2_X1;
3926           i.drex.modrm_reg = 2;
3927           i.drex.modrm_regmem = 1;
3928           i.drex.reg = (i.op[3].regs->reg_num
3929                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
3930         }
3931
3932       /* Case 2: 4 operand insn, dest = src1, src3 = memory.  */
3933       else if (i.types[0].bitfield.regxmm != 0
3934                && i.types[1].bitfield.regxmm != 0
3935                && (i.types[2].bitfield.regxmm 
3936                    || operand_type_check (i.types[2], anymem))
3937                && i.types[3].bitfield.regxmm != 0
3938                && i.op[0].regs->reg_num == i.op[3].regs->reg_num
3939                && i.op[0].regs->reg_flags == i.op[3].regs->reg_flags)
3940         {
3941           /* clear the arguments that are stored in drex */
3942           UINTS_CLEAR (i.types[0]);
3943           UINTS_CLEAR (i.types[3]);
3944           i.reg_operands -= 2;
3945
3946           /* Specify the modrm encoding for memory addressing.  Include 
3947              the high order bit that is normally stored in the REX byte
3948              in the register field.  */
3949           i.tm.extension_opcode = DREX_X1_X2_XMEM_X1;
3950           i.drex.modrm_reg = 1;
3951           i.drex.modrm_regmem = 2;
3952           i.drex.reg = (i.op[3].regs->reg_num
3953                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
3954         }
3955
3956       /* Case 3: 4 operand insn, dest = src1, src2 = memory.  */
3957       else if (i.types[0].bitfield.regxmm != 0
3958                && operand_type_check (i.types[1], anymem) != 0
3959                && i.types[2].bitfield.regxmm != 0
3960                && i.types[3].bitfield.regxmm != 0
3961                && i.op[0].regs->reg_num == i.op[3].regs->reg_num
3962                && i.op[0].regs->reg_flags == i.op[3].regs->reg_flags)
3963         {
3964           /* Clear the arguments that are stored in drex.  */
3965           UINTS_CLEAR (i.types[0]);
3966           UINTS_CLEAR (i.types[3]);
3967           i.reg_operands -= 2;
3968
3969           /* Specify the modrm encoding for memory addressing.  Include
3970              the high order bit that is normally stored in the REX byte 
3971              in the register field.  */
3972           i.tm.extension_opcode = DREX_X1_XMEM_X2_X1;
3973           i.drex.modrm_reg = 2;
3974           i.drex.modrm_regmem = 1;
3975           i.drex.reg = (i.op[3].regs->reg_num
3976                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
3977         }
3978
3979       /* Case 4: 4 operand insn, dest = src3, src2 = register. */
3980       else if (i.types[0].bitfield.regxmm != 0
3981                && i.types[1].bitfield.regxmm != 0
3982                && i.types[2].bitfield.regxmm != 0
3983                && i.types[3].bitfield.regxmm != 0
3984                && i.op[2].regs->reg_num == i.op[3].regs->reg_num
3985                && i.op[2].regs->reg_flags == i.op[3].regs->reg_flags)
3986         {
3987           /* clear the arguments that are stored in drex */
3988           UINTS_CLEAR (i.types[2]);
3989           UINTS_CLEAR (i.types[3]);
3990           i.reg_operands -= 2;
3991
3992           /* There are two different ways to encode a 4 operand 
3993              instruction with all registers that uses OC1 set to 
3994              0 or 1.  Favor setting OC1 to 0 since this mimics the 
3995              actions of other SSE5 assemblers.  Use modrm encoding 
3996              2 for register/register.  Include the high order bit that 
3997              is normally stored in the REX byte in the register 
3998              field.  */
3999           i.tm.extension_opcode = DREX_XMEM_X1_X2_X2;
4000           i.drex.modrm_reg = 1;
4001           i.drex.modrm_regmem = 0;
4002
4003           /* Remember the register, including the upper bits */
4004           i.drex.reg = (i.op[3].regs->reg_num
4005                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
4006         }
4007
4008       /* Case 5: 4 operand insn, dest = src3, src2 = memory.  */
4009       else if (i.types[0].bitfield.regxmm != 0
4010                && (i.types[1].bitfield.regxmm 
4011                    || operand_type_check (i.types[1], anymem)) 
4012                && i.types[2].bitfield.regxmm != 0
4013                && i.types[3].bitfield.regxmm != 0
4014                && i.op[2].regs->reg_num == i.op[3].regs->reg_num
4015                && i.op[2].regs->reg_flags == i.op[3].regs->reg_flags)
4016         {
4017           /* Clear the arguments that are stored in drex.  */
4018           UINTS_CLEAR (i.types[2]);
4019           UINTS_CLEAR (i.types[3]);
4020           i.reg_operands -= 2;
4021
4022           /* Specify the modrm encoding and remember the register 
4023              including the bits normally stored in the REX byte. */
4024           i.tm.extension_opcode = DREX_X1_XMEM_X2_X2;
4025           i.drex.modrm_reg = 0;
4026           i.drex.modrm_regmem = 1;
4027           i.drex.reg = (i.op[3].regs->reg_num
4028                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
4029         }
4030
4031       /* Case 6: 4 operand insn, dest = src3, src1 = memory.  */
4032       else if (operand_type_check (i.types[0], anymem) != 0
4033                && i.types[1].bitfield.regxmm != 0
4034                && i.types[2].bitfield.regxmm != 0
4035                && i.types[3].bitfield.regxmm != 0
4036                && i.op[2].regs->reg_num == i.op[3].regs->reg_num
4037                && i.op[2].regs->reg_flags == i.op[3].regs->reg_flags)
4038         {
4039           /* clear the arguments that are stored in drex */
4040           UINTS_CLEAR (i.types[2]);
4041           UINTS_CLEAR (i.types[3]);
4042           i.reg_operands -= 2;
4043
4044           /* Specify the modrm encoding and remember the register 
4045              including the bits normally stored in the REX byte. */
4046           i.tm.extension_opcode = DREX_XMEM_X1_X2_X2;
4047           i.drex.modrm_reg = 1;
4048           i.drex.modrm_regmem = 0;
4049           i.drex.reg = (i.op[3].regs->reg_num
4050                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
4051         }
4052
4053       else
4054         as_bad (_("Incorrect operands for the '%s' instruction"), 
4055                 i.tm.name);
4056     }
4057
4058   /* SSE5 instructions with the DREX byte where the only memory operand 
4059      is in the 2nd argument, and the first and last xmm register must 
4060      match, and is encoded in the DREX byte. */
4061   else if (i.tm.opcode_modifier.drex 
4062            && !i.tm.opcode_modifier.drexv 
4063            && i.operands == 4)
4064     {
4065       /* Case 1: 4 operand insn, dest = src1, src3 = reg/mem.  */
4066       if (i.types[0].bitfield.regxmm != 0
4067           && (i.types[1].bitfield.regxmm 
4068               || operand_type_check(i.types[1], anymem)) 
4069           && i.types[2].bitfield.regxmm != 0
4070           && i.types[3].bitfield.regxmm != 0
4071           && i.op[0].regs->reg_num == i.op[3].regs->reg_num
4072           && i.op[0].regs->reg_flags == i.op[3].regs->reg_flags)
4073         {
4074           /* clear the arguments that are stored in drex */
4075           UINTS_CLEAR (i.types[0]);
4076           UINTS_CLEAR (i.types[3]);
4077           i.reg_operands -= 2;
4078
4079           /* Specify the modrm encoding and remember the register 
4080              including the high bit normally stored in the REX 
4081              byte.  */
4082           i.drex.modrm_reg = 2;
4083           i.drex.modrm_regmem = 1;
4084           i.drex.reg = (i.op[3].regs->reg_num
4085                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
4086         }
4087
4088       else
4089         as_bad (_("Incorrect operands for the '%s' instruction"), 
4090                 i.tm.name);
4091     }
4092
4093   /* SSE5 3 operand instructions that the result is a register, being 
4094      either operand can be a memory operand, using OC0 to note which 
4095      one is the memory.  */
4096   else if (i.tm.opcode_modifier.drex 
4097            && i.tm.opcode_modifier.drexv
4098            && i.operands == 3)
4099     {
4100       i.tm.extension_opcode = None;
4101
4102       /* Case 1: 3 operand insn, src1 = register.  */
4103       if (i.types[0].bitfield.regxmm != 0
4104           && i.types[1].bitfield.regxmm != 0
4105           && i.types[2].bitfield.regxmm != 0)
4106         {
4107           /* Clear the arguments that are stored in drex.  */
4108           UINTS_CLEAR (i.types[2]);
4109           i.reg_operands--;
4110
4111           /* Specify the modrm encoding and remember the register 
4112              including the high bit normally stored in the REX byte.  */
4113           i.tm.extension_opcode = DREX_XMEM_X1_X2;
4114           i.drex.modrm_reg = 1;
4115           i.drex.modrm_regmem = 0;
4116           i.drex.reg = (i.op[2].regs->reg_num
4117                         + ((i.op[2].regs->reg_flags & RegRex) ? 8 : 0));
4118         }
4119
4120       /* Case 2: 3 operand insn, src1 = memory.  */
4121       else if (operand_type_check (i.types[0], anymem) != 0
4122                && i.types[1].bitfield.regxmm != 0
4123                && i.types[2].bitfield.regxmm != 0)
4124         {
4125           /* Clear the arguments that are stored in drex.  */
4126           UINTS_CLEAR (i.types[2]);
4127           i.reg_operands--;
4128
4129           /* Specify the modrm encoding and remember the register 
4130              including the high bit normally stored in the REX 
4131              byte.  */
4132           i.tm.extension_opcode = DREX_XMEM_X1_X2;
4133           i.drex.modrm_reg = 1;
4134           i.drex.modrm_regmem = 0;
4135           i.drex.reg = (i.op[2].regs->reg_num
4136                         + ((i.op[2].regs->reg_flags & RegRex) ? 8 : 0));
4137         }
4138
4139       /* Case 3: 3 operand insn, src2 = memory.  */
4140       else if (i.types[0].bitfield.regxmm != 0
4141                && operand_type_check (i.types[1], anymem) != 0
4142                && i.types[2].bitfield.regxmm != 0)
4143         {
4144           /* Clear the arguments that are stored in drex.  */
4145           UINTS_CLEAR (i.types[2]);
4146           i.reg_operands--;
4147
4148           /* Specify the modrm encoding and remember the register 
4149              including the high bit normally stored in the REX byte.  */
4150           i.tm.extension_opcode = DREX_X1_XMEM_X2;
4151           i.drex.modrm_reg = 0;
4152           i.drex.modrm_regmem = 1;
4153           i.drex.reg = (i.op[2].regs->reg_num
4154                         + ((i.op[2].regs->reg_flags & RegRex) ? 8 : 0));
4155         }
4156
4157       else
4158         as_bad (_("Incorrect operands for the '%s' instruction"), 
4159                 i.tm.name);
4160     }
4161
4162   /* SSE5 4 operand instructions that are the comparison instructions 
4163      where the first operand is the immediate value of the comparison 
4164      to be done.  */
4165   else if (i.tm.opcode_modifier.drexc != 0 && i.operands == 4)
4166     {
4167       /* Case 1: 4 operand insn, src1 = reg/memory. */
4168       if (operand_type_check (i.types[0], imm) != 0
4169           && (i.types[1].bitfield.regxmm 
4170               || operand_type_check (i.types[1], anymem)) 
4171           && i.types[2].bitfield.regxmm != 0
4172           && i.types[3].bitfield.regxmm != 0)
4173         {
4174           /* clear the arguments that are stored in drex */
4175           UINTS_CLEAR (i.types[3]);
4176           i.reg_operands--;
4177
4178           /* Specify the modrm encoding and remember the register 
4179              including the high bit normally stored in the REX byte.  */
4180           i.drex.modrm_reg = 2;
4181           i.drex.modrm_regmem = 1;
4182           i.drex.reg = (i.op[3].regs->reg_num
4183                         + ((i.op[3].regs->reg_flags & RegRex) ? 8 : 0));
4184         }
4185
4186       /* Case 2: 3 operand insn with ImmExt that places the 
4187          opcode_extension as an immediate argument.  This is used for 
4188          all of the varients of comparison that supplies the appropriate
4189          value as part of the instruction.  */
4190       else if ((i.types[0].bitfield.regxmm
4191                 || operand_type_check (i.types[0], anymem)) 
4192                && i.types[1].bitfield.regxmm != 0
4193                && i.types[2].bitfield.regxmm != 0
4194                && operand_type_check (i.types[3], imm) != 0)
4195         {
4196           /* clear the arguments that are stored in drex */
4197           UINTS_CLEAR (i.types[2]);
4198           i.reg_operands--;
4199
4200           /* Specify the modrm encoding and remember the register 
4201              including the high bit normally stored in the REX byte.  */
4202           i.drex.modrm_reg = 1;
4203           i.drex.modrm_regmem = 0;
4204           i.drex.reg = (i.op[2].regs->reg_num
4205                         + ((i.op[2].regs->reg_flags & RegRex) ? 8 : 0));
4206         }
4207
4208       else
4209         as_bad (_("Incorrect operands for the '%s' instruction"), 
4210                 i.tm.name);
4211     }
4212
4213   else if (i.tm.opcode_modifier.drex 
4214            || i.tm.opcode_modifier.drexv 
4215            || i.tm.opcode_modifier.drexc)
4216     as_bad (_("Internal error for the '%s' instruction"), i.tm.name);
4217 }
4218
4219 static int
4220 process_operands (void)
4221 {
4222   /* Default segment register this instruction will use for memory
4223      accesses.  0 means unknown.  This is only for optimizing out
4224      unnecessary segment overrides.  */
4225   const seg_entry *default_seg = 0;
4226
4227   /* Handle all of the DREX munging that SSE5 needs.  */
4228   if (i.tm.opcode_modifier.drex 
4229       || i.tm.opcode_modifier.drexv 
4230       || i.tm.opcode_modifier.drexc)
4231     process_drex ();
4232
4233   /* The imul $imm, %reg instruction is converted into
4234      imul $imm, %reg, %reg, and the clr %reg instruction
4235      is converted into xor %reg, %reg.  */
4236   if (i.tm.opcode_modifier.regkludge)
4237     {
4238        if (i.tm.cpu_flags.bitfield.cpusse4_1)
4239          {
4240            /* The first operand in instruction blendvpd, blendvps and
4241               pblendvb in SSE4.1 is implicit and must be xmm0.  */
4242            assert (i.operands == 3
4243                    && i.reg_operands >= 2
4244                    && UINTS_EQUAL (i.types[0], regxmm));
4245            if (i.op[0].regs->reg_num != 0)
4246              {
4247                if (intel_syntax)
4248                  as_bad (_("the last operand of `%s' must be `%sxmm0'"),
4249                          i.tm.name, register_prefix);
4250                else
4251                  as_bad (_("the first operand of `%s' must be `%sxmm0'"),
4252                          i.tm.name, register_prefix);
4253                return 0;
4254              }
4255            i.op[0] = i.op[1];
4256            i.op[1] = i.op[2];
4257            i.types[0] = i.types[1];
4258            i.types[1] = i.types[2];
4259            i.operands--;
4260            i.reg_operands--;
4261
4262            /* We need to adjust fields in i.tm since they are used by
4263               build_modrm_byte.  */
4264            i.tm.operand_types [0] = i.tm.operand_types [1];
4265            i.tm.operand_types [1] = i.tm.operand_types [2];
4266            i.tm.operands--;
4267          }
4268        else
4269          {
4270            unsigned int first_reg_op;
4271            
4272            if (operand_type_check (i.types[0], reg))
4273              first_reg_op = 0;
4274            else
4275              first_reg_op = 1;
4276            /* Pretend we saw the extra register operand.  */
4277            assert (i.reg_operands == 1
4278                    && i.op[first_reg_op + 1].regs == 0);
4279            i.op[first_reg_op + 1].regs = i.op[first_reg_op].regs;
4280            i.types[first_reg_op + 1] = i.types[first_reg_op];
4281            i.operands++;
4282            i.reg_operands++;
4283          }
4284     }
4285
4286   if (i.tm.opcode_modifier.shortform)
4287     {
4288       if (i.types[0].bitfield.sreg2
4289           || i.types[0].bitfield.sreg3)
4290         {
4291           if (i.tm.base_opcode == POP_SEG_SHORT
4292               && i.op[0].regs->reg_num == 1)
4293             {
4294               as_bad (_("you can't `pop %%cs'"));
4295               return 0;
4296             }
4297           i.tm.base_opcode |= (i.op[0].regs->reg_num << 3);
4298           if ((i.op[0].regs->reg_flags & RegRex) != 0)
4299             i.rex |= REX_B;
4300         }
4301       else
4302         {
4303           /* The register or float register operand is in operand 
4304              0 or 1.  */
4305           unsigned int op;
4306           
4307            if (i.types[0].bitfield.floatreg
4308                || operand_type_check (i.types[0], reg))
4309              op = 0;
4310            else
4311              op = 1;
4312           /* Register goes in low 3 bits of opcode.  */
4313           i.tm.base_opcode |= i.op[op].regs->reg_num;
4314           if ((i.op[op].regs->reg_flags & RegRex) != 0)
4315             i.rex |= REX_B;
4316           if (!quiet_warnings && i.tm.opcode_modifier.ugh)
4317             {
4318               /* Warn about some common errors, but press on regardless.
4319                  The first case can be generated by gcc (<= 2.8.1).  */
4320               if (i.operands == 2)
4321                 {
4322                   /* Reversed arguments on faddp, fsubp, etc.  */
4323                   as_warn (_("translating to `%s %s%s,%s%s'"), i.tm.name,
4324                            register_prefix, i.op[1].regs->reg_name,
4325                            register_prefix, i.op[0].regs->reg_name);
4326                 }
4327               else
4328                 {
4329                   /* Extraneous `l' suffix on fp insn.  */
4330                   as_warn (_("translating to `%s %s%s'"), i.tm.name,
4331                            register_prefix, i.op[0].regs->reg_name);
4332                 }
4333             }
4334         }
4335     }
4336   else if (i.tm.opcode_modifier.modrm)
4337     {
4338       /* The opcode is completed (modulo i.tm.extension_opcode which
4339          must be put into the modrm byte).  Now, we make the modrm and
4340          index base bytes based on all the info we've collected.  */
4341
4342       default_seg = build_modrm_byte ();
4343     }
4344   else if ((i.tm.base_opcode & ~0x3) == MOV_AX_DISP32)
4345     {
4346       default_seg = &ds;
4347     }
4348   else if (i.tm.opcode_modifier.isstring)
4349     {
4350       /* For the string instructions that allow a segment override
4351          on one of their operands, the default segment is ds.  */
4352       default_seg = &ds;
4353     }
4354
4355   if (i.tm.base_opcode == 0x8d /* lea */
4356       && i.seg[0]
4357       && !quiet_warnings)
4358     as_warn (_("segment override on `%s' is ineffectual"), i.tm.name);
4359
4360   /* If a segment was explicitly specified, and the specified segment
4361      is not the default, use an opcode prefix to select it.  If we
4362      never figured out what the default segment is, then default_seg
4363      will be zero at this point, and the specified segment prefix will
4364      always be used.  */
4365   if ((i.seg[0]) && (i.seg[0] != default_seg))
4366     {
4367       if (!add_prefix (i.seg[0]->seg_prefix))
4368         return 0;
4369     }
4370   return 1;
4371 }
4372
4373 static const seg_entry *
4374 build_modrm_byte (void)
4375 {
4376   const seg_entry *default_seg = 0;
4377
4378   /* SSE5 4 operand instructions are encoded in such a way that one of 
4379      the inputs must match the destination register.  Process_drex hides
4380      the 3rd argument in the drex field, so that by the time we get 
4381      here, it looks to GAS as if this is a 2 operand instruction.  */
4382   if ((i.tm.opcode_modifier.drex 
4383        || i.tm.opcode_modifier.drexv 
4384        || i.tm.opcode_modifier.drexc)
4385       && i.reg_operands == 2)
4386     {
4387       const reg_entry *reg = i.op[i.drex.modrm_reg].regs;
4388       const reg_entry *regmem = i.op[i.drex.modrm_regmem].regs;
4389
4390       i.rm.reg = reg->reg_num;
4391       i.rm.regmem = regmem->reg_num;
4392       i.rm.mode = 3;
4393       if ((reg->reg_flags & RegRex) != 0)
4394         i.rex |= REX_R;
4395       if ((regmem->reg_flags & RegRex) != 0)
4396         i.rex |= REX_B;
4397     }
4398
4399   /* i.reg_operands MUST be the number of real register operands;
4400      implicit registers do not count.  */
4401   else if (i.reg_operands == 2)
4402     {
4403       unsigned int source, dest;
4404
4405       switch (i.operands)
4406         {
4407         case 2:
4408           source = 0;
4409           break;
4410         case 3:
4411           /* When there are 3 operands, one of them may be immediate,
4412              which may be the first or the last operand.  Otherwise,
4413              the first operand must be shift count register (cl). */
4414           assert (i.imm_operands == 1
4415                   || (i.imm_operands == 0
4416                       && i.types[0].bitfield.shiftcount));
4417           if (operand_type_check (i.types[0], imm)
4418               || i.types[0].bitfield.shiftcount)
4419             source = 1;
4420           else
4421             source = 0;
4422           break;
4423         case 4:
4424           /* When there are 4 operands, the first two must be 8bit
4425              immediate operands. The source operand will be the 3rd
4426              one.  */
4427           assert (i.imm_operands == 2
4428                   && i.types[0].bitfield.imm8
4429                   && i.types[1].bitfield.imm8);
4430           source = 2;
4431           break;
4432         default:
4433           abort ();
4434         }
4435
4436       dest = source + 1;
4437
4438       i.rm.mode = 3;
4439       /* One of the register operands will be encoded in the i.tm.reg
4440          field, the other in the combined i.tm.mode and i.tm.regmem
4441          fields.  If no form of this instruction supports a memory
4442          destination operand, then we assume the source operand may
4443          sometimes be a memory operand and so we need to store the
4444          destination in the i.rm.reg field.  */
4445       if (!i.tm.operand_types[dest].bitfield.regmem
4446           && operand_type_check (i.tm.operand_types[dest], anymem) == 0)
4447         {
4448           i.rm.reg = i.op[dest].regs->reg_num;
4449           i.rm.regmem = i.op[source].regs->reg_num;
4450           if ((i.op[dest].regs->reg_flags & RegRex) != 0)
4451             i.rex |= REX_R;
4452           if ((i.op[source].regs->reg_flags & RegRex) != 0)
4453             i.rex |= REX_B;
4454         }
4455       else
4456         {
4457           i.rm.reg = i.op[source].regs->reg_num;
4458           i.rm.regmem = i.op[dest].regs->reg_num;
4459           if ((i.op[dest].regs->reg_flags & RegRex) != 0)
4460             i.rex |= REX_B;
4461           if ((i.op[source].regs->reg_flags & RegRex) != 0)
4462             i.rex |= REX_R;
4463         }
4464       if (flag_code != CODE_64BIT && (i.rex & (REX_R | REX_B)))
4465         {
4466           if (!i.types[0].bitfield.control
4467               && !i.types[1].bitfield.control)
4468             abort ();
4469           i.rex &= ~(REX_R | REX_B);
4470           add_prefix (LOCK_PREFIX_OPCODE);
4471         }
4472     }
4473   else
4474     {                   /* If it's not 2 reg operands...  */
4475       if (i.mem_operands)
4476         {
4477           unsigned int fake_zero_displacement = 0;
4478           unsigned int op;
4479
4480           /* This has been precalculated for SSE5 instructions 
4481              that have a DREX field earlier in process_drex.  */
4482           if (i.tm.opcode_modifier.drex 
4483               || i.tm.opcode_modifier.drexv 
4484               || i.tm.opcode_modifier.drexc)
4485             op = i.drex.modrm_regmem;
4486           else
4487             {
4488               for (op = 0; op < i.operands; op++)
4489                 if (operand_type_check (i.types[op], anymem))
4490                   break;
4491               assert (op < i.operands);
4492             }
4493
4494           default_seg = &ds;
4495
4496           if (i.base_reg == 0)
4497             {
4498               i.rm.mode = 0;
4499               if (!i.disp_operands)
4500                 fake_zero_displacement = 1;
4501               if (i.index_reg == 0)
4502                 {
4503                   /* Operand is just <disp>  */
4504                   if (flag_code == CODE_64BIT)
4505                     {
4506                       /* 64bit mode overwrites the 32bit absolute
4507                          addressing by RIP relative addressing and
4508                          absolute addressing is encoded by one of the
4509                          redundant SIB forms.  */
4510                       i.rm.regmem = ESCAPE_TO_TWO_BYTE_ADDRESSING;
4511                       i.sib.base = NO_BASE_REGISTER;
4512                       i.sib.index = NO_INDEX_REGISTER;
4513                       i.types[op] = ((i.prefix[ADDR_PREFIX] == 0)
4514                                      ? disp32s : disp32);
4515                     }
4516                   else if ((flag_code == CODE_16BIT)
4517                            ^ (i.prefix[ADDR_PREFIX] != 0))
4518                     {
4519                       i.rm.regmem = NO_BASE_REGISTER_16;
4520                       i.types[op] = disp16;
4521                     }
4522                   else
4523                     {
4524                       i.rm.regmem = NO_BASE_REGISTER;
4525                       i.types[op] = disp32;
4526                     }
4527                 }
4528               else /* !i.base_reg && i.index_reg  */
4529                 {
4530                   if (i.index_reg->reg_num == RegEiz
4531                       || i.index_reg->reg_num == RegRiz)
4532                     i.sib.index = NO_INDEX_REGISTER;
4533                   else
4534                     i.sib.index = i.index_reg->reg_num;
4535                   i.sib.base = NO_BASE_REGISTER;
4536                   i.sib.scale = i.log2_scale_factor;
4537                   i.rm.regmem = ESCAPE_TO_TWO_BYTE_ADDRESSING;
4538                   i.types[op].bitfield.disp8 = 0;
4539                   i.types[op].bitfield.disp16 = 0;
4540                   i.types[op].bitfield.disp64 = 0;
4541                   if (flag_code != CODE_64BIT)
4542                     {
4543                       /* Must be 32 bit */
4544                       i.types[op].bitfield.disp32 = 1;
4545                       i.types[op].bitfield.disp32s = 0;
4546                     }
4547                   else
4548                     {
4549                       i.types[op].bitfield.disp32 = 0;
4550                       i.types[op].bitfield.disp32s = 1;
4551                     }
4552                   if ((i.index_reg->reg_flags & RegRex) != 0)
4553                     i.rex |= REX_X;
4554                 }
4555             }
4556           /* RIP addressing for 64bit mode.  */
4557           else if (i.base_reg->reg_num == RegRip ||
4558                    i.base_reg->reg_num == RegEip)
4559             {
4560               i.rm.regmem = NO_BASE_REGISTER;
4561               i.types[op].bitfield.disp8 = 0;
4562               i.types[op].bitfield.disp16 = 0;
4563               i.types[op].bitfield.disp32 = 0;
4564               i.types[op].bitfield.disp32s = 1;
4565               i.types[op].bitfield.disp64 = 0;
4566               i.flags[op] |= Operand_PCrel;
4567               if (! i.disp_operands)
4568                 fake_zero_displacement = 1;
4569             }
4570           else if (i.base_reg->reg_type.bitfield.reg16)
4571             {
4572               switch (i.base_reg->reg_num)
4573                 {
4574                 case 3: /* (%bx)  */
4575                   if (i.index_reg == 0)
4576                     i.rm.regmem = 7;
4577                   else /* (%bx,%si) -> 0, or (%bx,%di) -> 1  */
4578                     i.rm.regmem = i.index_reg->reg_num - 6;
4579                   break;
4580                 case 5: /* (%bp)  */
4581                   default_seg = &ss;
4582                   if (i.index_reg == 0)
4583                     {
4584                       i.rm.regmem = 6;
4585                       if (operand_type_check (i.types[op], disp) == 0)
4586                         {
4587                           /* fake (%bp) into 0(%bp)  */
4588                           i.types[op].bitfield.disp8 = 1;
4589                           fake_zero_displacement = 1;
4590                         }
4591                     }
4592                   else /* (%bp,%si) -> 2, or (%bp,%di) -> 3  */
4593                     i.rm.regmem = i.index_reg->reg_num - 6 + 2;
4594                   break;
4595                 default: /* (%si) -> 4 or (%di) -> 5  */
4596                   i.rm.regmem = i.base_reg->reg_num - 6 + 4;
4597                 }
4598               i.rm.mode = mode_from_disp_size (i.types[op]);
4599             }
4600           else /* i.base_reg and 32/64 bit mode  */
4601             {
4602               if (flag_code == CODE_64BIT
4603                   && operand_type_check (i.types[op], disp))
4604                 {
4605                   i386_operand_type temp;
4606                   UINTS_CLEAR (temp);
4607                   temp.bitfield.disp8 = i.types[op].bitfield.disp8;
4608                   i.types[op] = temp;
4609                   if (i.prefix[ADDR_PREFIX] == 0)
4610                     i.types[op].bitfield.disp32s = 1;
4611                   else
4612                     i.types[op].bitfield.disp32 = 1;
4613                 }
4614
4615               i.rm.regmem = i.base_reg->reg_num;
4616               if ((i.base_reg->reg_flags & RegRex) != 0)
4617                 i.rex |= REX_B;
4618               i.sib.base = i.base_reg->reg_num;
4619               /* x86-64 ignores REX prefix bit here to avoid decoder
4620                  complications.  */
4621               if ((i.base_reg->reg_num & 7) == EBP_REG_NUM)
4622                 {
4623                   default_seg = &ss;
4624                   if (i.disp_operands == 0)
4625                     {
4626                       fake_zero_displacement = 1;
4627                       i.types[op].bitfield.disp8 = 1;
4628                     }
4629                 }
4630               else if (i.base_reg->reg_num == ESP_REG_NUM)
4631                 {
4632                   default_seg = &ss;
4633                 }
4634               i.sib.scale = i.log2_scale_factor;
4635               if (i.index_reg == 0)
4636                 {
4637                   /* <disp>(%esp) becomes two byte modrm with no index
4638                      register.  We've already stored the code for esp
4639                      in i.rm.regmem ie. ESCAPE_TO_TWO_BYTE_ADDRESSING.
4640                      Any base register besides %esp will not use the
4641                      extra modrm byte.  */
4642                   i.sib.index = NO_INDEX_REGISTER;
4643                 }
4644               else
4645                 {
4646                   if (i.index_reg->reg_num == RegEiz
4647                       || i.index_reg->reg_num == RegRiz)
4648                     i.sib.index = NO_INDEX_REGISTER;
4649                   else
4650                     i.sib.index = i.index_reg->reg_num;
4651                   i.rm.regmem = ESCAPE_TO_TWO_BYTE_ADDRESSING;
4652                   if ((i.index_reg->reg_flags & RegRex) != 0)
4653                     i.rex |= REX_X;
4654                 }
4655
4656               if (i.disp_operands
4657                   && (i.reloc[op] == BFD_RELOC_386_TLS_DESC_CALL
4658                       || i.reloc[op] == BFD_RELOC_X86_64_TLSDESC_CALL))
4659                 i.rm.mode = 0;
4660               else
4661                 i.rm.mode = mode_from_disp_size (i.types[op]);
4662             }
4663
4664           if (fake_zero_displacement)
4665             {
4666               /* Fakes a zero displacement assuming that i.types[op]
4667                  holds the correct displacement size.  */
4668               expressionS *exp;
4669
4670               assert (i.op[op].disps == 0);
4671               exp = &disp_expressions[i.disp_operands++];
4672               i.op[op].disps = exp;
4673               exp->X_op = O_constant;
4674               exp->X_add_number = 0;
4675               exp->X_add_symbol = (symbolS *) 0;
4676               exp->X_op_symbol = (symbolS *) 0;
4677             }
4678         }
4679
4680       /* Fill in i.rm.reg or i.rm.regmem field with register operand
4681          (if any) based on i.tm.extension_opcode.  Again, we must be
4682          careful to make sure that segment/control/debug/test/MMX
4683          registers are coded into the i.rm.reg field.  */
4684       if (i.reg_operands)
4685         {
4686           unsigned int op;
4687
4688           /* This has been precalculated for SSE5 instructions 
4689              that have a DREX field earlier in process_drex.  */
4690           if (i.tm.opcode_modifier.drex 
4691               || i.tm.opcode_modifier.drexv 
4692               || i.tm.opcode_modifier.drexc)
4693             {
4694               op = i.drex.modrm_reg;
4695               i.rm.reg = i.op[op].regs->reg_num;
4696               if ((i.op[op].regs->reg_flags & RegRex) != 0)
4697                 i.rex |= REX_R;
4698             }
4699           else
4700             {
4701               for (op = 0; op < i.operands; op++)
4702                 if (i.types[op].bitfield.reg8
4703                     || i.types[op].bitfield.reg16
4704                     || i.types[op].bitfield.reg32
4705                     || i.types[op].bitfield.reg64
4706                     || i.types[op].bitfield.regmmx
4707                     || i.types[op].bitfield.regxmm
4708                     || i.types[op].bitfield.sreg2
4709                     || i.types[op].bitfield.sreg3
4710                     || i.types[op].bitfield.control
4711                     || i.types[op].bitfield.debug
4712                     || i.types[op].bitfield.test)
4713                   break;
4714
4715               assert (op < i.operands);
4716
4717               /* If there is an extension opcode to put here, the 
4718                  register number must be put into the regmem field.  */
4719               if (i.tm.extension_opcode != None)
4720                 {
4721                   i.rm.regmem = i.op[op].regs->reg_num;
4722                   if ((i.op[op].regs->reg_flags & RegRex) != 0)
4723                     i.rex |= REX_B;
4724                 }
4725               else
4726                 {
4727                   i.rm.reg = i.op[op].regs->reg_num;
4728                   if ((i.op[op].regs->reg_flags & RegRex) != 0)
4729                     i.rex |= REX_R;
4730                 }
4731             }
4732
4733           /* Now, if no memory operand has set i.rm.mode = 0, 1, 2 we
4734              must set it to 3 to indicate this is a register operand
4735              in the regmem field.  */
4736           if (!i.mem_operands)
4737             i.rm.mode = 3;
4738         }
4739
4740       /* Fill in i.rm.reg field with extension opcode (if any).  */
4741       if (i.tm.extension_opcode != None
4742           && !(i.tm.opcode_modifier.drex 
4743               || i.tm.opcode_modifier.drexv 
4744               || i.tm.opcode_modifier.drexc))
4745         i.rm.reg = i.tm.extension_opcode;
4746     }
4747   return default_seg;
4748 }
4749
4750 static void
4751 output_branch (void)
4752 {
4753   char *p;
4754   int code16;
4755   int prefix;
4756   relax_substateT subtype;
4757   symbolS *sym;
4758   offsetT off;
4759
4760   code16 = 0;
4761   if (flag_code == CODE_16BIT)
4762     code16 = CODE16;
4763
4764   prefix = 0;
4765   if (i.prefix[DATA_PREFIX] != 0)
4766     {
4767       prefix = 1;
4768       i.prefixes -= 1;
4769       code16 ^= CODE16;
4770     }
4771   /* Pentium4 branch hints.  */
4772   if (i.prefix[SEG_PREFIX] == CS_PREFIX_OPCODE /* not taken */
4773       || i.prefix[SEG_PREFIX] == DS_PREFIX_OPCODE /* taken */)
4774     {
4775       prefix++;
4776       i.prefixes--;
4777     }
4778   if (i.prefix[REX_PREFIX] != 0)
4779     {
4780       prefix++;
4781       i.prefixes--;
4782     }
4783
4784   if (i.prefixes != 0 && !intel_syntax)
4785     as_warn (_("skipping prefixes on this instruction"));
4786
4787   /* It's always a symbol;  End frag & setup for relax.
4788      Make sure there is enough room in this frag for the largest
4789      instruction we may generate in md_convert_frag.  This is 2
4790      bytes for the opcode and room for the prefix and largest
4791      displacement.  */
4792   frag_grow (prefix + 2 + 4);
4793   /* Prefix and 1 opcode byte go in fr_fix.  */
4794   p = frag_more (prefix + 1);
4795   if (i.prefix[DATA_PREFIX] != 0)
4796     *p++ = DATA_PREFIX_OPCODE;
4797   if (i.prefix[SEG_PREFIX] == CS_PREFIX_OPCODE
4798       || i.prefix[SEG_PREFIX] == DS_PREFIX_OPCODE)
4799     *p++ = i.prefix[SEG_PREFIX];
4800   if (i.prefix[REX_PREFIX] != 0)
4801     *p++ = i.prefix[REX_PREFIX];
4802   *p = i.tm.base_opcode;
4803
4804   if ((unsigned char) *p == JUMP_PC_RELATIVE)
4805     subtype = ENCODE_RELAX_STATE (UNCOND_JUMP, SMALL);
4806   else if (cpu_arch_flags.bitfield.cpui386)
4807     subtype = ENCODE_RELAX_STATE (COND_JUMP, SMALL);
4808   else
4809     subtype = ENCODE_RELAX_STATE (COND_JUMP86, SMALL);
4810   subtype |= code16;
4811
4812   sym = i.op[0].disps->X_add_symbol;
4813   off = i.op[0].disps->X_add_number;
4814
4815   if (i.op[0].disps->X_op != O_constant
4816       && i.op[0].disps->X_op != O_symbol)
4817     {
4818       /* Handle complex expressions.  */
4819       sym = make_expr_symbol (i.op[0].disps);
4820       off = 0;
4821     }
4822
4823   /* 1 possible extra opcode + 4 byte displacement go in var part.
4824      Pass reloc in fr_var.  */
4825   frag_var (rs_machine_dependent, 5, i.reloc[0], subtype, sym, off, p);
4826 }
4827
4828 static void
4829 output_jump (void)
4830 {
4831   char *p;
4832   int size;
4833   fixS *fixP;
4834
4835   if (i.tm.opcode_modifier.jumpbyte)
4836     {
4837       /* This is a loop or jecxz type instruction.  */
4838       size = 1;
4839       if (i.prefix[ADDR_PREFIX] != 0)
4840         {
4841           FRAG_APPEND_1_CHAR (ADDR_PREFIX_OPCODE);
4842           i.prefixes -= 1;
4843         }
4844       /* Pentium4 branch hints.  */
4845       if (i.prefix[SEG_PREFIX] == CS_PREFIX_OPCODE /* not taken */
4846           || i.prefix[SEG_PREFIX] == DS_PREFIX_OPCODE /* taken */)
4847         {
4848           FRAG_APPEND_1_CHAR (i.prefix[SEG_PREFIX]);
4849           i.prefixes--;
4850         }
4851     }
4852   else
4853     {
4854       int code16;
4855
4856       code16 = 0;
4857       if (flag_code == CODE_16BIT)
4858         code16 = CODE16;
4859
4860       if (i.prefix[DATA_PREFIX] != 0)
4861         {
4862           FRAG_APPEND_1_CHAR (DATA_PREFIX_OPCODE);
4863           i.prefixes -= 1;
4864           code16 ^= CODE16;
4865         }
4866
4867       size = 4;
4868       if (code16)
4869         size = 2;
4870     }
4871
4872   if (i.prefix[REX_PREFIX] != 0)
4873     {
4874       FRAG_APPEND_1_CHAR (i.prefix[REX_PREFIX]);
4875       i.prefixes -= 1;
4876     }
4877
4878   if (i.prefixes != 0 && !intel_syntax)
4879     as_warn (_("skipping prefixes on this instruction"));
4880
4881   p = frag_more (1 + size);
4882   *p++ = i.tm.base_opcode;
4883
4884   fixP = fix_new_exp (frag_now, p - frag_now->fr_literal, size,
4885                       i.op[0].disps, 1, reloc (size, 1, 1, i.reloc[0]));
4886
4887   /* All jumps handled here are signed, but don't use a signed limit
4888      check for 32 and 16 bit jumps as we want to allow wrap around at
4889      4G and 64k respectively.  */
4890   if (size == 1)
4891     fixP->fx_signed = 1;
4892 }
4893
4894 static void
4895 output_interseg_jump (void)
4896 {
4897   char *p;
4898   int size;
4899   int prefix;
4900   int code16;
4901
4902   code16 = 0;
4903   if (flag_code == CODE_16BIT)
4904     code16 = CODE16;
4905
4906   prefix = 0;
4907   if (i.prefix[DATA_PREFIX] != 0)
4908     {
4909       prefix = 1;
4910       i.prefixes -= 1;
4911       code16 ^= CODE16;
4912     }
4913   if (i.prefix[REX_PREFIX] != 0)
4914     {
4915       prefix++;
4916       i.prefixes -= 1;
4917     }
4918
4919   size = 4;
4920   if (code16)
4921     size = 2;
4922
4923   if (i.prefixes != 0 && !intel_syntax)
4924     as_warn (_("skipping prefixes on this instruction"));
4925
4926   /* 1 opcode; 2 segment; offset  */
4927   p = frag_more (prefix + 1 + 2 + size);
4928
4929   if (i.prefix[DATA_PREFIX] != 0)
4930     *p++ = DATA_PREFIX_OPCODE;
4931
4932   if (i.prefix[REX_PREFIX] != 0)
4933     *p++ = i.prefix[REX_PREFIX];
4934
4935   *p++ = i.tm.base_opcode;
4936   if (i.op[1].imms->X_op == O_constant)
4937     {
4938       offsetT n = i.op[1].imms->X_add_number;
4939
4940       if (size == 2
4941           && !fits_in_unsigned_word (n)
4942           && !fits_in_signed_word (n))
4943         {
4944           as_bad (_("16-bit jump out of range"));
4945           return;
4946         }
4947       md_number_to_chars (p, n, size);
4948     }
4949   else
4950     fix_new_exp (frag_now, p - frag_now->fr_literal, size,
4951                  i.op[1].imms, 0, reloc (size, 0, 0, i.reloc[1]));
4952   if (i.op[0].imms->X_op != O_constant)
4953     as_bad (_("can't handle non absolute segment in `%s'"),
4954             i.tm.name);
4955   md_number_to_chars (p + size, (valueT) i.op[0].imms->X_add_number, 2);
4956 }
4957
4958 static void
4959 output_insn (void)
4960 {
4961   fragS *insn_start_frag;
4962   offsetT insn_start_off;
4963
4964   /* Tie dwarf2 debug info to the address at the start of the insn.
4965      We can't do this after the insn has been output as the current
4966      frag may have been closed off.  eg. by frag_var.  */
4967   dwarf2_emit_insn (0);
4968
4969   insn_start_frag = frag_now;
4970   insn_start_off = frag_now_fix ();
4971
4972   /* Output jumps.  */
4973   if (i.tm.opcode_modifier.jump)
4974     output_branch ();
4975   else if (i.tm.opcode_modifier.jumpbyte
4976            || i.tm.opcode_modifier.jumpdword)
4977     output_jump ();
4978   else if (i.tm.opcode_modifier.jumpintersegment)
4979     output_interseg_jump ();
4980   else
4981     {
4982       /* Output normal instructions here.  */
4983       char *p;
4984       unsigned char *q;
4985       unsigned int prefix;
4986
4987       switch (i.tm.opcode_length)
4988         {
4989         case 3:
4990           if (i.tm.base_opcode & 0xff000000)
4991             {
4992               prefix = (i.tm.base_opcode >> 24) & 0xff;
4993               goto check_prefix;
4994             }
4995           break;
4996         case 2:
4997           if ((i.tm.base_opcode & 0xff0000) != 0)
4998             {
4999               prefix = (i.tm.base_opcode >> 16) & 0xff;
5000               if (i.tm.cpu_flags.bitfield.cpupadlock)
5001                 {
5002 check_prefix:
5003                   if (prefix != REPE_PREFIX_OPCODE
5004                       || i.prefix[LOCKREP_PREFIX] != REPE_PREFIX_OPCODE)
5005                     add_prefix (prefix);
5006                 }
5007               else
5008                 add_prefix (prefix);
5009             }
5010           break;
5011         case 1:
5012           break;
5013         default:
5014           abort ();
5015         }
5016
5017       /* The prefix bytes.  */
5018       for (q = i.prefix;
5019            q < i.prefix + sizeof (i.prefix) / sizeof (i.prefix[0]);
5020            q++)
5021         {
5022           if (*q)
5023             {
5024               p = frag_more (1);
5025               md_number_to_chars (p, (valueT) *q, 1);
5026             }
5027         }
5028
5029       /* Now the opcode; be careful about word order here!  */
5030       if (i.tm.opcode_length == 1)
5031         {
5032           FRAG_APPEND_1_CHAR (i.tm.base_opcode);
5033         }
5034       else
5035         {
5036           switch (i.tm.opcode_length)
5037             {
5038             case 3:
5039               p = frag_more (3);
5040               *p++ = (i.tm.base_opcode >> 16) & 0xff;
5041               break;
5042             case 2:
5043               p = frag_more (2);
5044               break;
5045             default:
5046               abort ();
5047               break;
5048             }
5049
5050           /* Put out high byte first: can't use md_number_to_chars!  */
5051           *p++ = (i.tm.base_opcode >> 8) & 0xff;
5052           *p = i.tm.base_opcode & 0xff;
5053
5054           /* On SSE5, encode the OC1 bit in the DREX field if this 
5055              encoding has multiple formats.  */
5056           if (i.tm.opcode_modifier.drex 
5057               && i.tm.opcode_modifier.drexv 
5058               && DREX_OC1 (i.tm.extension_opcode))
5059             *p |= DREX_OC1_MASK;
5060         }
5061
5062       /* Now the modrm byte and sib byte (if present).  */
5063       if (i.tm.opcode_modifier.modrm)
5064         {
5065           p = frag_more (1);
5066           md_number_to_chars (p,
5067                               (valueT) (i.rm.regmem << 0
5068                                         | i.rm.reg << 3
5069                                         | i.rm.mode << 6),
5070                               1);
5071           /* If i.rm.regmem == ESP (4)
5072              && i.rm.mode != (Register mode)
5073              && not 16 bit
5074              ==> need second modrm byte.  */
5075           if (i.rm.regmem == ESCAPE_TO_TWO_BYTE_ADDRESSING
5076               && i.rm.mode != 3
5077               && !(i.base_reg && i.base_reg->reg_type.bitfield.reg16))
5078             {
5079               p = frag_more (1);
5080               md_number_to_chars (p,
5081                                   (valueT) (i.sib.base << 0
5082                                             | i.sib.index << 3
5083                                             | i.sib.scale << 6),
5084                                   1);
5085             }
5086         }
5087
5088       /* Write the DREX byte if needed.  */
5089       if (i.tm.opcode_modifier.drex || i.tm.opcode_modifier.drexc)
5090         {
5091           p = frag_more (1);
5092           *p = (((i.drex.reg & 0xf) << 4) | (i.drex.rex & 0x7));
5093
5094           /* Encode the OC0 bit if this encoding has multiple 
5095              formats.  */
5096           if ((i.tm.opcode_modifier.drex 
5097                || i.tm.opcode_modifier.drexv) 
5098               && DREX_OC0 (i.tm.extension_opcode))
5099             *p |= DREX_OC0_MASK;
5100         }
5101
5102       if (i.disp_operands)
5103         output_disp (insn_start_frag, insn_start_off);
5104
5105       if (i.imm_operands)
5106         output_imm (insn_start_frag, insn_start_off);
5107     }
5108
5109 #ifdef DEBUG386
5110   if (flag_debug)
5111     {
5112       pi ("" /*line*/, &i);
5113     }
5114 #endif /* DEBUG386  */
5115 }
5116
5117 /* Return the size of the displacement operand N.  */
5118
5119 static int
5120 disp_size (unsigned int n)
5121 {
5122   int size = 4;
5123   if (i.types[n].bitfield.disp64)
5124     size = 8;
5125   else if (i.types[n].bitfield.disp8)
5126     size = 1;
5127   else if (i.types[n].bitfield.disp16)
5128     size = 2;
5129   return size;
5130 }
5131
5132 /* Return the size of the immediate operand N.  */
5133
5134 static int
5135 imm_size (unsigned int n)
5136 {
5137   int size = 4;
5138   if (i.types[n].bitfield.imm64)
5139     size = 8;
5140   else if (i.types[n].bitfield.imm8 || i.types[n].bitfield.imm8s)
5141     size = 1;
5142   else if (i.types[n].bitfield.imm16)
5143     size = 2;
5144   return size;
5145 }
5146
5147 static void
5148 output_disp (fragS *insn_start_frag, offsetT insn_start_off)
5149 {
5150   char *p;
5151   unsigned int n;
5152
5153   for (n = 0; n < i.operands; n++)
5154     {
5155       if (operand_type_check (i.types[n], disp))
5156         {
5157           if (i.op[n].disps->X_op == O_constant)
5158             {
5159               int size = disp_size (n);
5160               offsetT val;
5161
5162               val = offset_in_range (i.op[n].disps->X_add_number,
5163                                      size);
5164               p = frag_more (size);
5165               md_number_to_chars (p, val, size);
5166             }
5167           else
5168             {
5169               enum bfd_reloc_code_real reloc_type;
5170               int size = disp_size (n);
5171               int sign = i.types[n].bitfield.disp32s;
5172               int pcrel = (i.flags[n] & Operand_PCrel) != 0;
5173
5174               /* We can't have 8 bit displacement here.  */
5175               assert (!i.types[n].bitfield.disp8);
5176
5177               /* The PC relative address is computed relative
5178                  to the instruction boundary, so in case immediate
5179                  fields follows, we need to adjust the value.  */
5180               if (pcrel && i.imm_operands)
5181                 {
5182                   unsigned int n1;
5183                   int sz = 0;
5184
5185                   for (n1 = 0; n1 < i.operands; n1++)
5186                     if (operand_type_check (i.types[n1], imm))
5187                       {
5188                         /* Only one immediate is allowed for PC
5189                            relative address.  */
5190                         assert (sz == 0);
5191                         sz = imm_size (n1);
5192                         i.op[n].disps->X_add_number -= sz;
5193                       }
5194                   /* We should find the immediate.  */
5195                   assert (sz != 0);
5196                 }
5197
5198               p = frag_more (size);
5199               reloc_type = reloc (size, pcrel, sign, i.reloc[n]);
5200               if (GOT_symbol
5201                   && GOT_symbol == i.op[n].disps->X_add_symbol
5202                   && (((reloc_type == BFD_RELOC_32
5203                         || reloc_type == BFD_RELOC_X86_64_32S
5204                         || (reloc_type == BFD_RELOC_64
5205                             && object_64bit))
5206                        && (i.op[n].disps->X_op == O_symbol
5207                            || (i.op[n].disps->X_op == O_add
5208                                && ((symbol_get_value_expression
5209                                     (i.op[n].disps->X_op_symbol)->X_op)
5210                                    == O_subtract))))
5211                       || reloc_type == BFD_RELOC_32_PCREL))
5212                 {
5213                   offsetT add;
5214
5215                   if (insn_start_frag == frag_now)
5216                     add = (p - frag_now->fr_literal) - insn_start_off;
5217                   else
5218                     {
5219                       fragS *fr;
5220
5221                       add = insn_start_frag->fr_fix - insn_start_off;
5222                       for (fr = insn_start_frag->fr_next;
5223                            fr && fr != frag_now; fr = fr->fr_next)
5224                         add += fr->fr_fix;
5225                       add += p - frag_now->fr_literal;
5226                     }
5227
5228                   if (!object_64bit)
5229                     {
5230                       reloc_type = BFD_RELOC_386_GOTPC;
5231                       i.op[n].imms->X_add_number += add;
5232                     }
5233                   else if (reloc_type == BFD_RELOC_64)
5234                     reloc_type = BFD_RELOC_X86_64_GOTPC64;
5235                   else
5236                     /* Don't do the adjustment for x86-64, as there
5237                        the pcrel addressing is relative to the _next_
5238                        insn, and that is taken care of in other code.  */
5239                     reloc_type = BFD_RELOC_X86_64_GOTPC32;
5240                 }
5241               fix_new_exp (frag_now, p - frag_now->fr_literal, size,
5242                            i.op[n].disps, pcrel, reloc_type);
5243             }
5244         }
5245     }
5246 }
5247
5248 static void
5249 output_imm (fragS *insn_start_frag, offsetT insn_start_off)
5250 {
5251   char *p;
5252   unsigned int n;
5253
5254   for (n = 0; n < i.operands; n++)
5255     {
5256       if (operand_type_check (i.types[n], imm))
5257         {
5258           if (i.op[n].imms->X_op == O_constant)
5259             {
5260               int size = imm_size (n);
5261               offsetT val;
5262
5263               val = offset_in_range (i.op[n].imms->X_add_number,
5264                                      size);
5265               p = frag_more (size);
5266               md_number_to_chars (p, val, size);
5267             }
5268           else
5269             {
5270               /* Not absolute_section.
5271                  Need a 32-bit fixup (don't support 8bit
5272                  non-absolute imms).  Try to support other
5273                  sizes ...  */
5274               enum bfd_reloc_code_real reloc_type;
5275               int size = imm_size (n);
5276               int sign;
5277
5278               if (i.types[n].bitfield.imm32s
5279                   && (i.suffix == QWORD_MNEM_SUFFIX
5280                       || (!i.suffix && i.tm.opcode_modifier.no_lsuf)))
5281                 sign = 1;
5282               else
5283                 sign = 0;
5284
5285               p = frag_more (size);
5286               reloc_type = reloc (size, 0, sign, i.reloc[n]);
5287
5288               /*   This is tough to explain.  We end up with this one if we
5289                * have operands that look like
5290                * "_GLOBAL_OFFSET_TABLE_+[.-.L284]".  The goal here is to
5291                * obtain the absolute address of the GOT, and it is strongly
5292                * preferable from a performance point of view to avoid using
5293                * a runtime relocation for this.  The actual sequence of
5294                * instructions often look something like:
5295                *
5296                *        call    .L66
5297                * .L66:
5298                *        popl    %ebx
5299                *        addl    $_GLOBAL_OFFSET_TABLE_+[.-.L66],%ebx
5300                *
5301                *   The call and pop essentially return the absolute address
5302                * of the label .L66 and store it in %ebx.  The linker itself
5303                * will ultimately change the first operand of the addl so
5304                * that %ebx points to the GOT, but to keep things simple, the
5305                * .o file must have this operand set so that it generates not
5306                * the absolute address of .L66, but the absolute address of
5307                * itself.  This allows the linker itself simply treat a GOTPC
5308                * relocation as asking for a pcrel offset to the GOT to be
5309                * added in, and the addend of the relocation is stored in the
5310                * operand field for the instruction itself.
5311                *
5312                *   Our job here is to fix the operand so that it would add
5313                * the correct offset so that %ebx would point to itself.  The
5314                * thing that is tricky is that .-.L66 will point to the
5315                * beginning of the instruction, so we need to further modify
5316                * the operand so that it will point to itself.  There are
5317                * other cases where you have something like:
5318                *
5319                *        .long   $_GLOBAL_OFFSET_TABLE_+[.-.L66]
5320                *
5321                * and here no correction would be required.  Internally in
5322                * the assembler we treat operands of this form as not being
5323                * pcrel since the '.' is explicitly mentioned, and I wonder
5324                * whether it would simplify matters to do it this way.  Who
5325                * knows.  In earlier versions of the PIC patches, the
5326                * pcrel_adjust field was used to store the correction, but
5327                * since the expression is not pcrel, I felt it would be
5328                * confusing to do it this way.  */
5329
5330               if ((reloc_type == BFD_RELOC_32
5331                    || reloc_type == BFD_RELOC_X86_64_32S
5332                    || reloc_type == BFD_RELOC_64)
5333                   && GOT_symbol
5334                   && GOT_symbol == i.op[n].imms->X_add_symbol
5335                   && (i.op[n].imms->X_op == O_symbol
5336                       || (i.op[n].imms->X_op == O_add
5337                           && ((symbol_get_value_expression
5338                                (i.op[n].imms->X_op_symbol)->X_op)
5339                               == O_subtract))))
5340                 {
5341                   offsetT add;
5342
5343                   if (insn_start_frag == frag_now)
5344                     add = (p - frag_now->fr_literal) - insn_start_off;
5345                   else
5346                     {
5347                       fragS *fr;
5348
5349                       add = insn_start_frag->fr_fix - insn_start_off;
5350                       for (fr = insn_start_frag->fr_next;
5351                            fr && fr != frag_now; fr = fr->fr_next)
5352                         add += fr->fr_fix;
5353                       add += p - frag_now->fr_literal;
5354                     }
5355
5356                   if (!object_64bit)
5357                     reloc_type = BFD_RELOC_386_GOTPC;
5358                   else if (size == 4)
5359                     reloc_type = BFD_RELOC_X86_64_GOTPC32;
5360                   else if (size == 8)
5361                     reloc_type = BFD_RELOC_X86_64_GOTPC64;
5362                   i.op[n].imms->X_add_number += add;
5363                 }
5364               fix_new_exp (frag_now, p - frag_now->fr_literal, size,
5365                            i.op[n].imms, 0, reloc_type);
5366             }
5367         }
5368     }
5369 }
5370 \f
5371 /* x86_cons_fix_new is called via the expression parsing code when a
5372    reloc is needed.  We use this hook to get the correct .got reloc.  */
5373 static enum bfd_reloc_code_real got_reloc = NO_RELOC;
5374 static int cons_sign = -1;
5375
5376 void
5377 x86_cons_fix_new (fragS *frag, unsigned int off, unsigned int len,
5378                   expressionS *exp)
5379 {
5380   enum bfd_reloc_code_real r = reloc (len, 0, cons_sign, got_reloc);
5381
5382   got_reloc = NO_RELOC;
5383
5384 #ifdef TE_PE
5385   if (exp->X_op == O_secrel)
5386     {
5387       exp->X_op = O_symbol;
5388       r = BFD_RELOC_32_SECREL;
5389     }
5390 #endif
5391
5392   fix_new_exp (frag, off, len, exp, 0, r);
5393 }
5394
5395 #if (!defined (OBJ_ELF) && !defined (OBJ_MAYBE_ELF)) || defined (LEX_AT)
5396 # define lex_got(reloc, adjust, types) NULL
5397 #else
5398 /* Parse operands of the form
5399    <symbol>@GOTOFF+<nnn>
5400    and similar .plt or .got references.
5401
5402    If we find one, set up the correct relocation in RELOC and copy the
5403    input string, minus the `@GOTOFF' into a malloc'd buffer for
5404    parsing by the calling routine.  Return this buffer, and if ADJUST
5405    is non-null set it to the length of the string we removed from the
5406    input line.  Otherwise return NULL.  */
5407 static char *
5408 lex_got (enum bfd_reloc_code_real *reloc,
5409          int *adjust,
5410          i386_operand_type *types)
5411 {
5412   /* Some of the relocations depend on the size of what field is to
5413      be relocated.  But in our callers i386_immediate and i386_displacement
5414      we don't yet know the operand size (this will be set by insn
5415      matching).  Hence we record the word32 relocation here,
5416      and adjust the reloc according to the real size in reloc().  */
5417   static const struct {
5418     const char *str;
5419     const enum bfd_reloc_code_real rel[2];
5420     const i386_operand_type types64;
5421   } gotrel[] = {
5422     { "PLTOFF",   { 0,
5423                     BFD_RELOC_X86_64_PLTOFF64 },
5424       OPERAND_TYPE_IMM64 },
5425     { "PLT",      { BFD_RELOC_386_PLT32,
5426                     BFD_RELOC_X86_64_PLT32    },
5427       OPERAND_TYPE_IMM32_32S_DISP32 },
5428     { "GOTPLT",   { 0,
5429                     BFD_RELOC_X86_64_GOTPLT64 },
5430       OPERAND_TYPE_IMM64_DISP64 },
5431     { "GOTOFF",   { BFD_RELOC_386_GOTOFF,
5432                     BFD_RELOC_X86_64_GOTOFF64 },
5433       OPERAND_TYPE_IMM64_DISP64 },
5434     { "GOTPCREL", { 0,
5435                     BFD_RELOC_X86_64_GOTPCREL },
5436       OPERAND_TYPE_IMM32_32S_DISP32 },
5437     { "TLSGD",    { BFD_RELOC_386_TLS_GD,
5438                     BFD_RELOC_X86_64_TLSGD    },
5439       OPERAND_TYPE_IMM32_32S_DISP32 },
5440     { "TLSLDM",   { BFD_RELOC_386_TLS_LDM,
5441                     0                         },
5442       OPERAND_TYPE_NONE },
5443     { "TLSLD",    { 0,
5444                     BFD_RELOC_X86_64_TLSLD    },
5445       OPERAND_TYPE_IMM32_32S_DISP32 },
5446     { "GOTTPOFF", { BFD_RELOC_386_TLS_IE_32,
5447                     BFD_RELOC_X86_64_GOTTPOFF },
5448       OPERAND_TYPE_IMM32_32S_DISP32 },
5449     { "TPOFF",    { BFD_RELOC_386_TLS_LE_32,
5450                     BFD_RELOC_X86_64_TPOFF32  },
5451       OPERAND_TYPE_IMM32_32S_64_DISP32_64 },
5452     { "NTPOFF",   { BFD_RELOC_386_TLS_LE,
5453                     0                         },
5454       OPERAND_TYPE_NONE },
5455     { "DTPOFF",   { BFD_RELOC_386_TLS_LDO_32,
5456                     BFD_RELOC_X86_64_DTPOFF32 },
5457       
5458       OPERAND_TYPE_IMM32_32S_64_DISP32_64 },
5459     { "GOTNTPOFF",{ BFD_RELOC_386_TLS_GOTIE,
5460                     0                         },
5461       OPERAND_TYPE_NONE },
5462     { "INDNTPOFF",{ BFD_RELOC_386_TLS_IE,
5463                     0                         },
5464       OPERAND_TYPE_NONE },
5465     { "GOT",      { BFD_RELOC_386_GOT32,
5466                     BFD_RELOC_X86_64_GOT32    },
5467       OPERAND_TYPE_IMM32_32S_64_DISP32 },
5468     { "TLSDESC",  { BFD_RELOC_386_TLS_GOTDESC,
5469                     BFD_RELOC_X86_64_GOTPC32_TLSDESC },
5470       OPERAND_TYPE_IMM32_32S_DISP32 },
5471     { "TLSCALL",  { BFD_RELOC_386_TLS_DESC_CALL,
5472                     BFD_RELOC_X86_64_TLSDESC_CALL },
5473       OPERAND_TYPE_IMM32_32S_DISP32 },
5474   };
5475   char *cp;
5476   unsigned int j;
5477
5478   if (!IS_ELF)
5479     return NULL;
5480
5481   for (cp = input_line_pointer; *cp != '@'; cp++)
5482     if (is_end_of_line[(unsigned char) *cp] || *cp == ',')
5483       return NULL;
5484
5485   for (j = 0; j < sizeof (gotrel) / sizeof (gotrel[0]); j++)
5486     {
5487       int len;
5488
5489       len = strlen (gotrel[j].str);
5490       if (strncasecmp (cp + 1, gotrel[j].str, len) == 0)
5491         {
5492           if (gotrel[j].rel[object_64bit] != 0)
5493             {
5494               int first, second;
5495               char *tmpbuf, *past_reloc;
5496
5497               *reloc = gotrel[j].rel[object_64bit];
5498               if (adjust)
5499                 *adjust = len;
5500
5501               if (types)
5502                 {
5503                   if (flag_code != CODE_64BIT)
5504                     {
5505                       types->bitfield.imm32 = 1;
5506                       types->bitfield.disp32 = 1;
5507                     }
5508                   else
5509                     *types = gotrel[j].types64;
5510                 }
5511
5512               if (GOT_symbol == NULL)
5513                 GOT_symbol = symbol_find_or_make (GLOBAL_OFFSET_TABLE_NAME);
5514
5515               /* The length of the first part of our input line.  */
5516               first = cp - input_line_pointer;
5517
5518               /* The second part goes from after the reloc token until
5519                  (and including) an end_of_line char or comma.  */
5520               past_reloc = cp + 1 + len;
5521               cp = past_reloc;
5522               while (!is_end_of_line[(unsigned char) *cp] && *cp != ',')
5523                 ++cp;
5524               second = cp + 1 - past_reloc;
5525
5526               /* Allocate and copy string.  The trailing NUL shouldn't
5527                  be necessary, but be safe.  */
5528               tmpbuf = xmalloc (first + second + 2);
5529               memcpy (tmpbuf, input_line_pointer, first);
5530               if (second != 0 && *past_reloc != ' ')
5531                 /* Replace the relocation token with ' ', so that
5532                    errors like foo@GOTOFF1 will be detected.  */
5533                 tmpbuf[first++] = ' ';
5534               memcpy (tmpbuf + first, past_reloc, second);
5535               tmpbuf[first + second] = '\0';
5536               return tmpbuf;
5537             }
5538
5539           as_bad (_("@%s reloc is not supported with %d-bit output format"),
5540                   gotrel[j].str, 1 << (5 + object_64bit));
5541           return NULL;
5542         }
5543     }
5544
5545   /* Might be a symbol version string.  Don't as_bad here.  */
5546   return NULL;
5547 }
5548
5549 void
5550 x86_cons (expressionS *exp, int size)
5551 {
5552   if (size == 4 || (object_64bit && size == 8))
5553     {
5554       /* Handle @GOTOFF and the like in an expression.  */
5555       char *save;
5556       char *gotfree_input_line;
5557       int adjust;
5558
5559       save = input_line_pointer;
5560       gotfree_input_line = lex_got (&got_reloc, &adjust, NULL);
5561       if (gotfree_input_line)
5562         input_line_pointer = gotfree_input_line;
5563
5564       expression (exp);
5565
5566       if (gotfree_input_line)
5567         {
5568           /* expression () has merrily parsed up to the end of line,
5569              or a comma - in the wrong buffer.  Transfer how far
5570              input_line_pointer has moved to the right buffer.  */
5571           input_line_pointer = (save
5572                                 + (input_line_pointer - gotfree_input_line)
5573                                 + adjust);
5574           free (gotfree_input_line);
5575           if (exp->X_op == O_constant
5576               || exp->X_op == O_absent
5577               || exp->X_op == O_illegal
5578               || exp->X_op == O_register
5579               || exp->X_op == O_big)
5580             {
5581               char c = *input_line_pointer;
5582               *input_line_pointer = 0;
5583               as_bad (_("missing or invalid expression `%s'"), save);
5584               *input_line_pointer = c;
5585             }
5586         }
5587     }
5588   else
5589     expression (exp);
5590 }
5591 #endif
5592
5593 static void signed_cons (int size)
5594 {
5595   if (flag_code == CODE_64BIT)
5596     cons_sign = 1;
5597   cons (size);
5598   cons_sign = -1;
5599 }
5600
5601 #ifdef TE_PE
5602 static void
5603 pe_directive_secrel (dummy)
5604      int dummy ATTRIBUTE_UNUSED;
5605 {
5606   expressionS exp;
5607
5608   do
5609     {
5610       expression (&exp);
5611       if (exp.X_op == O_symbol)
5612         exp.X_op = O_secrel;
5613
5614       emit_expr (&exp, 4);
5615     }
5616   while (*input_line_pointer++ == ',');
5617
5618   input_line_pointer--;
5619   demand_empty_rest_of_line ();
5620 }
5621 #endif
5622
5623 static int
5624 i386_immediate (char *imm_start)
5625 {
5626   char *save_input_line_pointer;
5627   char *gotfree_input_line;
5628   segT exp_seg = 0;
5629   expressionS *exp;
5630   i386_operand_type types;
5631
5632   UINTS_SET (types, ~0);
5633
5634   if (i.imm_operands == MAX_IMMEDIATE_OPERANDS)
5635     {
5636       as_bad (_("at most %d immediate operands are allowed"),
5637               MAX_IMMEDIATE_OPERANDS);
5638       return 0;
5639     }
5640
5641   exp = &im_expressions[i.imm_operands++];
5642   i.op[this_operand].imms = exp;
5643
5644   if (is_space_char (*imm_start))
5645     ++imm_start;
5646
5647   save_input_line_pointer = input_line_pointer;
5648   input_line_pointer = imm_start;
5649
5650   gotfree_input_line = lex_got (&i.reloc[this_operand], NULL, &types);
5651   if (gotfree_input_line)
5652     input_line_pointer = gotfree_input_line;
5653
5654   exp_seg = expression (exp);
5655
5656   SKIP_WHITESPACE ();
5657   if (*input_line_pointer)
5658     as_bad (_("junk `%s' after expression"), input_line_pointer);
5659
5660   input_line_pointer = save_input_line_pointer;
5661   if (gotfree_input_line)
5662     free (gotfree_input_line);
5663
5664   if (exp->X_op == O_absent
5665       || exp->X_op == O_illegal
5666       || exp->X_op == O_big
5667       || (gotfree_input_line
5668           && (exp->X_op == O_constant
5669               || exp->X_op == O_register)))
5670     {
5671       as_bad (_("missing or invalid immediate expression `%s'"),
5672               imm_start);
5673       return 0;
5674     }
5675   else if (exp->X_op == O_constant)
5676     {
5677       /* Size it properly later.  */
5678       i.types[this_operand].bitfield.imm64 = 1;
5679       /* If BFD64, sign extend val.  */
5680       if (!use_rela_relocations
5681           && (exp->X_add_number & ~(((addressT) 2 << 31) - 1)) == 0)
5682         exp->X_add_number
5683           = (exp->X_add_number ^ ((addressT) 1 << 31)) - ((addressT) 1 << 31);
5684     }
5685 #if (defined (OBJ_AOUT) || defined (OBJ_MAYBE_AOUT))
5686   else if (OUTPUT_FLAVOR == bfd_target_aout_flavour
5687            && exp_seg != absolute_section
5688            && exp_seg != text_section
5689            && exp_seg != data_section
5690            && exp_seg != bss_section
5691            && exp_seg != undefined_section
5692            && !bfd_is_com_section (exp_seg))
5693     {
5694       as_bad (_("unimplemented segment %s in operand"), exp_seg->name);
5695       return 0;
5696     }
5697 #endif
5698   else if (!intel_syntax && exp->X_op == O_register)
5699     {
5700       as_bad (_("illegal immediate register operand %s"), imm_start);
5701       return 0;
5702     }
5703   else
5704     {
5705       /* This is an address.  The size of the address will be
5706          determined later, depending on destination register,
5707          suffix, or the default for the section.  */
5708       i.types[this_operand].bitfield.imm8 = 1;
5709       i.types[this_operand].bitfield.imm16 = 1;
5710       i.types[this_operand].bitfield.imm32 = 1;
5711       i.types[this_operand].bitfield.imm32s = 1;
5712       i.types[this_operand].bitfield.imm64 = 1;
5713       i.types[this_operand] = operand_type_and (i.types[this_operand],
5714                                                 types);
5715     }
5716
5717   return 1;
5718 }
5719
5720 static char *
5721 i386_scale (char *scale)
5722 {
5723   offsetT val;
5724   char *save = input_line_pointer;
5725
5726   input_line_pointer = scale;
5727   val = get_absolute_expression ();
5728
5729   switch (val)
5730     {
5731     case 1:
5732       i.log2_scale_factor = 0;
5733       break;
5734     case 2:
5735       i.log2_scale_factor = 1;
5736       break;
5737     case 4:
5738       i.log2_scale_factor = 2;
5739       break;
5740     case 8:
5741       i.log2_scale_factor = 3;
5742       break;
5743     default:
5744       {
5745         char sep = *input_line_pointer;
5746
5747         *input_line_pointer = '\0';
5748         as_bad (_("expecting scale factor of 1, 2, 4, or 8: got `%s'"),
5749                 scale);
5750         *input_line_pointer = sep;
5751         input_line_pointer = save;
5752         return NULL;
5753       }
5754     }
5755   if (i.log2_scale_factor != 0 && i.index_reg == 0)
5756     {
5757       as_warn (_("scale factor of %d without an index register"),
5758                1 << i.log2_scale_factor);
5759       i.log2_scale_factor = 0;
5760     }
5761   scale = input_line_pointer;
5762   input_line_pointer = save;
5763   return scale;
5764 }
5765
5766 static int
5767 i386_displacement (char *disp_start, char *disp_end)
5768 {
5769   expressionS *exp;
5770   segT exp_seg = 0;
5771   char *save_input_line_pointer;
5772   char *gotfree_input_line;
5773   int override;
5774   i386_operand_type bigdisp, types = anydisp;
5775   int ret;
5776
5777   if (i.disp_operands == MAX_MEMORY_OPERANDS)
5778     {
5779       as_bad (_("at most %d displacement operands are allowed"),
5780               MAX_MEMORY_OPERANDS);
5781       return 0;
5782     }
5783
5784   UINTS_CLEAR (bigdisp);
5785   if ((i.types[this_operand].bitfield.jumpabsolute)
5786       || (!current_templates->start->opcode_modifier.jump
5787           && !current_templates->start->opcode_modifier.jumpdword))
5788     {
5789       bigdisp.bitfield.disp32 = 1;
5790       override = (i.prefix[ADDR_PREFIX] != 0);
5791       if (flag_code == CODE_64BIT)
5792         {
5793           if (!override)
5794             {
5795               bigdisp.bitfield.disp32s = 1;
5796               bigdisp.bitfield.disp64 = 1;
5797             }
5798         }
5799       else if ((flag_code == CODE_16BIT) ^ override)
5800         {
5801           bigdisp.bitfield.disp32 = 0;
5802           bigdisp.bitfield.disp16 = 1;
5803         }
5804     }
5805   else
5806     {
5807       /* For PC-relative branches, the width of the displacement
5808          is dependent upon data size, not address size.  */
5809       override = (i.prefix[DATA_PREFIX] != 0);
5810       if (flag_code == CODE_64BIT)
5811         {
5812           if (override || i.suffix == WORD_MNEM_SUFFIX)
5813             bigdisp.bitfield.disp16 = 1;
5814           else
5815             {
5816               bigdisp.bitfield.disp32 = 1;
5817               bigdisp.bitfield.disp32s = 1;
5818             }
5819         }
5820       else
5821         {
5822           if (!override)
5823             override = (i.suffix == (flag_code != CODE_16BIT
5824                                      ? WORD_MNEM_SUFFIX
5825                                      : LONG_MNEM_SUFFIX));
5826           bigdisp.bitfield.disp32 = 1;
5827           if ((flag_code == CODE_16BIT) ^ override)
5828             {
5829               bigdisp.bitfield.disp32 = 0;
5830               bigdisp.bitfield.disp16 = 1;
5831             }
5832         }
5833     }
5834   i.types[this_operand] = operand_type_or (i.types[this_operand],
5835                                            bigdisp);
5836
5837   exp = &disp_expressions[i.disp_operands];
5838   i.op[this_operand].disps = exp;
5839   i.disp_operands++;
5840   save_input_line_pointer = input_line_pointer;
5841   input_line_pointer = disp_start;
5842   END_STRING_AND_SAVE (disp_end);
5843
5844 #ifndef GCC_ASM_O_HACK
5845 #define GCC_ASM_O_HACK 0
5846 #endif
5847 #if GCC_ASM_O_HACK
5848   END_STRING_AND_SAVE (disp_end + 1);
5849   if (i.types[this_operand].bitfield.baseIndex
5850       && displacement_string_end[-1] == '+')
5851     {
5852       /* This hack is to avoid a warning when using the "o"
5853          constraint within gcc asm statements.
5854          For instance:
5855
5856          #define _set_tssldt_desc(n,addr,limit,type) \
5857          __asm__ __volatile__ ( \
5858          "movw %w2,%0\n\t" \
5859          "movw %w1,2+%0\n\t" \
5860          "rorl $16,%1\n\t" \
5861          "movb %b1,4+%0\n\t" \
5862          "movb %4,5+%0\n\t" \
5863          "movb $0,6+%0\n\t" \
5864          "movb %h1,7+%0\n\t" \
5865          "rorl $16,%1" \
5866          : "=o"(*(n)) : "q" (addr), "ri"(limit), "i"(type))
5867
5868          This works great except that the output assembler ends
5869          up looking a bit weird if it turns out that there is
5870          no offset.  You end up producing code that looks like:
5871
5872          #APP
5873          movw $235,(%eax)
5874          movw %dx,2+(%eax)
5875          rorl $16,%edx
5876          movb %dl,4+(%eax)
5877          movb $137,5+(%eax)
5878          movb $0,6+(%eax)
5879          movb %dh,7+(%eax)
5880          rorl $16,%edx
5881          #NO_APP
5882
5883          So here we provide the missing zero.  */
5884
5885       *displacement_string_end = '0';
5886     }
5887 #endif
5888   gotfree_input_line = lex_got (&i.reloc[this_operand], NULL, &types);
5889   if (gotfree_input_line)
5890     input_line_pointer = gotfree_input_line;
5891
5892   exp_seg = expression (exp);
5893
5894   SKIP_WHITESPACE ();
5895   if (*input_line_pointer)
5896     as_bad (_("junk `%s' after expression"), input_line_pointer);
5897 #if GCC_ASM_O_HACK
5898   RESTORE_END_STRING (disp_end + 1);
5899 #endif
5900   input_line_pointer = save_input_line_pointer;
5901   if (gotfree_input_line)
5902     free (gotfree_input_line);
5903   ret = 1;
5904
5905   /* We do this to make sure that the section symbol is in
5906      the symbol table.  We will ultimately change the relocation
5907      to be relative to the beginning of the section.  */
5908   if (i.reloc[this_operand] == BFD_RELOC_386_GOTOFF
5909       || i.reloc[this_operand] == BFD_RELOC_X86_64_GOTPCREL
5910       || i.reloc[this_operand] == BFD_RELOC_X86_64_GOTOFF64)
5911     {
5912       if (exp->X_op != O_symbol)
5913         goto inv_disp;
5914
5915       if (S_IS_LOCAL (exp->X_add_symbol)
5916           && S_GET_SEGMENT (exp->X_add_symbol) != undefined_section)
5917         section_symbol (S_GET_SEGMENT (exp->X_add_symbol));
5918       exp->X_op = O_subtract;
5919       exp->X_op_symbol = GOT_symbol;
5920       if (i.reloc[this_operand] == BFD_RELOC_X86_64_GOTPCREL)
5921         i.reloc[this_operand] = BFD_RELOC_32_PCREL;
5922       else if (i.reloc[this_operand] == BFD_RELOC_X86_64_GOTOFF64)
5923         i.reloc[this_operand] = BFD_RELOC_64;
5924       else
5925         i.reloc[this_operand] = BFD_RELOC_32;
5926     }
5927
5928   else if (exp->X_op == O_absent
5929            || exp->X_op == O_illegal
5930            || exp->X_op == O_big
5931            || (gotfree_input_line
5932                && (exp->X_op == O_constant
5933                    || exp->X_op == O_register)))
5934     {
5935     inv_disp:
5936       as_bad (_("missing or invalid displacement expression `%s'"),
5937               disp_start);
5938       ret = 0;
5939     }
5940
5941 #if (defined (OBJ_AOUT) || defined (OBJ_MAYBE_AOUT))
5942   else if (exp->X_op != O_constant
5943            && OUTPUT_FLAVOR == bfd_target_aout_flavour
5944            && exp_seg != absolute_section
5945            && exp_seg != text_section
5946            && exp_seg != data_section
5947            && exp_seg != bss_section
5948            && exp_seg != undefined_section
5949            && !bfd_is_com_section (exp_seg))
5950     {
5951       as_bad (_("unimplemented segment %s in operand"), exp_seg->name);
5952       ret = 0;
5953     }
5954 #endif
5955
5956   RESTORE_END_STRING (disp_end);
5957
5958   /* Check if this is a displacement only operand.  */
5959   bigdisp = i.types[this_operand];
5960   bigdisp.bitfield.disp8 = 0;
5961   bigdisp.bitfield.disp16 = 0;
5962   bigdisp.bitfield.disp32 = 0;
5963   bigdisp.bitfield.disp32s = 0;
5964   bigdisp.bitfield.disp64 = 0;
5965   if (UINTS_ALL_ZERO (bigdisp))
5966     i.types[this_operand] = operand_type_and (i.types[this_operand],
5967                                               types);
5968
5969   return ret;
5970 }
5971
5972 /* Make sure the memory operand we've been dealt is valid.
5973    Return 1 on success, 0 on a failure.  */
5974
5975 static int
5976 i386_index_check (const char *operand_string)
5977 {
5978   int ok;
5979 #if INFER_ADDR_PREFIX
5980   int fudged = 0;
5981
5982  tryprefix:
5983 #endif
5984   ok = 1;
5985   if (flag_code == CODE_64BIT)
5986     {
5987       if ((i.base_reg
5988            && ((i.prefix[ADDR_PREFIX] == 0
5989                 && !i.base_reg->reg_type.bitfield.reg64)
5990                || (i.prefix[ADDR_PREFIX]
5991                    && !i.base_reg->reg_type.bitfield.reg32))
5992            && (i.index_reg
5993                || i.base_reg->reg_num !=
5994                   (i.prefix[ADDR_PREFIX] == 0 ? RegRip : RegEip)))
5995           || (i.index_reg
5996               && (!i.index_reg->reg_type.bitfield.baseindex
5997                   || (i.prefix[ADDR_PREFIX] == 0
5998                       && i.index_reg->reg_num != RegRiz
5999                       && !i.index_reg->reg_type.bitfield.reg64
6000                       )
6001                   || (i.prefix[ADDR_PREFIX]
6002                       && i.index_reg->reg_num != RegEiz
6003                       && !i.index_reg->reg_type.bitfield.reg32))))
6004         ok = 0;
6005     }
6006   else
6007     {
6008       if ((flag_code == CODE_16BIT) ^ (i.prefix[ADDR_PREFIX] != 0))
6009         {
6010           /* 16bit checks.  */
6011           if ((i.base_reg
6012                && (!i.base_reg->reg_type.bitfield.reg16
6013                    || !i.base_reg->reg_type.bitfield.baseindex))
6014               || (i.index_reg
6015                   && (!i.index_reg->reg_type.bitfield.reg16
6016                       || !i.index_reg->reg_type.bitfield.baseindex
6017                       || !(i.base_reg
6018                            && i.base_reg->reg_num < 6
6019                            && i.index_reg->reg_num >= 6
6020                            && i.log2_scale_factor == 0))))
6021             ok = 0;
6022         }
6023       else
6024         {
6025           /* 32bit checks.  */
6026           if ((i.base_reg
6027                && !i.base_reg->reg_type.bitfield.reg32)
6028               || (i.index_reg
6029                   && ((!i.index_reg->reg_type.bitfield.reg32
6030                        && i.index_reg->reg_num != RegEiz)
6031                       || !i.index_reg->reg_type.bitfield.baseindex)))
6032             ok = 0;
6033         }
6034     }
6035   if (!ok)
6036     {
6037 #if INFER_ADDR_PREFIX
6038       if (i.prefix[ADDR_PREFIX] == 0)
6039         {
6040           i.prefix[ADDR_PREFIX] = ADDR_PREFIX_OPCODE;
6041           i.prefixes += 1;
6042           /* Change the size of any displacement too.  At most one of
6043              Disp16 or Disp32 is set.
6044              FIXME.  There doesn't seem to be any real need for separate
6045              Disp16 and Disp32 flags.  The same goes for Imm16 and Imm32.
6046              Removing them would probably clean up the code quite a lot.  */
6047           if (flag_code != CODE_64BIT
6048               && (i.types[this_operand].bitfield.disp16
6049                   || i.types[this_operand].bitfield.disp32))
6050             i.types[this_operand]
6051               = operand_type_xor (i.types[this_operand], disp16_32);
6052           fudged = 1;
6053           goto tryprefix;
6054         }
6055       if (fudged)
6056         as_bad (_("`%s' is not a valid base/index expression"),
6057                 operand_string);
6058       else
6059 #endif
6060         as_bad (_("`%s' is not a valid %s bit base/index expression"),
6061                 operand_string,
6062                 flag_code_names[flag_code]);
6063     }
6064   return ok;
6065 }
6066
6067 /* Parse OPERAND_STRING into the i386_insn structure I.  Returns non-zero
6068    on error.  */
6069
6070 static int
6071 i386_operand (char *operand_string)
6072 {
6073   const reg_entry *r;
6074   char *end_op;
6075   char *op_string = operand_string;
6076
6077   if (is_space_char (*op_string))
6078     ++op_string;
6079
6080   /* We check for an absolute prefix (differentiating,
6081      for example, 'jmp pc_relative_label' from 'jmp *absolute_label'.  */
6082   if (*op_string == ABSOLUTE_PREFIX)
6083     {
6084       ++op_string;
6085       if (is_space_char (*op_string))
6086         ++op_string;
6087       i.types[this_operand].bitfield.jumpabsolute = 1;
6088     }
6089
6090   /* Check if operand is a register.  */
6091   if ((r = parse_register (op_string, &end_op)) != NULL)
6092     {
6093       i386_operand_type temp;
6094
6095       /* Check for a segment override by searching for ':' after a
6096          segment register.  */
6097       op_string = end_op;
6098       if (is_space_char (*op_string))
6099         ++op_string;
6100       if (*op_string == ':'
6101           && (r->reg_type.bitfield.sreg2
6102               || r->reg_type.bitfield.sreg3))
6103         {
6104           switch (r->reg_num)
6105             {
6106             case 0:
6107               i.seg[i.mem_operands] = &es;
6108               break;
6109             case 1:
6110               i.seg[i.mem_operands] = &cs;
6111               break;
6112             case 2:
6113               i.seg[i.mem_operands] = &ss;
6114               break;
6115             case 3:
6116               i.seg[i.mem_operands] = &ds;
6117               break;
6118             case 4:
6119               i.seg[i.mem_operands] = &fs;
6120               break;
6121             case 5:
6122               i.seg[i.mem_operands] = &gs;
6123               break;
6124             }
6125
6126           /* Skip the ':' and whitespace.  */
6127           ++op_string;
6128           if (is_space_char (*op_string))
6129             ++op_string;
6130
6131           if (!is_digit_char (*op_string)
6132               && !is_identifier_char (*op_string)
6133               && *op_string != '('
6134               && *op_string != ABSOLUTE_PREFIX)
6135             {
6136               as_bad (_("bad memory operand `%s'"), op_string);
6137               return 0;
6138             }
6139           /* Handle case of %es:*foo.  */
6140           if (*op_string == ABSOLUTE_PREFIX)
6141             {
6142               ++op_string;
6143               if (is_space_char (*op_string))
6144                 ++op_string;
6145               i.types[this_operand].bitfield.jumpabsolute = 1;
6146             }
6147           goto do_memory_reference;
6148         }
6149       if (*op_string)
6150         {
6151           as_bad (_("junk `%s' after register"), op_string);
6152           return 0;
6153         }
6154       temp = r->reg_type;
6155       temp.bitfield.baseindex = 0;
6156       i.types[this_operand] = operand_type_or (i.types[this_operand],
6157                                                temp);
6158       i.op[this_operand].regs = r;
6159       i.reg_operands++;
6160     }
6161   else if (*op_string == REGISTER_PREFIX)
6162     {
6163       as_bad (_("bad register name `%s'"), op_string);
6164       return 0;
6165     }
6166   else if (*op_string == IMMEDIATE_PREFIX)
6167     {
6168       ++op_string;
6169       if (i.types[this_operand].bitfield.jumpabsolute)
6170         {
6171           as_bad (_("immediate operand illegal with absolute jump"));
6172           return 0;
6173         }
6174       if (!i386_immediate (op_string))
6175         return 0;
6176     }
6177   else if (is_digit_char (*op_string)
6178            || is_identifier_char (*op_string)
6179            || *op_string == '(')
6180     {
6181       /* This is a memory reference of some sort.  */
6182       char *base_string;
6183
6184       /* Start and end of displacement string expression (if found).  */
6185       char *displacement_string_start;
6186       char *displacement_string_end;
6187
6188     do_memory_reference:
6189       if ((i.mem_operands == 1
6190            && !current_templates->start->opcode_modifier.isstring)
6191           || i.mem_operands == 2)
6192         {
6193           as_bad (_("too many memory references for `%s'"),
6194                   current_templates->start->name);
6195           return 0;
6196         }
6197
6198       /* Check for base index form.  We detect the base index form by
6199          looking for an ')' at the end of the operand, searching
6200          for the '(' matching it, and finding a REGISTER_PREFIX or ','
6201          after the '('.  */
6202       base_string = op_string + strlen (op_string);
6203
6204       --base_string;
6205       if (is_space_char (*base_string))
6206         --base_string;
6207
6208       /* If we only have a displacement, set-up for it to be parsed later.  */
6209       displacement_string_start = op_string;
6210       displacement_string_end = base_string + 1;
6211
6212       if (*base_string == ')')
6213         {
6214           char *temp_string;
6215           unsigned int parens_balanced = 1;
6216           /* We've already checked that the number of left & right ()'s are
6217              equal, so this loop will not be infinite.  */
6218           do
6219             {
6220               base_string--;
6221               if (*base_string == ')')
6222                 parens_balanced++;
6223               if (*base_string == '(')
6224                 parens_balanced--;
6225             }
6226           while (parens_balanced);
6227
6228           temp_string = base_string;
6229
6230           /* Skip past '(' and whitespace.  */
6231           ++base_string;
6232           if (is_space_char (*base_string))
6233             ++base_string;
6234
6235           if (*base_string == ','
6236               || ((i.base_reg = parse_register (base_string, &end_op))
6237                   != NULL))
6238             {
6239               displacement_string_end = temp_string;
6240
6241               i.types[this_operand].bitfield.baseindex = 1;
6242
6243               if (i.base_reg)
6244                 {
6245                   base_string = end_op;
6246                   if (is_space_char (*base_string))
6247                     ++base_string;
6248                 }
6249
6250               /* There may be an index reg or scale factor here.  */
6251               if (*base_string == ',')
6252                 {
6253                   ++base_string;
6254                   if (is_space_char (*base_string))
6255                     ++base_string;
6256
6257                   if ((i.index_reg = parse_register (base_string, &end_op))
6258                       != NULL)
6259                     {
6260                       base_string = end_op;
6261                       if (is_space_char (*base_string))
6262                         ++base_string;
6263                       if (*base_string == ',')
6264                         {
6265                           ++base_string;
6266                           if (is_space_char (*base_string))
6267                             ++base_string;
6268                         }
6269                       else if (*base_string != ')')
6270                         {
6271                           as_bad (_("expecting `,' or `)' "
6272                                     "after index register in `%s'"),
6273                                   operand_string);
6274                           return 0;
6275                         }
6276                     }
6277                   else if (*base_string == REGISTER_PREFIX)
6278                     {
6279                       as_bad (_("bad register name `%s'"), base_string);
6280                       return 0;
6281                     }
6282
6283                   /* Check for scale factor.  */
6284                   if (*base_string != ')')
6285                     {
6286                       char *end_scale = i386_scale (base_string);
6287
6288                       if (!end_scale)
6289                         return 0;
6290
6291                       base_string = end_scale;
6292                       if (is_space_char (*base_string))
6293                         ++base_string;
6294                       if (*base_string != ')')
6295                         {
6296                           as_bad (_("expecting `)' "
6297                                     "after scale factor in `%s'"),
6298                                   operand_string);
6299                           return 0;
6300                         }
6301                     }
6302                   else if (!i.index_reg)
6303                     {
6304                       as_bad (_("expecting index register or scale factor "
6305                                 "after `,'; got '%c'"),
6306                               *base_string);
6307                       return 0;
6308                     }
6309                 }
6310               else if (*base_string != ')')
6311                 {
6312                   as_bad (_("expecting `,' or `)' "
6313                             "after base register in `%s'"),
6314                           operand_string);
6315                   return 0;
6316                 }
6317             }
6318           else if (*base_string == REGISTER_PREFIX)
6319             {
6320               as_bad (_("bad register name `%s'"), base_string);
6321               return 0;
6322             }
6323         }
6324
6325       /* If there's an expression beginning the operand, parse it,
6326          assuming displacement_string_start and
6327          displacement_string_end are meaningful.  */
6328       if (displacement_string_start != displacement_string_end)
6329         {
6330           if (!i386_displacement (displacement_string_start,
6331                                   displacement_string_end))
6332             return 0;
6333         }
6334
6335       /* Special case for (%dx) while doing input/output op.  */
6336       if (i.base_reg
6337           && UINTS_EQUAL (i.base_reg->reg_type, reg16_inoutportreg)
6338           && i.index_reg == 0
6339           && i.log2_scale_factor == 0
6340           && i.seg[i.mem_operands] == 0
6341           && !operand_type_check (i.types[this_operand], disp))
6342         {
6343           UINTS_CLEAR (i.types[this_operand]);
6344           i.types[this_operand].bitfield.inoutportreg = 1;
6345           return 1;
6346         }
6347
6348       if (i386_index_check (operand_string) == 0)
6349         return 0;
6350       i.mem_operands++;
6351     }
6352   else
6353     {
6354       /* It's not a memory operand; argh!  */
6355       as_bad (_("invalid char %s beginning operand %d `%s'"),
6356               output_invalid (*op_string),
6357               this_operand + 1,
6358               op_string);
6359       return 0;
6360     }
6361   return 1;                     /* Normal return.  */
6362 }
6363 \f
6364 /* md_estimate_size_before_relax()
6365
6366    Called just before relax() for rs_machine_dependent frags.  The x86
6367    assembler uses these frags to handle variable size jump
6368    instructions.
6369
6370    Any symbol that is now undefined will not become defined.
6371    Return the correct fr_subtype in the frag.
6372    Return the initial "guess for variable size of frag" to caller.
6373    The guess is actually the growth beyond the fixed part.  Whatever
6374    we do to grow the fixed or variable part contributes to our
6375    returned value.  */
6376
6377 int
6378 md_estimate_size_before_relax (fragP, segment)
6379      fragS *fragP;
6380      segT segment;
6381 {
6382   /* We've already got fragP->fr_subtype right;  all we have to do is
6383      check for un-relaxable symbols.  On an ELF system, we can't relax
6384      an externally visible symbol, because it may be overridden by a
6385      shared library.  */
6386   if (S_GET_SEGMENT (fragP->fr_symbol) != segment
6387 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
6388       || (IS_ELF
6389           && (S_IS_EXTERNAL (fragP->fr_symbol)
6390               || S_IS_WEAK (fragP->fr_symbol)))
6391 #endif
6392       )
6393     {
6394       /* Symbol is undefined in this segment, or we need to keep a
6395          reloc so that weak symbols can be overridden.  */
6396       int size = (fragP->fr_subtype & CODE16) ? 2 : 4;
6397       enum bfd_reloc_code_real reloc_type;
6398       unsigned char *opcode;
6399       int old_fr_fix;
6400
6401       if (fragP->fr_var != NO_RELOC)
6402         reloc_type = fragP->fr_var;
6403       else if (size == 2)
6404         reloc_type = BFD_RELOC_16_PCREL;
6405       else
6406         reloc_type = BFD_RELOC_32_PCREL;
6407
6408       old_fr_fix = fragP->fr_fix;
6409       opcode = (unsigned char *) fragP->fr_opcode;
6410
6411       switch (TYPE_FROM_RELAX_STATE (fragP->fr_subtype))
6412         {
6413         case UNCOND_JUMP:
6414           /* Make jmp (0xeb) a (d)word displacement jump.  */
6415           opcode[0] = 0xe9;
6416           fragP->fr_fix += size;
6417           fix_new (fragP, old_fr_fix, size,
6418                    fragP->fr_symbol,
6419                    fragP->fr_offset, 1,
6420                    reloc_type);
6421           break;
6422
6423         case COND_JUMP86:
6424           if (size == 2
6425               && (!no_cond_jump_promotion || fragP->fr_var != NO_RELOC))
6426             {
6427               /* Negate the condition, and branch past an
6428                  unconditional jump.  */
6429               opcode[0] ^= 1;
6430               opcode[1] = 3;
6431               /* Insert an unconditional jump.  */
6432               opcode[2] = 0xe9;
6433               /* We added two extra opcode bytes, and have a two byte
6434                  offset.  */
6435               fragP->fr_fix += 2 + 2;
6436               fix_new (fragP, old_fr_fix + 2, 2,
6437                        fragP->fr_symbol,
6438                        fragP->fr_offset, 1,
6439                        reloc_type);
6440               break;
6441             }
6442           /* Fall through.  */
6443
6444         case COND_JUMP:
6445           if (no_cond_jump_promotion && fragP->fr_var == NO_RELOC)
6446             {
6447               fixS *fixP;
6448
6449               fragP->fr_fix += 1;
6450               fixP = fix_new (fragP, old_fr_fix, 1,
6451                               fragP->fr_symbol,
6452                               fragP->fr_offset, 1,
6453                               BFD_RELOC_8_PCREL);
6454               fixP->fx_signed = 1;
6455               break;
6456             }
6457
6458           /* This changes the byte-displacement jump 0x7N
6459              to the (d)word-displacement jump 0x0f,0x8N.  */
6460           opcode[1] = opcode[0] + 0x10;
6461           opcode[0] = TWO_BYTE_OPCODE_ESCAPE;
6462           /* We've added an opcode byte.  */
6463           fragP->fr_fix += 1 + size;
6464           fix_new (fragP, old_fr_fix + 1, size,
6465                    fragP->fr_symbol,
6466                    fragP->fr_offset, 1,
6467                    reloc_type);
6468           break;
6469
6470         default:
6471           BAD_CASE (fragP->fr_subtype);
6472           break;
6473         }
6474       frag_wane (fragP);
6475       return fragP->fr_fix - old_fr_fix;
6476     }
6477
6478   /* Guess size depending on current relax state.  Initially the relax
6479      state will correspond to a short jump and we return 1, because
6480      the variable part of the frag (the branch offset) is one byte
6481      long.  However, we can relax a section more than once and in that
6482      case we must either set fr_subtype back to the unrelaxed state,
6483      or return the value for the appropriate branch.  */
6484   return md_relax_table[fragP->fr_subtype].rlx_length;
6485 }
6486
6487 /* Called after relax() is finished.
6488
6489    In:  Address of frag.
6490         fr_type == rs_machine_dependent.
6491         fr_subtype is what the address relaxed to.
6492
6493    Out: Any fixSs and constants are set up.
6494         Caller will turn frag into a ".space 0".  */
6495
6496 void
6497 md_convert_frag (abfd, sec, fragP)
6498      bfd *abfd ATTRIBUTE_UNUSED;
6499      segT sec ATTRIBUTE_UNUSED;
6500      fragS *fragP;
6501 {
6502   unsigned char *opcode;
6503   unsigned char *where_to_put_displacement = NULL;
6504   offsetT target_address;
6505   offsetT opcode_address;
6506   unsigned int extension = 0;
6507   offsetT displacement_from_opcode_start;
6508
6509   opcode = (unsigned char *) fragP->fr_opcode;
6510
6511   /* Address we want to reach in file space.  */
6512   target_address = S_GET_VALUE (fragP->fr_symbol) + fragP->fr_offset;
6513
6514   /* Address opcode resides at in file space.  */
6515   opcode_address = fragP->fr_address + fragP->fr_fix;
6516
6517   /* Displacement from opcode start to fill into instruction.  */
6518   displacement_from_opcode_start = target_address - opcode_address;
6519
6520   if ((fragP->fr_subtype & BIG) == 0)
6521     {
6522       /* Don't have to change opcode.  */
6523       extension = 1;            /* 1 opcode + 1 displacement  */
6524       where_to_put_displacement = &opcode[1];
6525     }
6526   else
6527     {
6528       if (no_cond_jump_promotion
6529           && TYPE_FROM_RELAX_STATE (fragP->fr_subtype) != UNCOND_JUMP)
6530         as_warn_where (fragP->fr_file, fragP->fr_line,
6531                        _("long jump required"));
6532
6533       switch (fragP->fr_subtype)
6534         {
6535         case ENCODE_RELAX_STATE (UNCOND_JUMP, BIG):
6536           extension = 4;                /* 1 opcode + 4 displacement  */
6537           opcode[0] = 0xe9;
6538           where_to_put_displacement = &opcode[1];
6539           break;
6540
6541         case ENCODE_RELAX_STATE (UNCOND_JUMP, BIG16):
6542           extension = 2;                /* 1 opcode + 2 displacement  */
6543           opcode[0] = 0xe9;
6544           where_to_put_displacement = &opcode[1];
6545           break;
6546
6547         case ENCODE_RELAX_STATE (COND_JUMP, BIG):
6548         case ENCODE_RELAX_STATE (COND_JUMP86, BIG):
6549           extension = 5;                /* 2 opcode + 4 displacement  */
6550           opcode[1] = opcode[0] + 0x10;
6551           opcode[0] = TWO_BYTE_OPCODE_ESCAPE;
6552           where_to_put_displacement = &opcode[2];
6553           break;
6554
6555         case ENCODE_RELAX_STATE (COND_JUMP, BIG16):
6556           extension = 3;                /* 2 opcode + 2 displacement  */
6557           opcode[1] = opcode[0] + 0x10;
6558           opcode[0] = TWO_BYTE_OPCODE_ESCAPE;
6559           where_to_put_displacement = &opcode[2];
6560           break;
6561
6562         case ENCODE_RELAX_STATE (COND_JUMP86, BIG16):
6563           extension = 4;
6564           opcode[0] ^= 1;
6565           opcode[1] = 3;
6566           opcode[2] = 0xe9;
6567           where_to_put_displacement = &opcode[3];
6568           break;
6569
6570         default:
6571           BAD_CASE (fragP->fr_subtype);
6572           break;
6573         }
6574     }
6575
6576   /* If size if less then four we are sure that the operand fits,
6577      but if it's 4, then it could be that the displacement is larger
6578      then -/+ 2GB.  */
6579   if (DISP_SIZE_FROM_RELAX_STATE (fragP->fr_subtype) == 4
6580       && object_64bit
6581       && ((addressT) (displacement_from_opcode_start - extension
6582                       + ((addressT) 1 << 31))
6583           > (((addressT) 2 << 31) - 1)))
6584     {
6585       as_bad_where (fragP->fr_file, fragP->fr_line,
6586                     _("jump target out of range"));
6587       /* Make us emit 0.  */
6588       displacement_from_opcode_start = extension;
6589     }
6590   /* Now put displacement after opcode.  */
6591   md_number_to_chars ((char *) where_to_put_displacement,
6592                       (valueT) (displacement_from_opcode_start - extension),
6593                       DISP_SIZE_FROM_RELAX_STATE (fragP->fr_subtype));
6594   fragP->fr_fix += extension;
6595 }
6596 \f
6597 /* Size of byte displacement jmp.  */
6598 int md_short_jump_size = 2;
6599
6600 /* Size of dword displacement jmp.  */
6601 int md_long_jump_size = 5;
6602
6603 void
6604 md_create_short_jump (ptr, from_addr, to_addr, frag, to_symbol)
6605      char *ptr;
6606      addressT from_addr, to_addr;
6607      fragS *frag ATTRIBUTE_UNUSED;
6608      symbolS *to_symbol ATTRIBUTE_UNUSED;
6609 {
6610   offsetT offset;
6611
6612   offset = to_addr - (from_addr + 2);
6613   /* Opcode for byte-disp jump.  */
6614   md_number_to_chars (ptr, (valueT) 0xeb, 1);
6615   md_number_to_chars (ptr + 1, (valueT) offset, 1);
6616 }
6617
6618 void
6619 md_create_long_jump (ptr, from_addr, to_addr, frag, to_symbol)
6620      char *ptr;
6621      addressT from_addr, to_addr;
6622      fragS *frag ATTRIBUTE_UNUSED;
6623      symbolS *to_symbol ATTRIBUTE_UNUSED;
6624 {
6625   offsetT offset;
6626
6627   offset = to_addr - (from_addr + 5);
6628   md_number_to_chars (ptr, (valueT) 0xe9, 1);
6629   md_number_to_chars (ptr + 1, (valueT) offset, 4);
6630 }
6631 \f
6632 /* Apply a fixup (fixS) to segment data, once it has been determined
6633    by our caller that we have all the info we need to fix it up.
6634
6635    On the 386, immediates, displacements, and data pointers are all in
6636    the same (little-endian) format, so we don't need to care about which
6637    we are handling.  */
6638
6639 void
6640 md_apply_fix (fixP, valP, seg)
6641      /* The fix we're to put in.  */
6642      fixS *fixP;
6643      /* Pointer to the value of the bits.  */
6644      valueT *valP;
6645      /* Segment fix is from.  */
6646      segT seg ATTRIBUTE_UNUSED;
6647 {
6648   char *p = fixP->fx_where + fixP->fx_frag->fr_literal;
6649   valueT value = *valP;
6650
6651 #if !defined (TE_Mach)
6652   if (fixP->fx_pcrel)
6653     {
6654       switch (fixP->fx_r_type)
6655         {
6656         default:
6657           break;
6658
6659         case BFD_RELOC_64:
6660           fixP->fx_r_type = BFD_RELOC_64_PCREL;
6661           break;
6662         case BFD_RELOC_32:
6663         case BFD_RELOC_X86_64_32S:
6664           fixP->fx_r_type = BFD_RELOC_32_PCREL;
6665           break;
6666         case BFD_RELOC_16:
6667           fixP->fx_r_type = BFD_RELOC_16_PCREL;
6668           break;
6669         case BFD_RELOC_8:
6670           fixP->fx_r_type = BFD_RELOC_8_PCREL;
6671           break;
6672         }
6673     }
6674
6675   if (fixP->fx_addsy != NULL
6676       && (fixP->fx_r_type == BFD_RELOC_32_PCREL
6677           || fixP->fx_r_type == BFD_RELOC_64_PCREL
6678           || fixP->fx_r_type == BFD_RELOC_16_PCREL
6679           || fixP->fx_r_type == BFD_RELOC_8_PCREL)
6680       && !use_rela_relocations)
6681     {
6682       /* This is a hack.  There should be a better way to handle this.
6683          This covers for the fact that bfd_install_relocation will
6684          subtract the current location (for partial_inplace, PC relative
6685          relocations); see more below.  */
6686 #ifndef OBJ_AOUT
6687       if (IS_ELF
6688 #ifdef TE_PE
6689           || OUTPUT_FLAVOR == bfd_target_coff_flavour
6690 #endif
6691           )
6692         value += fixP->fx_where + fixP->fx_frag->fr_address;
6693 #endif
6694 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
6695       if (IS_ELF)
6696         {
6697           segT sym_seg = S_GET_SEGMENT (fixP->fx_addsy);
6698
6699           if ((sym_seg == seg
6700                || (symbol_section_p (fixP->fx_addsy)
6701                    && sym_seg != absolute_section))
6702               && !generic_force_reloc (fixP))
6703             {
6704               /* Yes, we add the values in twice.  This is because
6705                  bfd_install_relocation subtracts them out again.  I think
6706                  bfd_install_relocation is broken, but I don't dare change
6707                  it.  FIXME.  */
6708               value += fixP->fx_where + fixP->fx_frag->fr_address;
6709             }
6710         }
6711 #endif
6712 #if defined (OBJ_COFF) && defined (TE_PE)
6713       /* For some reason, the PE format does not store a
6714          section address offset for a PC relative symbol.  */
6715       if (S_GET_SEGMENT (fixP->fx_addsy) != seg
6716           || S_IS_WEAK (fixP->fx_addsy))
6717         value += md_pcrel_from (fixP);
6718 #endif
6719     }
6720
6721   /* Fix a few things - the dynamic linker expects certain values here,
6722      and we must not disappoint it.  */
6723 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
6724   if (IS_ELF && fixP->fx_addsy)
6725     switch (fixP->fx_r_type)
6726       {
6727       case BFD_RELOC_386_PLT32:
6728       case BFD_RELOC_X86_64_PLT32:
6729         /* Make the jump instruction point to the address of the operand.  At
6730            runtime we merely add the offset to the actual PLT entry.  */
6731         value = -4;
6732         break;
6733
6734       case BFD_RELOC_386_TLS_GD:
6735       case BFD_RELOC_386_TLS_LDM:
6736       case BFD_RELOC_386_TLS_IE_32:
6737       case BFD_RELOC_386_TLS_IE:
6738       case BFD_RELOC_386_TLS_GOTIE:
6739       case BFD_RELOC_386_TLS_GOTDESC:
6740       case BFD_RELOC_X86_64_TLSGD:
6741       case BFD_RELOC_X86_64_TLSLD:
6742       case BFD_RELOC_X86_64_GOTTPOFF:
6743       case BFD_RELOC_X86_64_GOTPC32_TLSDESC:
6744         value = 0; /* Fully resolved at runtime.  No addend.  */
6745         /* Fallthrough */
6746       case BFD_RELOC_386_TLS_LE:
6747       case BFD_RELOC_386_TLS_LDO_32:
6748       case BFD_RELOC_386_TLS_LE_32:
6749       case BFD_RELOC_X86_64_DTPOFF32:
6750       case BFD_RELOC_X86_64_DTPOFF64:
6751       case BFD_RELOC_X86_64_TPOFF32:
6752       case BFD_RELOC_X86_64_TPOFF64:
6753         S_SET_THREAD_LOCAL (fixP->fx_addsy);
6754         break;
6755
6756       case BFD_RELOC_386_TLS_DESC_CALL:
6757       case BFD_RELOC_X86_64_TLSDESC_CALL:
6758         value = 0; /* Fully resolved at runtime.  No addend.  */
6759         S_SET_THREAD_LOCAL (fixP->fx_addsy);
6760         fixP->fx_done = 0;
6761         return;
6762
6763       case BFD_RELOC_386_GOT32:
6764       case BFD_RELOC_X86_64_GOT32:
6765         value = 0; /* Fully resolved at runtime.  No addend.  */
6766         break;
6767
6768       case BFD_RELOC_VTABLE_INHERIT:
6769       case BFD_RELOC_VTABLE_ENTRY:
6770         fixP->fx_done = 0;
6771         return;
6772
6773       default:
6774         break;
6775       }
6776 #endif /* defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)  */
6777   *valP = value;
6778 #endif /* !defined (TE_Mach)  */
6779
6780   /* Are we finished with this relocation now?  */
6781   if (fixP->fx_addsy == NULL)
6782     fixP->fx_done = 1;
6783   else if (use_rela_relocations)
6784     {
6785       fixP->fx_no_overflow = 1;
6786       /* Remember value for tc_gen_reloc.  */
6787       fixP->fx_addnumber = value;
6788       value = 0;
6789     }
6790
6791   md_number_to_chars (p, value, fixP->fx_size);
6792 }
6793 \f
6794 #define MAX_LITTLENUMS 6
6795
6796 /* Turn the string pointed to by litP into a floating point constant
6797    of type TYPE, and emit the appropriate bytes.  The number of
6798    LITTLENUMS emitted is stored in *SIZEP.  An error message is
6799    returned, or NULL on OK.  */
6800
6801 char *
6802 md_atof (type, litP, sizeP)
6803      int type;
6804      char *litP;
6805      int *sizeP;
6806 {
6807   int prec;
6808   LITTLENUM_TYPE words[MAX_LITTLENUMS];
6809   LITTLENUM_TYPE *wordP;
6810   char *t;
6811
6812   switch (type)
6813     {
6814     case 'f':
6815     case 'F':
6816       prec = 2;
6817       break;
6818
6819     case 'd':
6820     case 'D':
6821       prec = 4;
6822       break;
6823
6824     case 'x':
6825     case 'X':
6826       prec = 5;
6827       break;
6828
6829     default:
6830       *sizeP = 0;
6831       return _("Bad call to md_atof ()");
6832     }
6833   t = atof_ieee (input_line_pointer, type, words);
6834   if (t)
6835     input_line_pointer = t;
6836
6837   *sizeP = prec * sizeof (LITTLENUM_TYPE);
6838   /* This loops outputs the LITTLENUMs in REVERSE order; in accord with
6839      the bigendian 386.  */
6840   for (wordP = words + prec - 1; prec--;)
6841     {
6842       md_number_to_chars (litP, (valueT) (*wordP--), sizeof (LITTLENUM_TYPE));
6843       litP += sizeof (LITTLENUM_TYPE);
6844     }
6845   return 0;
6846 }
6847 \f
6848 static char output_invalid_buf[sizeof (unsigned char) * 2 + 6];
6849
6850 static char *
6851 output_invalid (int c)
6852 {
6853   if (ISPRINT (c))
6854     snprintf (output_invalid_buf, sizeof (output_invalid_buf),
6855               "'%c'", c);
6856   else
6857     snprintf (output_invalid_buf, sizeof (output_invalid_buf),
6858               "(0x%x)", (unsigned char) c);
6859   return output_invalid_buf;
6860 }
6861
6862 /* REG_STRING starts *before* REGISTER_PREFIX.  */
6863
6864 static const reg_entry *
6865 parse_real_register (char *reg_string, char **end_op)
6866 {
6867   char *s = reg_string;
6868   char *p;
6869   char reg_name_given[MAX_REG_NAME_SIZE + 1];
6870   const reg_entry *r;
6871
6872   /* Skip possible REGISTER_PREFIX and possible whitespace.  */
6873   if (*s == REGISTER_PREFIX)
6874     ++s;
6875
6876   if (is_space_char (*s))
6877     ++s;
6878
6879   p = reg_name_given;
6880   while ((*p++ = register_chars[(unsigned char) *s]) != '\0')
6881     {
6882       if (p >= reg_name_given + MAX_REG_NAME_SIZE)
6883         return (const reg_entry *) NULL;
6884       s++;
6885     }
6886
6887   /* For naked regs, make sure that we are not dealing with an identifier.
6888      This prevents confusing an identifier like `eax_var' with register
6889      `eax'.  */
6890   if (allow_naked_reg && identifier_chars[(unsigned char) *s])
6891     return (const reg_entry *) NULL;
6892
6893   *end_op = s;
6894
6895   r = (const reg_entry *) hash_find (reg_hash, reg_name_given);
6896
6897   /* Handle floating point regs, allowing spaces in the (i) part.  */
6898   if (r == i386_regtab /* %st is first entry of table  */)
6899     {
6900       if (is_space_char (*s))
6901         ++s;
6902       if (*s == '(')
6903         {
6904           ++s;
6905           if (is_space_char (*s))
6906             ++s;
6907           if (*s >= '0' && *s <= '7')
6908             {
6909               int fpr = *s - '0';
6910               ++s;
6911               if (is_space_char (*s))
6912                 ++s;
6913               if (*s == ')')
6914                 {
6915                   *end_op = s + 1;
6916                   r = hash_find (reg_hash, "st(0)");
6917                   know (r);
6918                   return r + fpr;
6919                 }
6920             }
6921           /* We have "%st(" then garbage.  */
6922           return (const reg_entry *) NULL;
6923         }
6924     }
6925
6926   /* Don't allow fake index register unless allow_index_reg isn't 0. */
6927   if (r != NULL
6928       && !allow_index_reg
6929       && (r->reg_num == RegEiz || r->reg_num == RegRiz))
6930     return (const reg_entry *) NULL;
6931
6932   if (r != NULL
6933       && ((r->reg_flags & (RegRex64 | RegRex))
6934           || r->reg_type.bitfield.reg64)
6935       && (!cpu_arch_flags.bitfield.cpulm
6936           || !UINTS_EQUAL (r->reg_type, control))
6937       && flag_code != CODE_64BIT)
6938     return (const reg_entry *) NULL;
6939
6940   return r;
6941 }
6942
6943 /* REG_STRING starts *before* REGISTER_PREFIX.  */
6944
6945 static const reg_entry *
6946 parse_register (char *reg_string, char **end_op)
6947 {
6948   const reg_entry *r;
6949
6950   if (*reg_string == REGISTER_PREFIX || allow_naked_reg)
6951     r = parse_real_register (reg_string, end_op);
6952   else
6953     r = NULL;
6954   if (!r)
6955     {
6956       char *save = input_line_pointer;
6957       char c;
6958       symbolS *symbolP;
6959
6960       input_line_pointer = reg_string;
6961       c = get_symbol_end ();
6962       symbolP = symbol_find (reg_string);
6963       if (symbolP && S_GET_SEGMENT (symbolP) == reg_section)
6964         {
6965           const expressionS *e = symbol_get_value_expression (symbolP);
6966
6967           know (e->X_op == O_register);
6968           know (e->X_add_number >= 0
6969                 && (valueT) e->X_add_number < i386_regtab_size);
6970           r = i386_regtab + e->X_add_number;
6971           *end_op = input_line_pointer;
6972         }
6973       *input_line_pointer = c;
6974       input_line_pointer = save;
6975     }
6976   return r;
6977 }
6978
6979 int
6980 i386_parse_name (char *name, expressionS *e, char *nextcharP)
6981 {
6982   const reg_entry *r;
6983   char *end = input_line_pointer;
6984
6985   *end = *nextcharP;
6986   r = parse_register (name, &input_line_pointer);
6987   if (r && end <= input_line_pointer)
6988     {
6989       *nextcharP = *input_line_pointer;
6990       *input_line_pointer = 0;
6991       e->X_op = O_register;
6992       e->X_add_number = r - i386_regtab;
6993       return 1;
6994     }
6995   input_line_pointer = end;
6996   *end = 0;
6997   return 0;
6998 }
6999
7000 void
7001 md_operand (expressionS *e)
7002 {
7003   if (*input_line_pointer == REGISTER_PREFIX)
7004     {
7005       char *end;
7006       const reg_entry *r = parse_real_register (input_line_pointer, &end);
7007
7008       if (r)
7009         {
7010           e->X_op = O_register;
7011           e->X_add_number = r - i386_regtab;
7012           input_line_pointer = end;
7013         }
7014     }
7015 }
7016
7017 \f
7018 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
7019 const char *md_shortopts = "kVQ:sqn";
7020 #else
7021 const char *md_shortopts = "qn";
7022 #endif
7023
7024 #define OPTION_32 (OPTION_MD_BASE + 0)
7025 #define OPTION_64 (OPTION_MD_BASE + 1)
7026 #define OPTION_DIVIDE (OPTION_MD_BASE + 2)
7027 #define OPTION_MARCH (OPTION_MD_BASE + 3)
7028 #define OPTION_MTUNE (OPTION_MD_BASE + 4)
7029
7030 struct option md_longopts[] =
7031 {
7032   {"32", no_argument, NULL, OPTION_32},
7033 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF) || defined(TE_PEP)
7034   {"64", no_argument, NULL, OPTION_64},
7035 #endif
7036   {"divide", no_argument, NULL, OPTION_DIVIDE},
7037   {"march", required_argument, NULL, OPTION_MARCH},
7038   {"mtune", required_argument, NULL, OPTION_MTUNE},
7039   {NULL, no_argument, NULL, 0}
7040 };
7041 size_t md_longopts_size = sizeof (md_longopts);
7042
7043 int
7044 md_parse_option (int c, char *arg)
7045 {
7046   unsigned int i;
7047
7048   switch (c)
7049     {
7050     case 'n':
7051       optimize_align_code = 0;
7052       break;
7053
7054     case 'q':
7055       quiet_warnings = 1;
7056       break;
7057
7058 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
7059       /* -Qy, -Qn: SVR4 arguments controlling whether a .comment section
7060          should be emitted or not.  FIXME: Not implemented.  */
7061     case 'Q':
7062       break;
7063
7064       /* -V: SVR4 argument to print version ID.  */
7065     case 'V':
7066       print_version_id ();
7067       break;
7068
7069       /* -k: Ignore for FreeBSD compatibility.  */
7070     case 'k':
7071       break;
7072
7073     case 's':
7074       /* -s: On i386 Solaris, this tells the native assembler to use
7075          .stab instead of .stab.excl.  We always use .stab anyhow.  */
7076       break;
7077 #endif
7078 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF) || defined(TE_PEP)
7079     case OPTION_64:
7080       {
7081         const char **list, **l;
7082
7083         list = bfd_target_list ();
7084         for (l = list; *l != NULL; l++)
7085           if (CONST_STRNEQ (*l, "elf64-x86-64")
7086               || strcmp (*l, "coff-x86-64") == 0
7087               || strcmp (*l, "pe-x86-64") == 0
7088               || strcmp (*l, "pei-x86-64") == 0)
7089             {
7090               default_arch = "x86_64";
7091               break;
7092             }
7093         if (*l == NULL)
7094           as_fatal (_("No compiled in support for x86_64"));
7095         free (list);
7096       }
7097       break;
7098 #endif
7099
7100     case OPTION_32:
7101       default_arch = "i386";
7102       break;
7103
7104     case OPTION_DIVIDE:
7105 #ifdef SVR4_COMMENT_CHARS
7106       {
7107         char *n, *t;
7108         const char *s;
7109
7110         n = (char *) xmalloc (strlen (i386_comment_chars) + 1);
7111         t = n;
7112         for (s = i386_comment_chars; *s != '\0'; s++)
7113           if (*s != '/')
7114             *t++ = *s;
7115         *t = '\0';
7116         i386_comment_chars = n;
7117       }
7118 #endif
7119       break;
7120
7121     case OPTION_MARCH:
7122       if (*arg == '.')
7123         as_fatal (_("Invalid -march= option: `%s'"), arg);
7124       for (i = 0; i < ARRAY_SIZE (cpu_arch); i++)
7125         {
7126           if (strcmp (arg, cpu_arch [i].name) == 0)
7127             {
7128               cpu_arch_isa = cpu_arch[i].type;
7129               cpu_arch_isa_flags = cpu_arch[i].flags;
7130               if (!cpu_arch_tune_set)
7131                 {
7132                   cpu_arch_tune = cpu_arch_isa;
7133                   cpu_arch_tune_flags = cpu_arch_isa_flags;
7134                 }
7135               break;
7136             }
7137         }
7138       if (i >= ARRAY_SIZE (cpu_arch))
7139         as_fatal (_("Invalid -march= option: `%s'"), arg);
7140       break;
7141
7142     case OPTION_MTUNE:
7143       if (*arg == '.')
7144         as_fatal (_("Invalid -mtune= option: `%s'"), arg);
7145       for (i = 0; i < ARRAY_SIZE (cpu_arch); i++)
7146         {
7147           if (strcmp (arg, cpu_arch [i].name) == 0)
7148             {
7149               cpu_arch_tune_set = 1;
7150               cpu_arch_tune = cpu_arch [i].type;
7151               cpu_arch_tune_flags = cpu_arch[i].flags;
7152               break;
7153             }
7154         }
7155       if (i >= ARRAY_SIZE (cpu_arch))
7156         as_fatal (_("Invalid -mtune= option: `%s'"), arg);
7157       break;
7158
7159     default:
7160       return 0;
7161     }
7162   return 1;
7163 }
7164
7165 void
7166 md_show_usage (stream)
7167      FILE *stream;
7168 {
7169 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
7170   fprintf (stream, _("\
7171   -Q                      ignored\n\
7172   -V                      print assembler version number\n\
7173   -k                      ignored\n"));
7174 #endif
7175   fprintf (stream, _("\
7176   -n                      Do not optimize code alignment\n\
7177   -q                      quieten some warnings\n"));
7178 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
7179   fprintf (stream, _("\
7180   -s                      ignored\n"));
7181 #endif
7182 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF) || defined(TE_PEP)
7183   fprintf (stream, _("\
7184   --32/--64               generate 32bit/64bit code\n"));
7185 #endif
7186 #ifdef SVR4_COMMENT_CHARS
7187   fprintf (stream, _("\
7188   --divide                do not treat `/' as a comment character\n"));
7189 #else
7190   fprintf (stream, _("\
7191   --divide                ignored\n"));
7192 #endif
7193   fprintf (stream, _("\
7194   -march=CPU/-mtune=CPU   generate code/optimize for CPU, where CPU is one of:\n\
7195                            i386, i486, pentium, pentiumpro, pentium4, nocona,\n\
7196                            core, core2, k6, athlon, k8, generic32, generic64\n"));
7197
7198 }
7199
7200 #if ((defined (OBJ_MAYBE_COFF) && defined (OBJ_MAYBE_AOUT)) \
7201      || defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF) || defined (TE_PEP))
7202
7203 /* Pick the target format to use.  */
7204
7205 const char *
7206 i386_target_format (void)
7207 {
7208   if (!strcmp (default_arch, "x86_64"))
7209     {
7210       set_code_flag (CODE_64BIT);
7211       if (UINTS_ALL_ZERO (cpu_arch_isa_flags))
7212         {
7213           cpu_arch_isa_flags.bitfield.cpui186 = 1;
7214           cpu_arch_isa_flags.bitfield.cpui286 = 1;
7215           cpu_arch_isa_flags.bitfield.cpui386 = 1;
7216           cpu_arch_isa_flags.bitfield.cpui486 = 1;
7217           cpu_arch_isa_flags.bitfield.cpui586 = 1;
7218           cpu_arch_isa_flags.bitfield.cpui686 = 1;
7219           cpu_arch_isa_flags.bitfield.cpup4 = 1;
7220           cpu_arch_isa_flags.bitfield.cpummx= 1;
7221           cpu_arch_isa_flags.bitfield.cpummx2 = 1;
7222           cpu_arch_isa_flags.bitfield.cpusse = 1;
7223           cpu_arch_isa_flags.bitfield.cpusse2 = 1;
7224         }
7225       if (UINTS_ALL_ZERO (cpu_arch_tune_flags))
7226         {
7227           cpu_arch_tune_flags.bitfield.cpui186 = 1;
7228           cpu_arch_tune_flags.bitfield.cpui286 = 1;
7229           cpu_arch_tune_flags.bitfield.cpui386 = 1;
7230           cpu_arch_tune_flags.bitfield.cpui486 = 1;
7231           cpu_arch_tune_flags.bitfield.cpui586 = 1;
7232           cpu_arch_tune_flags.bitfield.cpui686 = 1;
7233           cpu_arch_tune_flags.bitfield.cpup4 = 1;
7234           cpu_arch_tune_flags.bitfield.cpummx= 1;
7235           cpu_arch_tune_flags.bitfield.cpummx2 = 1;
7236           cpu_arch_tune_flags.bitfield.cpusse = 1;
7237           cpu_arch_tune_flags.bitfield.cpusse2 = 1;
7238         }
7239     }
7240   else if (!strcmp (default_arch, "i386"))
7241     {
7242       set_code_flag (CODE_32BIT);
7243       if (UINTS_ALL_ZERO (cpu_arch_isa_flags))
7244         {
7245           cpu_arch_isa_flags.bitfield.cpui186 = 1;
7246           cpu_arch_isa_flags.bitfield.cpui286 = 1;
7247           cpu_arch_isa_flags.bitfield.cpui386 = 1;
7248         }
7249       if (UINTS_ALL_ZERO (cpu_arch_tune_flags))
7250         {
7251           cpu_arch_tune_flags.bitfield.cpui186 = 1;
7252           cpu_arch_tune_flags.bitfield.cpui286 = 1;
7253           cpu_arch_tune_flags.bitfield.cpui386 = 1;
7254         }
7255     }
7256   else
7257     as_fatal (_("Unknown architecture"));
7258   switch (OUTPUT_FLAVOR)
7259     {
7260 #ifdef TE_PEP
7261     case bfd_target_coff_flavour:
7262       return flag_code == CODE_64BIT ? COFF_TARGET_FORMAT : "coff-i386";
7263       break;
7264 #endif
7265 #ifdef OBJ_MAYBE_AOUT
7266     case bfd_target_aout_flavour:
7267       return AOUT_TARGET_FORMAT;
7268 #endif
7269 #ifdef OBJ_MAYBE_COFF
7270     case bfd_target_coff_flavour:
7271       return "coff-i386";
7272 #endif
7273 #if defined (OBJ_MAYBE_ELF) || defined (OBJ_ELF)
7274     case bfd_target_elf_flavour:
7275       {
7276         if (flag_code == CODE_64BIT)
7277           {
7278             object_64bit = 1;
7279             use_rela_relocations = 1;
7280           }
7281         return flag_code == CODE_64BIT ? ELF_TARGET_FORMAT64 : ELF_TARGET_FORMAT;
7282       }
7283 #endif
7284     default:
7285       abort ();
7286       return NULL;
7287     }
7288 }
7289
7290 #endif /* OBJ_MAYBE_ more than one  */
7291
7292 #if (defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF))
7293 void
7294 i386_elf_emit_arch_note (void)
7295 {
7296   if (IS_ELF && cpu_arch_name != NULL)
7297     {
7298       char *p;
7299       asection *seg = now_seg;
7300       subsegT subseg = now_subseg;
7301       Elf_Internal_Note i_note;
7302       Elf_External_Note e_note;
7303       asection *note_secp;
7304       int len;
7305
7306       /* Create the .note section.  */
7307       note_secp = subseg_new (".note", 0);
7308       bfd_set_section_flags (stdoutput,
7309                              note_secp,
7310                              SEC_HAS_CONTENTS | SEC_READONLY);
7311
7312       /* Process the arch string.  */
7313       len = strlen (cpu_arch_name);
7314
7315       i_note.namesz = len + 1;
7316       i_note.descsz = 0;
7317       i_note.type = NT_ARCH;
7318       p = frag_more (sizeof (e_note.namesz));
7319       md_number_to_chars (p, (valueT) i_note.namesz, sizeof (e_note.namesz));
7320       p = frag_more (sizeof (e_note.descsz));
7321       md_number_to_chars (p, (valueT) i_note.descsz, sizeof (e_note.descsz));
7322       p = frag_more (sizeof (e_note.type));
7323       md_number_to_chars (p, (valueT) i_note.type, sizeof (e_note.type));
7324       p = frag_more (len + 1);
7325       strcpy (p, cpu_arch_name);
7326
7327       frag_align (2, 0, 0);
7328
7329       subseg_set (seg, subseg);
7330     }
7331 }
7332 #endif
7333 \f
7334 symbolS *
7335 md_undefined_symbol (name)
7336      char *name;
7337 {
7338   if (name[0] == GLOBAL_OFFSET_TABLE_NAME[0]
7339       && name[1] == GLOBAL_OFFSET_TABLE_NAME[1]
7340       && name[2] == GLOBAL_OFFSET_TABLE_NAME[2]
7341       && strcmp (name, GLOBAL_OFFSET_TABLE_NAME) == 0)
7342     {
7343       if (!GOT_symbol)
7344         {
7345           if (symbol_find (name))
7346             as_bad (_("GOT already in symbol table"));
7347           GOT_symbol = symbol_new (name, undefined_section,
7348                                    (valueT) 0, &zero_address_frag);
7349         };
7350       return GOT_symbol;
7351     }
7352   return 0;
7353 }
7354
7355 /* Round up a section size to the appropriate boundary.  */
7356
7357 valueT
7358 md_section_align (segment, size)
7359      segT segment ATTRIBUTE_UNUSED;
7360      valueT size;
7361 {
7362 #if (defined (OBJ_AOUT) || defined (OBJ_MAYBE_AOUT))
7363   if (OUTPUT_FLAVOR == bfd_target_aout_flavour)
7364     {
7365       /* For a.out, force the section size to be aligned.  If we don't do
7366          this, BFD will align it for us, but it will not write out the
7367          final bytes of the section.  This may be a bug in BFD, but it is
7368          easier to fix it here since that is how the other a.out targets
7369          work.  */
7370       int align;
7371
7372       align = bfd_get_section_alignment (stdoutput, segment);
7373       size = ((size + (1 << align) - 1) & ((valueT) -1 << align));
7374     }
7375 #endif
7376
7377   return size;
7378 }
7379
7380 /* On the i386, PC-relative offsets are relative to the start of the
7381    next instruction.  That is, the address of the offset, plus its
7382    size, since the offset is always the last part of the insn.  */
7383
7384 long
7385 md_pcrel_from (fixS *fixP)
7386 {
7387   return fixP->fx_size + fixP->fx_where + fixP->fx_frag->fr_address;
7388 }
7389
7390 #ifndef I386COFF
7391
7392 static void
7393 s_bss (int ignore ATTRIBUTE_UNUSED)
7394 {
7395   int temp;
7396
7397 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
7398   if (IS_ELF)
7399     obj_elf_section_change_hook ();
7400 #endif
7401   temp = get_absolute_expression ();
7402   subseg_set (bss_section, (subsegT) temp);
7403   demand_empty_rest_of_line ();
7404 }
7405
7406 #endif
7407
7408 void
7409 i386_validate_fix (fixS *fixp)
7410 {
7411   if (fixp->fx_subsy && fixp->fx_subsy == GOT_symbol)
7412     {
7413       if (fixp->fx_r_type == BFD_RELOC_32_PCREL)
7414         {
7415           if (!object_64bit)
7416             abort ();
7417           fixp->fx_r_type = BFD_RELOC_X86_64_GOTPCREL;
7418         }
7419       else
7420         {
7421           if (!object_64bit)
7422             fixp->fx_r_type = BFD_RELOC_386_GOTOFF;
7423           else
7424             fixp->fx_r_type = BFD_RELOC_X86_64_GOTOFF64;
7425         }
7426       fixp->fx_subsy = 0;
7427     }
7428 }
7429
7430 arelent *
7431 tc_gen_reloc (section, fixp)
7432      asection *section ATTRIBUTE_UNUSED;
7433      fixS *fixp;
7434 {
7435   arelent *rel;
7436   bfd_reloc_code_real_type code;
7437
7438   switch (fixp->fx_r_type)
7439     {
7440     case BFD_RELOC_X86_64_PLT32:
7441     case BFD_RELOC_X86_64_GOT32:
7442     case BFD_RELOC_X86_64_GOTPCREL:
7443     case BFD_RELOC_386_PLT32:
7444     case BFD_RELOC_386_GOT32:
7445     case BFD_RELOC_386_GOTOFF:
7446     case BFD_RELOC_386_GOTPC:
7447     case BFD_RELOC_386_TLS_GD:
7448     case BFD_RELOC_386_TLS_LDM:
7449     case BFD_RELOC_386_TLS_LDO_32:
7450     case BFD_RELOC_386_TLS_IE_32:
7451     case BFD_RELOC_386_TLS_IE:
7452     case BFD_RELOC_386_TLS_GOTIE:
7453     case BFD_RELOC_386_TLS_LE_32:
7454     case BFD_RELOC_386_TLS_LE:
7455     case BFD_RELOC_386_TLS_GOTDESC:
7456     case BFD_RELOC_386_TLS_DESC_CALL:
7457     case BFD_RELOC_X86_64_TLSGD:
7458     case BFD_RELOC_X86_64_TLSLD:
7459     case BFD_RELOC_X86_64_DTPOFF32:
7460     case BFD_RELOC_X86_64_DTPOFF64:
7461     case BFD_RELOC_X86_64_GOTTPOFF:
7462     case BFD_RELOC_X86_64_TPOFF32:
7463     case BFD_RELOC_X86_64_TPOFF64:
7464     case BFD_RELOC_X86_64_GOTOFF64:
7465     case BFD_RELOC_X86_64_GOTPC32:
7466     case BFD_RELOC_X86_64_GOT64:
7467     case BFD_RELOC_X86_64_GOTPCREL64:
7468     case BFD_RELOC_X86_64_GOTPC64:
7469     case BFD_RELOC_X86_64_GOTPLT64:
7470     case BFD_RELOC_X86_64_PLTOFF64:
7471     case BFD_RELOC_X86_64_GOTPC32_TLSDESC:
7472     case BFD_RELOC_X86_64_TLSDESC_CALL:
7473     case BFD_RELOC_RVA:
7474     case BFD_RELOC_VTABLE_ENTRY:
7475     case BFD_RELOC_VTABLE_INHERIT:
7476 #ifdef TE_PE
7477     case BFD_RELOC_32_SECREL:
7478 #endif
7479       code = fixp->fx_r_type;
7480       break;
7481     case BFD_RELOC_X86_64_32S:
7482       if (!fixp->fx_pcrel)
7483         {
7484           /* Don't turn BFD_RELOC_X86_64_32S into BFD_RELOC_32.  */
7485           code = fixp->fx_r_type;
7486           break;
7487         }
7488     default:
7489       if (fixp->fx_pcrel)
7490         {
7491           switch (fixp->fx_size)
7492             {
7493             default:
7494               as_bad_where (fixp->fx_file, fixp->fx_line,
7495                             _("can not do %d byte pc-relative relocation"),
7496                             fixp->fx_size);
7497               code = BFD_RELOC_32_PCREL;
7498               break;
7499             case 1: code = BFD_RELOC_8_PCREL;  break;
7500             case 2: code = BFD_RELOC_16_PCREL; break;
7501             case 4: code = BFD_RELOC_32_PCREL; break;
7502 #ifdef BFD64
7503             case 8: code = BFD_RELOC_64_PCREL; break;
7504 #endif
7505             }
7506         }
7507       else
7508         {
7509           switch (fixp->fx_size)
7510             {
7511             default:
7512               as_bad_where (fixp->fx_file, fixp->fx_line,
7513                             _("can not do %d byte relocation"),
7514                             fixp->fx_size);
7515               code = BFD_RELOC_32;
7516               break;
7517             case 1: code = BFD_RELOC_8;  break;
7518             case 2: code = BFD_RELOC_16; break;
7519             case 4: code = BFD_RELOC_32; break;
7520 #ifdef BFD64
7521             case 8: code = BFD_RELOC_64; break;
7522 #endif
7523             }
7524         }
7525       break;
7526     }
7527
7528   if ((code == BFD_RELOC_32
7529        || code == BFD_RELOC_32_PCREL
7530        || code == BFD_RELOC_X86_64_32S)
7531       && GOT_symbol
7532       && fixp->fx_addsy == GOT_symbol)
7533     {
7534       if (!object_64bit)
7535         code = BFD_RELOC_386_GOTPC;
7536       else
7537         code = BFD_RELOC_X86_64_GOTPC32;
7538     }
7539   if ((code == BFD_RELOC_64 || code == BFD_RELOC_64_PCREL)
7540       && GOT_symbol
7541       && fixp->fx_addsy == GOT_symbol)
7542     {
7543       code = BFD_RELOC_X86_64_GOTPC64;
7544     }
7545
7546   rel = (arelent *) xmalloc (sizeof (arelent));
7547   rel->sym_ptr_ptr = (asymbol **) xmalloc (sizeof (asymbol *));
7548   *rel->sym_ptr_ptr = symbol_get_bfdsym (fixp->fx_addsy);
7549
7550   rel->address = fixp->fx_frag->fr_address + fixp->fx_where;
7551
7552   if (!use_rela_relocations)
7553     {
7554       /* HACK: Since i386 ELF uses Rel instead of Rela, encode the
7555          vtable entry to be used in the relocation's section offset.  */
7556       if (fixp->fx_r_type == BFD_RELOC_VTABLE_ENTRY)
7557         rel->address = fixp->fx_offset;
7558
7559       rel->addend = 0;
7560     }
7561   /* Use the rela in 64bit mode.  */
7562   else
7563     {
7564       if (!fixp->fx_pcrel)
7565         rel->addend = fixp->fx_offset;
7566       else
7567         switch (code)
7568           {
7569           case BFD_RELOC_X86_64_PLT32:
7570           case BFD_RELOC_X86_64_GOT32:
7571           case BFD_RELOC_X86_64_GOTPCREL:
7572           case BFD_RELOC_X86_64_TLSGD:
7573           case BFD_RELOC_X86_64_TLSLD:
7574           case BFD_RELOC_X86_64_GOTTPOFF:
7575           case BFD_RELOC_X86_64_GOTPC32_TLSDESC:
7576           case BFD_RELOC_X86_64_TLSDESC_CALL:
7577             rel->addend = fixp->fx_offset - fixp->fx_size;
7578             break;
7579           default:
7580             rel->addend = (section->vma
7581                            - fixp->fx_size
7582                            + fixp->fx_addnumber
7583                            + md_pcrel_from (fixp));
7584             break;
7585           }
7586     }
7587
7588   rel->howto = bfd_reloc_type_lookup (stdoutput, code);
7589   if (rel->howto == NULL)
7590     {
7591       as_bad_where (fixp->fx_file, fixp->fx_line,
7592                     _("cannot represent relocation type %s"),
7593                     bfd_get_reloc_code_name (code));
7594       /* Set howto to a garbage value so that we can keep going.  */
7595       rel->howto = bfd_reloc_type_lookup (stdoutput, BFD_RELOC_32);
7596       assert (rel->howto != NULL);
7597     }
7598
7599   return rel;
7600 }
7601
7602 \f
7603 /* Parse operands using Intel syntax. This implements a recursive descent
7604    parser based on the BNF grammar published in Appendix B of the MASM 6.1
7605    Programmer's Guide.
7606
7607    FIXME: We do not recognize the full operand grammar defined in the MASM
7608           documentation.  In particular, all the structure/union and
7609           high-level macro operands are missing.
7610
7611    Uppercase words are terminals, lower case words are non-terminals.
7612    Objects surrounded by double brackets '[[' ']]' are optional. Vertical
7613    bars '|' denote choices. Most grammar productions are implemented in
7614    functions called 'intel_<production>'.
7615
7616    Initial production is 'expr'.
7617
7618     addOp               + | -
7619
7620     alpha               [a-zA-Z]
7621
7622     binOp               & | AND | \| | OR | ^ | XOR
7623
7624     byteRegister        AL | AH | BL | BH | CL | CH | DL | DH
7625
7626     constant            digits [[ radixOverride ]]
7627
7628     dataType            BYTE | WORD | DWORD | FWORD | QWORD | TBYTE | OWORD | XMMWORD
7629
7630     digits              decdigit
7631                         | digits decdigit
7632                         | digits hexdigit
7633
7634     decdigit            [0-9]
7635
7636     e04                 e04 addOp e05
7637                         | e05
7638
7639     e05                 e05 binOp e06
7640                         | e06
7641
7642     e06                 e06 mulOp e09
7643                         | e09
7644
7645     e09                 OFFSET e10
7646                         | SHORT e10
7647                         | + e10
7648                         | - e10
7649                         | ~ e10
7650                         | NOT e10
7651                         | e09 PTR e10
7652                         | e09 : e10
7653                         | e10
7654
7655     e10                 e10 [ expr ]
7656                         | e11
7657
7658     e11                 ( expr )
7659                         | [ expr ]
7660                         | constant
7661                         | dataType
7662                         | id
7663                         | $
7664                         | register
7665
7666  => expr                expr cmpOp e04
7667                         | e04
7668
7669     gpRegister          AX | EAX | BX | EBX | CX | ECX | DX | EDX
7670                         | BP | EBP | SP | ESP | DI | EDI | SI | ESI
7671
7672     hexdigit            a | b | c | d | e | f
7673                         | A | B | C | D | E | F
7674
7675     id                  alpha
7676                         | id alpha
7677                         | id decdigit
7678
7679     mulOp               * | / | % | MOD | << | SHL | >> | SHR
7680
7681     quote               " | '
7682
7683     register            specialRegister
7684                         | gpRegister
7685                         | byteRegister
7686
7687     segmentRegister     CS | DS | ES | FS | GS | SS
7688
7689     specialRegister     CR0 | CR2 | CR3 | CR4
7690                         | DR0 | DR1 | DR2 | DR3 | DR6 | DR7
7691                         | TR3 | TR4 | TR5 | TR6 | TR7
7692
7693     We simplify the grammar in obvious places (e.g., register parsing is
7694     done by calling parse_register) and eliminate immediate left recursion
7695     to implement a recursive-descent parser.
7696
7697     expr        e04 expr'
7698
7699     expr'       cmpOp e04 expr'
7700                 | Empty
7701
7702     e04         e05 e04'
7703
7704     e04'        addOp e05 e04'
7705                 | Empty
7706
7707     e05         e06 e05'
7708
7709     e05'        binOp e06 e05'
7710                 | Empty
7711
7712     e06         e09 e06'
7713
7714     e06'        mulOp e09 e06'
7715                 | Empty
7716
7717     e09         OFFSET e10 e09'
7718                 | SHORT e10'
7719                 | + e10'
7720                 | - e10'
7721                 | ~ e10'
7722                 | NOT e10'
7723                 | e10 e09'
7724
7725     e09'        PTR e10 e09'
7726                 | : e10 e09'
7727                 | Empty
7728
7729     e10         e11 e10'
7730
7731     e10'        [ expr ] e10'
7732                 | Empty
7733
7734     e11         ( expr )
7735                 | [ expr ]
7736                 | BYTE
7737                 | WORD
7738                 | DWORD
7739                 | FWORD
7740                 | QWORD
7741                 | TBYTE
7742                 | OWORD
7743                 | XMMWORD
7744                 | .
7745                 | $
7746                 | register
7747                 | id
7748                 | constant  */
7749
7750 /* Parsing structure for the intel syntax parser. Used to implement the
7751    semantic actions for the operand grammar.  */
7752 struct intel_parser_s
7753   {
7754     char *op_string;            /* The string being parsed.  */
7755     int got_a_float;            /* Whether the operand is a float.  */
7756     int op_modifier;            /* Operand modifier.  */
7757     int is_mem;                 /* 1 if operand is memory reference.  */
7758     int in_offset;              /* >=1 if parsing operand of offset.  */
7759     int in_bracket;             /* >=1 if parsing operand in brackets.  */
7760     const reg_entry *reg;       /* Last register reference found.  */
7761     char *disp;                 /* Displacement string being built.  */
7762     char *next_operand;         /* Resume point when splitting operands.  */
7763   };
7764
7765 static struct intel_parser_s intel_parser;
7766
7767 /* Token structure for parsing intel syntax.  */
7768 struct intel_token
7769   {
7770     int code;                   /* Token code.  */
7771     const reg_entry *reg;       /* Register entry for register tokens.  */
7772     char *str;                  /* String representation.  */
7773   };
7774
7775 static struct intel_token cur_token, prev_token;
7776
7777 /* Token codes for the intel parser. Since T_SHORT is already used
7778    by COFF, undefine it first to prevent a warning.  */
7779 #define T_NIL           -1
7780 #define T_CONST         1
7781 #define T_REG           2
7782 #define T_BYTE          3
7783 #define T_WORD          4
7784 #define T_DWORD         5
7785 #define T_FWORD         6
7786 #define T_QWORD         7
7787 #define T_TBYTE         8
7788 #define T_XMMWORD       9
7789 #undef  T_SHORT
7790 #define T_SHORT         10
7791 #define T_OFFSET        11
7792 #define T_PTR           12
7793 #define T_ID            13
7794 #define T_SHL           14
7795 #define T_SHR           15
7796
7797 /* Prototypes for intel parser functions.  */
7798 static int intel_match_token (int);
7799 static void intel_putback_token (void);
7800 static void intel_get_token (void);
7801 static int intel_expr (void);
7802 static int intel_e04 (void);
7803 static int intel_e05 (void);
7804 static int intel_e06 (void);
7805 static int intel_e09 (void);
7806 static int intel_e10 (void);
7807 static int intel_e11 (void);
7808
7809 static int
7810 i386_intel_operand (char *operand_string, int got_a_float)
7811 {
7812   int ret;
7813   char *p;
7814
7815   p = intel_parser.op_string = xstrdup (operand_string);
7816   intel_parser.disp = (char *) xmalloc (strlen (operand_string) + 1);
7817
7818   for (;;)
7819     {
7820       /* Initialize token holders.  */
7821       cur_token.code = prev_token.code = T_NIL;
7822       cur_token.reg = prev_token.reg = NULL;
7823       cur_token.str = prev_token.str = NULL;
7824
7825       /* Initialize parser structure.  */
7826       intel_parser.got_a_float = got_a_float;
7827       intel_parser.op_modifier = 0;
7828       intel_parser.is_mem = 0;
7829       intel_parser.in_offset = 0;
7830       intel_parser.in_bracket = 0;
7831       intel_parser.reg = NULL;
7832       intel_parser.disp[0] = '\0';
7833       intel_parser.next_operand = NULL;
7834
7835       /* Read the first token and start the parser.  */
7836       intel_get_token ();
7837       ret = intel_expr ();
7838
7839       if (!ret)
7840         break;
7841
7842       if (cur_token.code != T_NIL)
7843         {
7844           as_bad (_("invalid operand for '%s' ('%s' unexpected)"),
7845                   current_templates->start->name, cur_token.str);
7846           ret = 0;
7847         }
7848       /* If we found a memory reference, hand it over to i386_displacement
7849          to fill in the rest of the operand fields.  */
7850       else if (intel_parser.is_mem)
7851         {
7852           if ((i.mem_operands == 1
7853                && !current_templates->start->opcode_modifier.isstring)
7854               || i.mem_operands == 2)
7855             {
7856               as_bad (_("too many memory references for '%s'"),
7857                       current_templates->start->name);
7858               ret = 0;
7859             }
7860           else
7861             {
7862               char *s = intel_parser.disp;
7863               i.mem_operands++;
7864
7865               if (!quiet_warnings && intel_parser.is_mem < 0)
7866                 /* See the comments in intel_bracket_expr.  */
7867                 as_warn (_("Treating `%s' as memory reference"), operand_string);
7868
7869               /* Add the displacement expression.  */
7870               if (*s != '\0')
7871                 ret = i386_displacement (s, s + strlen (s));
7872               if (ret)
7873                 {
7874                   /* Swap base and index in 16-bit memory operands like
7875                      [si+bx]. Since i386_index_check is also used in AT&T
7876                      mode we have to do that here.  */
7877                   if (i.base_reg
7878                       && i.index_reg
7879                       && i.base_reg->reg_type.bitfield.reg16
7880                       && i.index_reg->reg_type.bitfield.reg16
7881                       && i.base_reg->reg_num >= 6
7882                       && i.index_reg->reg_num < 6)
7883                     {
7884                       const reg_entry *base = i.index_reg;
7885
7886                       i.index_reg = i.base_reg;
7887                       i.base_reg = base;
7888                     }
7889                   ret = i386_index_check (operand_string);
7890                 }
7891             }
7892         }
7893
7894       /* Constant and OFFSET expressions are handled by i386_immediate.  */
7895       else if ((intel_parser.op_modifier & (1 << T_OFFSET))
7896                || intel_parser.reg == NULL)
7897         ret = i386_immediate (intel_parser.disp);
7898
7899       if (intel_parser.next_operand && this_operand >= MAX_OPERANDS - 1)
7900         ret = 0;
7901       if (!ret || !intel_parser.next_operand)
7902         break;
7903       intel_parser.op_string = intel_parser.next_operand;
7904       this_operand = i.operands++;
7905     }
7906
7907   free (p);
7908   free (intel_parser.disp);
7909
7910   return ret;
7911 }
7912
7913 #define NUM_ADDRESS_REGS (!!i.base_reg + !!i.index_reg)
7914
7915 /* expr e04 expr'
7916
7917    expr'  cmpOp e04 expr'
7918         | Empty  */
7919 static int
7920 intel_expr (void)
7921 {
7922   /* XXX Implement the comparison operators.  */
7923   return intel_e04 ();
7924 }
7925
7926 /* e04  e05 e04'
7927
7928    e04' addOp e05 e04'
7929         | Empty  */
7930 static int
7931 intel_e04 (void)
7932 {
7933   int nregs = -1;
7934
7935   for (;;)
7936     {
7937       if (!intel_e05())
7938         return 0;
7939
7940       if (nregs >= 0 && NUM_ADDRESS_REGS > nregs)
7941         i.base_reg = i386_regtab + REGNAM_AL; /* al is invalid as base */
7942
7943       if (cur_token.code == '+')
7944         nregs = -1;
7945       else if (cur_token.code == '-')
7946         nregs = NUM_ADDRESS_REGS;
7947       else
7948         return 1;
7949
7950       strcat (intel_parser.disp, cur_token.str);
7951       intel_match_token (cur_token.code);
7952     }
7953 }
7954
7955 /* e05  e06 e05'
7956
7957    e05' binOp e06 e05'
7958         | Empty  */
7959 static int
7960 intel_e05 (void)
7961 {
7962   int nregs = ~NUM_ADDRESS_REGS;
7963
7964   for (;;)
7965     {
7966       if (!intel_e06())
7967         return 0;
7968
7969       if (cur_token.code == '&'
7970           || cur_token.code == '|'
7971           || cur_token.code == '^')
7972         {
7973           char str[2];
7974
7975           str[0] = cur_token.code;
7976           str[1] = 0;
7977           strcat (intel_parser.disp, str);
7978         }
7979       else
7980         break;
7981
7982       intel_match_token (cur_token.code);
7983
7984       if (nregs < 0)
7985         nregs = ~nregs;
7986     }
7987   if (nregs >= 0 && NUM_ADDRESS_REGS > nregs)
7988     i.base_reg = i386_regtab + REGNAM_AL + 1; /* cl is invalid as base */
7989   return 1;
7990 }
7991
7992 /* e06  e09 e06'
7993
7994    e06' mulOp e09 e06'
7995         | Empty  */
7996 static int
7997 intel_e06 (void)
7998 {
7999   int nregs = ~NUM_ADDRESS_REGS;
8000
8001   for (;;)
8002     {
8003       if (!intel_e09())
8004         return 0;
8005
8006       if (cur_token.code == '*'
8007           || cur_token.code == '/'
8008           || cur_token.code == '%')
8009         {
8010           char str[2];
8011
8012           str[0] = cur_token.code;
8013           str[1] = 0;
8014           strcat (intel_parser.disp, str);
8015         }
8016       else if (cur_token.code == T_SHL)
8017         strcat (intel_parser.disp, "<<");
8018       else if (cur_token.code == T_SHR)
8019         strcat (intel_parser.disp, ">>");
8020       else
8021         break;
8022
8023       intel_match_token (cur_token.code);
8024
8025       if (nregs < 0)
8026         nregs = ~nregs;
8027     }
8028   if (nregs >= 0 && NUM_ADDRESS_REGS > nregs)
8029     i.base_reg = i386_regtab + REGNAM_AL + 2; /* dl is invalid as base */
8030   return 1;
8031 }
8032
8033 /* e09  OFFSET e09
8034         | SHORT e09
8035         | + e09
8036         | - e09
8037         | ~ e09
8038         | NOT e09
8039         | e10 e09'
8040
8041    e09' PTR e10 e09'
8042         | : e10 e09'
8043         | Empty */
8044 static int
8045 intel_e09 (void)
8046 {
8047   int nregs = ~NUM_ADDRESS_REGS;
8048   int in_offset = 0;
8049
8050   for (;;)
8051     {
8052       /* Don't consume constants here.  */
8053       if (cur_token.code == '+' || cur_token.code == '-')
8054         {
8055           /* Need to look one token ahead - if the next token
8056              is a constant, the current token is its sign.  */
8057           int next_code;
8058
8059           intel_match_token (cur_token.code);
8060           next_code = cur_token.code;
8061           intel_putback_token ();
8062           if (next_code == T_CONST)
8063             break;
8064         }
8065
8066       /* e09  OFFSET e09  */
8067       if (cur_token.code == T_OFFSET)
8068         {
8069           if (!in_offset++)
8070             ++intel_parser.in_offset;
8071         }
8072
8073       /* e09  SHORT e09  */
8074       else if (cur_token.code == T_SHORT)
8075         intel_parser.op_modifier |= 1 << T_SHORT;
8076
8077       /* e09  + e09  */
8078       else if (cur_token.code == '+')
8079         strcat (intel_parser.disp, "+");
8080
8081       /* e09  - e09
8082               | ~ e09
8083               | NOT e09  */
8084       else if (cur_token.code == '-' || cur_token.code == '~')
8085         {
8086           char str[2];
8087
8088           if (nregs < 0)
8089             nregs = ~nregs;
8090           str[0] = cur_token.code;
8091           str[1] = 0;
8092           strcat (intel_parser.disp, str);
8093         }
8094
8095       /* e09  e10 e09'  */
8096       else
8097         break;
8098
8099       intel_match_token (cur_token.code);
8100     }
8101
8102   for (;;)
8103     {
8104       if (!intel_e10 ())
8105         return 0;
8106
8107       /* e09'  PTR e10 e09' */
8108       if (cur_token.code == T_PTR)
8109         {
8110           char suffix;
8111
8112           if (prev_token.code == T_BYTE)
8113             suffix = BYTE_MNEM_SUFFIX;
8114
8115           else if (prev_token.code == T_WORD)
8116             {
8117               if (current_templates->start->name[0] == 'l'
8118                   && current_templates->start->name[2] == 's'
8119                   && current_templates->start->name[3] == 0)
8120                 suffix = BYTE_MNEM_SUFFIX; /* so it will cause an error */
8121               else if (intel_parser.got_a_float == 2)   /* "fi..." */
8122                 suffix = SHORT_MNEM_SUFFIX;
8123               else
8124                 suffix = WORD_MNEM_SUFFIX;
8125             }
8126
8127           else if (prev_token.code == T_DWORD)
8128             {
8129               if (current_templates->start->name[0] == 'l'
8130                   && current_templates->start->name[2] == 's'
8131                   && current_templates->start->name[3] == 0)
8132                 suffix = WORD_MNEM_SUFFIX;
8133               else if (flag_code == CODE_16BIT
8134                        && (current_templates->start->opcode_modifier.jump
8135                            || current_templates->start->opcode_modifier.jumpdword))
8136                 suffix = LONG_DOUBLE_MNEM_SUFFIX;
8137               else if (intel_parser.got_a_float == 1)   /* "f..." */
8138                 suffix = SHORT_MNEM_SUFFIX;
8139               else
8140                 suffix = LONG_MNEM_SUFFIX;
8141             }
8142
8143           else if (prev_token.code == T_FWORD)
8144             {
8145               if (current_templates->start->name[0] == 'l'
8146                   && current_templates->start->name[2] == 's'
8147                   && current_templates->start->name[3] == 0)
8148                 suffix = LONG_MNEM_SUFFIX;
8149               else if (!intel_parser.got_a_float)
8150                 {
8151                   if (flag_code == CODE_16BIT)
8152                     add_prefix (DATA_PREFIX_OPCODE);
8153                   suffix = LONG_DOUBLE_MNEM_SUFFIX;
8154                 }
8155               else
8156                 suffix = BYTE_MNEM_SUFFIX; /* so it will cause an error */
8157             }
8158
8159           else if (prev_token.code == T_QWORD)
8160             {
8161               if (intel_parser.got_a_float == 1)        /* "f..." */
8162                 suffix = LONG_MNEM_SUFFIX;
8163               else
8164                 suffix = QWORD_MNEM_SUFFIX;
8165             }
8166
8167           else if (prev_token.code == T_TBYTE)
8168             {
8169               if (intel_parser.got_a_float == 1)
8170                 suffix = LONG_DOUBLE_MNEM_SUFFIX;
8171               else
8172                 suffix = BYTE_MNEM_SUFFIX; /* so it will cause an error */
8173             }
8174
8175           else if (prev_token.code == T_XMMWORD)
8176             {
8177               /* XXX ignored for now, but accepted since gcc uses it */
8178               suffix = 0;
8179             }
8180
8181           else
8182             {
8183               as_bad (_("Unknown operand modifier `%s'"), prev_token.str);
8184               return 0;
8185             }
8186
8187           /* Operands for jump/call using 'ptr' notation denote absolute
8188              addresses.  */
8189           if (current_templates->start->opcode_modifier.jump
8190               || current_templates->start->opcode_modifier.jumpdword)
8191             i.types[this_operand].bitfield.jumpabsolute = 1;
8192
8193           if (current_templates->start->base_opcode == 0x8d /* lea */)
8194             ;
8195           else if (!i.suffix)
8196             i.suffix = suffix;
8197           else if (i.suffix != suffix)
8198             {
8199               as_bad (_("Conflicting operand modifiers"));
8200               return 0;
8201             }
8202
8203         }
8204
8205       /* e09'  : e10 e09'  */
8206       else if (cur_token.code == ':')
8207         {
8208           if (prev_token.code != T_REG)
8209             {
8210               /* While {call,jmp} SSSS:OOOO is MASM syntax only when SSSS is a
8211                  segment/group identifier (which we don't have), using comma
8212                  as the operand separator there is even less consistent, since
8213                  there all branches only have a single operand.  */
8214               if (this_operand != 0
8215                   || intel_parser.in_offset
8216                   || intel_parser.in_bracket
8217                   || (!current_templates->start->opcode_modifier.jump
8218                       && !current_templates->start->opcode_modifier.jumpdword
8219                       && !current_templates->start->opcode_modifier.jumpintersegment
8220                       && !current_templates->start->operand_types[0].bitfield.jumpabsolute))
8221                 return intel_match_token (T_NIL);
8222               /* Remember the start of the 2nd operand and terminate 1st
8223                  operand here.
8224                  XXX This isn't right, yet (when SSSS:OOOO is right operand of
8225                  another expression), but it gets at least the simplest case
8226                  (a plain number or symbol on the left side) right.  */
8227               intel_parser.next_operand = intel_parser.op_string;
8228               *--intel_parser.op_string = '\0';
8229               return intel_match_token (':');
8230             }
8231         }
8232
8233       /* e09'  Empty  */
8234       else
8235         break;
8236
8237       intel_match_token (cur_token.code);
8238
8239     }
8240
8241   if (in_offset)
8242     {
8243       --intel_parser.in_offset;
8244       if (nregs < 0)
8245         nregs = ~nregs;
8246       if (NUM_ADDRESS_REGS > nregs)
8247         {
8248           as_bad (_("Invalid operand to `OFFSET'"));
8249           return 0;
8250         }
8251       intel_parser.op_modifier |= 1 << T_OFFSET;
8252     }
8253
8254   if (nregs >= 0 && NUM_ADDRESS_REGS > nregs)
8255     i.base_reg = i386_regtab + REGNAM_AL + 3; /* bl is invalid as base */
8256   return 1;
8257 }
8258
8259 static int
8260 intel_bracket_expr (void)
8261 {
8262   int was_offset = intel_parser.op_modifier & (1 << T_OFFSET);
8263   const char *start = intel_parser.op_string;
8264   int len;
8265
8266   if (i.op[this_operand].regs)
8267     return intel_match_token (T_NIL);
8268
8269   intel_match_token ('[');
8270
8271   /* Mark as a memory operand only if it's not already known to be an
8272      offset expression.  If it's an offset expression, we need to keep
8273      the brace in.  */
8274   if (!intel_parser.in_offset)
8275     {
8276       ++intel_parser.in_bracket;
8277
8278       /* Operands for jump/call inside brackets denote absolute addresses.  */
8279       if (current_templates->start->opcode_modifier.jump
8280           || current_templates->start->opcode_modifier.jumpdword)
8281         i.types[this_operand].bitfield.jumpabsolute = 1;
8282
8283       /* Unfortunately gas always diverged from MASM in a respect that can't
8284          be easily fixed without risking to break code sequences likely to be
8285          encountered (the testsuite even check for this): MASM doesn't consider
8286          an expression inside brackets unconditionally as a memory reference.
8287          When that is e.g. a constant, an offset expression, or the sum of the
8288          two, this is still taken as a constant load. gas, however, always
8289          treated these as memory references. As a compromise, we'll try to make
8290          offset expressions inside brackets work the MASM way (since that's
8291          less likely to be found in real world code), but make constants alone
8292          continue to work the traditional gas way. In either case, issue a
8293          warning.  */
8294       intel_parser.op_modifier &= ~was_offset;
8295     }
8296   else
8297     strcat (intel_parser.disp, "[");
8298
8299   /* Add a '+' to the displacement string if necessary.  */
8300   if (*intel_parser.disp != '\0'
8301       && *(intel_parser.disp + strlen (intel_parser.disp) - 1) != '+')
8302     strcat (intel_parser.disp, "+");
8303
8304   if (intel_expr ()
8305       && (len = intel_parser.op_string - start - 1,
8306           intel_match_token (']')))
8307     {
8308       /* Preserve brackets when the operand is an offset expression.  */
8309       if (intel_parser.in_offset)
8310         strcat (intel_parser.disp, "]");
8311       else
8312         {
8313           --intel_parser.in_bracket;
8314           if (i.base_reg || i.index_reg)
8315             intel_parser.is_mem = 1;
8316           if (!intel_parser.is_mem)
8317             {
8318               if (!(intel_parser.op_modifier & (1 << T_OFFSET)))
8319                 /* Defer the warning until all of the operand was parsed.  */
8320                 intel_parser.is_mem = -1;
8321               else if (!quiet_warnings)
8322                 as_warn (_("`[%.*s]' taken to mean just `%.*s'"),
8323                          len, start, len, start);
8324             }
8325         }
8326       intel_parser.op_modifier |= was_offset;
8327
8328       return 1;
8329     }
8330   return 0;
8331 }
8332
8333 /* e10  e11 e10'
8334
8335    e10' [ expr ] e10'
8336         | Empty  */
8337 static int
8338 intel_e10 (void)
8339 {
8340   if (!intel_e11 ())
8341     return 0;
8342
8343   while (cur_token.code == '[')
8344     {
8345       if (!intel_bracket_expr ())
8346         return 0;
8347     }
8348
8349   return 1;
8350 }
8351
8352 /* e11  ( expr )
8353         | [ expr ]
8354         | BYTE
8355         | WORD
8356         | DWORD
8357         | FWORD
8358         | QWORD
8359         | TBYTE
8360         | OWORD
8361         | XMMWORD
8362         | $
8363         | .
8364         | register
8365         | id
8366         | constant  */
8367 static int
8368 intel_e11 (void)
8369 {
8370   switch (cur_token.code)
8371     {
8372     /* e11  ( expr ) */
8373     case '(':
8374       intel_match_token ('(');
8375       strcat (intel_parser.disp, "(");
8376
8377       if (intel_expr () && intel_match_token (')'))
8378         {
8379           strcat (intel_parser.disp, ")");
8380           return 1;
8381         }
8382       return 0;
8383
8384     /* e11  [ expr ] */
8385     case '[':
8386       return intel_bracket_expr ();
8387
8388     /* e11  $
8389             | .  */
8390     case '.':
8391       strcat (intel_parser.disp, cur_token.str);
8392       intel_match_token (cur_token.code);
8393
8394       /* Mark as a memory operand only if it's not already known to be an
8395          offset expression.  */
8396       if (!intel_parser.in_offset)
8397         intel_parser.is_mem = 1;
8398
8399       return 1;
8400
8401     /* e11  register  */
8402     case T_REG:
8403       {
8404         const reg_entry *reg = intel_parser.reg = cur_token.reg;
8405
8406         intel_match_token (T_REG);
8407
8408         /* Check for segment change.  */
8409         if (cur_token.code == ':')
8410           {
8411             if (!reg->reg_type.bitfield.sreg2
8412                 && !reg->reg_type.bitfield.sreg3)
8413               {
8414                 as_bad (_("`%s' is not a valid segment register"),
8415                         reg->reg_name);
8416                 return 0;
8417               }
8418             else if (i.seg[i.mem_operands])
8419               as_warn (_("Extra segment override ignored"));
8420             else
8421               {
8422                 if (!intel_parser.in_offset)
8423                   intel_parser.is_mem = 1;
8424                 switch (reg->reg_num)
8425                   {
8426                   case 0:
8427                     i.seg[i.mem_operands] = &es;
8428                     break;
8429                   case 1:
8430                     i.seg[i.mem_operands] = &cs;
8431                     break;
8432                   case 2:
8433                     i.seg[i.mem_operands] = &ss;
8434                     break;
8435                   case 3:
8436                     i.seg[i.mem_operands] = &ds;
8437                     break;
8438                   case 4:
8439                     i.seg[i.mem_operands] = &fs;
8440                     break;
8441                   case 5:
8442                     i.seg[i.mem_operands] = &gs;
8443                     break;
8444                   }
8445               }
8446           }
8447
8448         /* Not a segment register. Check for register scaling.  */
8449         else if (cur_token.code == '*')
8450           {
8451             if (!intel_parser.in_bracket)
8452               {
8453                 as_bad (_("Register scaling only allowed in memory operands"));
8454                 return 0;
8455               }
8456
8457             if (reg->reg_type.bitfield.reg16) /* Disallow things like [si*1]. */
8458               reg = i386_regtab + REGNAM_AX + 4; /* sp is invalid as index */
8459             else if (i.index_reg)
8460               reg = i386_regtab + REGNAM_EAX + 4; /* esp is invalid as index */
8461
8462             /* What follows must be a valid scale.  */
8463             intel_match_token ('*');
8464             i.index_reg = reg;
8465             i.types[this_operand].bitfield.baseindex = 1;
8466
8467             /* Set the scale after setting the register (otherwise,
8468                i386_scale will complain)  */
8469             if (cur_token.code == '+' || cur_token.code == '-')
8470               {
8471                 char *str, sign = cur_token.code;
8472                 intel_match_token (cur_token.code);
8473                 if (cur_token.code != T_CONST)
8474                   {
8475                     as_bad (_("Syntax error: Expecting a constant, got `%s'"),
8476                             cur_token.str);
8477                     return 0;
8478                   }
8479                 str = (char *) xmalloc (strlen (cur_token.str) + 2);
8480                 strcpy (str + 1, cur_token.str);
8481                 *str = sign;
8482                 if (!i386_scale (str))
8483                   return 0;
8484                 free (str);
8485               }
8486             else if (!i386_scale (cur_token.str))
8487               return 0;
8488             intel_match_token (cur_token.code);
8489           }
8490
8491         /* No scaling. If this is a memory operand, the register is either a
8492            base register (first occurrence) or an index register (second
8493            occurrence).  */
8494         else if (intel_parser.in_bracket)
8495           {
8496
8497             if (!i.base_reg)
8498               i.base_reg = reg;
8499             else if (!i.index_reg)
8500               i.index_reg = reg;
8501             else
8502               {
8503                 as_bad (_("Too many register references in memory operand"));
8504                 return 0;
8505               }
8506
8507             i.types[this_operand].bitfield.baseindex = 1;
8508           }
8509
8510         /* It's neither base nor index.  */
8511         else if (!intel_parser.in_offset && !intel_parser.is_mem)
8512           {
8513             i386_operand_type temp = reg->reg_type;
8514             temp.bitfield.baseindex = 0;
8515             i.types[this_operand] = operand_type_or (i.types[this_operand],
8516                                                      temp);
8517             i.op[this_operand].regs = reg;
8518             i.reg_operands++;
8519           }
8520         else
8521           {
8522             as_bad (_("Invalid use of register"));
8523             return 0;
8524           }
8525
8526         /* Since registers are not part of the displacement string (except
8527            when we're parsing offset operands), we may need to remove any
8528            preceding '+' from the displacement string.  */
8529         if (*intel_parser.disp != '\0'
8530             && !intel_parser.in_offset)
8531           {
8532             char *s = intel_parser.disp;
8533             s += strlen (s) - 1;
8534             if (*s == '+')
8535               *s = '\0';
8536           }
8537
8538         return 1;
8539       }
8540
8541     /* e11  BYTE
8542             | WORD
8543             | DWORD
8544             | FWORD
8545             | QWORD
8546             | TBYTE
8547             | OWORD
8548             | XMMWORD  */
8549     case T_BYTE:
8550     case T_WORD:
8551     case T_DWORD:
8552     case T_FWORD:
8553     case T_QWORD:
8554     case T_TBYTE:
8555     case T_XMMWORD:
8556       intel_match_token (cur_token.code);
8557
8558       if (cur_token.code == T_PTR)
8559         return 1;
8560
8561       /* It must have been an identifier.  */
8562       intel_putback_token ();
8563       cur_token.code = T_ID;
8564       /* FALLTHRU */
8565
8566     /* e11  id
8567             | constant  */
8568     case T_ID:
8569       if (!intel_parser.in_offset && intel_parser.is_mem <= 0)
8570         {
8571           symbolS *symbolP;
8572
8573           /* The identifier represents a memory reference only if it's not
8574              preceded by an offset modifier and if it's not an equate.  */
8575           symbolP = symbol_find(cur_token.str);
8576           if (!symbolP || S_GET_SEGMENT(symbolP) != absolute_section)
8577             intel_parser.is_mem = 1;
8578         }
8579         /* FALLTHRU */
8580
8581     case T_CONST:
8582     case '-':
8583     case '+':
8584       {
8585         char *save_str, sign = 0;
8586
8587         /* Allow constants that start with `+' or `-'.  */
8588         if (cur_token.code == '-' || cur_token.code == '+')
8589           {
8590             sign = cur_token.code;
8591             intel_match_token (cur_token.code);
8592             if (cur_token.code != T_CONST)
8593               {
8594                 as_bad (_("Syntax error: Expecting a constant, got `%s'"),
8595                         cur_token.str);
8596                 return 0;
8597               }
8598           }
8599
8600         save_str = (char *) xmalloc (strlen (cur_token.str) + 2);
8601         strcpy (save_str + !!sign, cur_token.str);
8602         if (sign)
8603           *save_str = sign;
8604
8605         /* Get the next token to check for register scaling.  */
8606         intel_match_token (cur_token.code);
8607
8608         /* Check if this constant is a scaling factor for an
8609            index register.  */
8610         if (cur_token.code == '*')
8611           {
8612             if (intel_match_token ('*') && cur_token.code == T_REG)
8613               {
8614                 const reg_entry *reg = cur_token.reg;
8615
8616                 if (!intel_parser.in_bracket)
8617                   {
8618                     as_bad (_("Register scaling only allowed "
8619                               "in memory operands"));
8620                     return 0;
8621                   }
8622
8623                  /* Disallow things like [1*si].
8624                     sp and esp are invalid as index.  */
8625                 if (reg->reg_type.bitfield.reg16)
8626                   reg = i386_regtab + REGNAM_AX + 4;
8627                 else if (i.index_reg)
8628                   reg = i386_regtab + REGNAM_EAX + 4;
8629
8630                 /* The constant is followed by `* reg', so it must be
8631                    a valid scale.  */
8632                 i.index_reg = reg;
8633                 i.types[this_operand].bitfield.baseindex = 1;
8634
8635                 /* Set the scale after setting the register (otherwise,
8636                    i386_scale will complain)  */
8637                 if (!i386_scale (save_str))
8638                   return 0;
8639                 intel_match_token (T_REG);
8640
8641                 /* Since registers are not part of the displacement
8642                    string, we may need to remove any preceding '+' from
8643                    the displacement string.  */
8644                 if (*intel_parser.disp != '\0')
8645                   {
8646                     char *s = intel_parser.disp;
8647                     s += strlen (s) - 1;
8648                     if (*s == '+')
8649                       *s = '\0';
8650                   }
8651
8652                 free (save_str);
8653
8654                 return 1;
8655               }
8656
8657             /* The constant was not used for register scaling. Since we have
8658                already consumed the token following `*' we now need to put it
8659                back in the stream.  */
8660             intel_putback_token ();
8661           }
8662
8663         /* Add the constant to the displacement string.  */
8664         strcat (intel_parser.disp, save_str);
8665         free (save_str);
8666
8667         return 1;
8668       }
8669     }
8670
8671   as_bad (_("Unrecognized token '%s'"), cur_token.str);
8672   return 0;
8673 }
8674
8675 /* Match the given token against cur_token. If they match, read the next
8676    token from the operand string.  */
8677 static int
8678 intel_match_token (int code)
8679 {
8680   if (cur_token.code == code)
8681     {
8682       intel_get_token ();
8683       return 1;
8684     }
8685   else
8686     {
8687       as_bad (_("Unexpected token `%s'"), cur_token.str);
8688       return 0;
8689     }
8690 }
8691
8692 /* Read a new token from intel_parser.op_string and store it in cur_token.  */
8693 static void
8694 intel_get_token (void)
8695 {
8696   char *end_op;
8697   const reg_entry *reg;
8698   struct intel_token new_token;
8699
8700   new_token.code = T_NIL;
8701   new_token.reg = NULL;
8702   new_token.str = NULL;
8703
8704   /* Free the memory allocated to the previous token and move
8705      cur_token to prev_token.  */
8706   if (prev_token.str)
8707     free (prev_token.str);
8708
8709   prev_token = cur_token;
8710
8711   /* Skip whitespace.  */
8712   while (is_space_char (*intel_parser.op_string))
8713     intel_parser.op_string++;
8714
8715   /* Return an empty token if we find nothing else on the line.  */
8716   if (*intel_parser.op_string == '\0')
8717     {
8718       cur_token = new_token;
8719       return;
8720     }
8721
8722   /* The new token cannot be larger than the remainder of the operand
8723      string.  */
8724   new_token.str = (char *) xmalloc (strlen (intel_parser.op_string) + 1);
8725   new_token.str[0] = '\0';
8726
8727   if (strchr ("0123456789", *intel_parser.op_string))
8728     {
8729       char *p = new_token.str;
8730       char *q = intel_parser.op_string;
8731       new_token.code = T_CONST;
8732
8733       /* Allow any kind of identifier char to encompass floating point and
8734          hexadecimal numbers.  */
8735       while (is_identifier_char (*q))
8736         *p++ = *q++;
8737       *p = '\0';
8738
8739       /* Recognize special symbol names [0-9][bf].  */
8740       if (strlen (intel_parser.op_string) == 2
8741           && (intel_parser.op_string[1] == 'b'
8742               || intel_parser.op_string[1] == 'f'))
8743         new_token.code = T_ID;
8744     }
8745
8746   else if ((reg = parse_register (intel_parser.op_string, &end_op)) != NULL)
8747     {
8748       size_t len = end_op - intel_parser.op_string;
8749
8750       new_token.code = T_REG;
8751       new_token.reg = reg;
8752
8753       memcpy (new_token.str, intel_parser.op_string, len);
8754       new_token.str[len] = '\0';
8755     }
8756
8757   else if (is_identifier_char (*intel_parser.op_string))
8758     {
8759       char *p = new_token.str;
8760       char *q = intel_parser.op_string;
8761
8762       /* A '.' or '$' followed by an identifier char is an identifier.
8763          Otherwise, it's operator '.' followed by an expression.  */
8764       if ((*q == '.' || *q == '$') && !is_identifier_char (*(q + 1)))
8765         {
8766           new_token.code = '.';
8767           new_token.str[0] = '.';
8768           new_token.str[1] = '\0';
8769         }
8770       else
8771         {
8772           while (is_identifier_char (*q) || *q == '@')
8773             *p++ = *q++;
8774           *p = '\0';
8775
8776           if (strcasecmp (new_token.str, "NOT") == 0)
8777             new_token.code = '~';
8778
8779           else if (strcasecmp (new_token.str, "MOD") == 0)
8780             new_token.code = '%';
8781
8782           else if (strcasecmp (new_token.str, "AND") == 0)
8783             new_token.code = '&';
8784
8785           else if (strcasecmp (new_token.str, "OR") == 0)
8786             new_token.code = '|';
8787
8788           else if (strcasecmp (new_token.str, "XOR") == 0)
8789             new_token.code = '^';
8790
8791           else if (strcasecmp (new_token.str, "SHL") == 0)
8792             new_token.code = T_SHL;
8793
8794           else if (strcasecmp (new_token.str, "SHR") == 0)
8795             new_token.code = T_SHR;
8796
8797           else if (strcasecmp (new_token.str, "BYTE") == 0)
8798             new_token.code = T_BYTE;
8799
8800           else if (strcasecmp (new_token.str, "WORD") == 0)
8801             new_token.code = T_WORD;
8802
8803           else if (strcasecmp (new_token.str, "DWORD") == 0)
8804             new_token.code = T_DWORD;
8805
8806           else if (strcasecmp (new_token.str, "FWORD") == 0)
8807             new_token.code = T_FWORD;
8808
8809           else if (strcasecmp (new_token.str, "QWORD") == 0)
8810             new_token.code = T_QWORD;
8811
8812           else if (strcasecmp (new_token.str, "TBYTE") == 0
8813                    /* XXX remove (gcc still uses it) */
8814                    || strcasecmp (new_token.str, "XWORD") == 0)
8815             new_token.code = T_TBYTE;
8816
8817           else if (strcasecmp (new_token.str, "XMMWORD") == 0
8818                    || strcasecmp (new_token.str, "OWORD") == 0)
8819             new_token.code = T_XMMWORD;
8820
8821           else if (strcasecmp (new_token.str, "PTR") == 0)
8822             new_token.code = T_PTR;
8823
8824           else if (strcasecmp (new_token.str, "SHORT") == 0)
8825             new_token.code = T_SHORT;
8826
8827           else if (strcasecmp (new_token.str, "OFFSET") == 0)
8828             {
8829               new_token.code = T_OFFSET;
8830
8831               /* ??? This is not mentioned in the MASM grammar but gcc
8832                      makes use of it with -mintel-syntax.  OFFSET may be
8833                      followed by FLAT:  */
8834               if (strncasecmp (q, " FLAT:", 6) == 0)
8835                 strcat (new_token.str, " FLAT:");
8836             }
8837
8838           /* ??? This is not mentioned in the MASM grammar.  */
8839           else if (strcasecmp (new_token.str, "FLAT") == 0)
8840             {
8841               new_token.code = T_OFFSET;
8842               if (*q == ':')
8843                 strcat (new_token.str, ":");
8844               else
8845                 as_bad (_("`:' expected"));
8846             }
8847
8848           else
8849             new_token.code = T_ID;
8850         }
8851     }
8852
8853   else if (strchr ("+-/*%|&^:[]()~", *intel_parser.op_string))
8854     {
8855       new_token.code = *intel_parser.op_string;
8856       new_token.str[0] = *intel_parser.op_string;
8857       new_token.str[1] = '\0';
8858     }
8859
8860   else if (strchr ("<>", *intel_parser.op_string)
8861            && *intel_parser.op_string == *(intel_parser.op_string + 1))
8862     {
8863       new_token.code = *intel_parser.op_string == '<' ? T_SHL : T_SHR;
8864       new_token.str[0] = *intel_parser.op_string;
8865       new_token.str[1] = *intel_parser.op_string;
8866       new_token.str[2] = '\0';
8867     }
8868
8869   else
8870     as_bad (_("Unrecognized token `%s'"), intel_parser.op_string);
8871
8872   intel_parser.op_string += strlen (new_token.str);
8873   cur_token = new_token;
8874 }
8875
8876 /* Put cur_token back into the token stream and make cur_token point to
8877    prev_token.  */
8878 static void
8879 intel_putback_token (void)
8880 {
8881   if (cur_token.code != T_NIL)
8882     {
8883       intel_parser.op_string -= strlen (cur_token.str);
8884       free (cur_token.str);
8885     }
8886   cur_token = prev_token;
8887
8888   /* Forget prev_token.  */
8889   prev_token.code = T_NIL;
8890   prev_token.reg = NULL;
8891   prev_token.str = NULL;
8892 }
8893
8894 int
8895 tc_x86_regname_to_dw2regnum (char *regname)
8896 {
8897   unsigned int regnum;
8898   unsigned int regnames_count;
8899   static const char *const regnames_32[] =
8900     {
8901       "eax", "ecx", "edx", "ebx",
8902       "esp", "ebp", "esi", "edi",
8903       "eip", "eflags", NULL,
8904       "st0", "st1", "st2", "st3",
8905       "st4", "st5", "st6", "st7",
8906       NULL, NULL,
8907       "xmm0", "xmm1", "xmm2", "xmm3",
8908       "xmm4", "xmm5", "xmm6", "xmm7",
8909       "mm0", "mm1", "mm2", "mm3",
8910       "mm4", "mm5", "mm6", "mm7",
8911       "fcw", "fsw", "mxcsr",
8912       "es", "cs", "ss", "ds", "fs", "gs", NULL, NULL,
8913       "tr", "ldtr"
8914     };
8915   static const char *const regnames_64[] =
8916     {
8917       "rax", "rdx", "rcx", "rbx",
8918       "rsi", "rdi", "rbp", "rsp",
8919       "r8",  "r9",  "r10", "r11",
8920       "r12", "r13", "r14", "r15",
8921       "rip",
8922       "xmm0",  "xmm1",  "xmm2",  "xmm3",
8923       "xmm4",  "xmm5",  "xmm6",  "xmm7",
8924       "xmm8",  "xmm9",  "xmm10", "xmm11",
8925       "xmm12", "xmm13", "xmm14", "xmm15",
8926       "st0", "st1", "st2", "st3",
8927       "st4", "st5", "st6", "st7",
8928       "mm0", "mm1", "mm2", "mm3",
8929       "mm4", "mm5", "mm6", "mm7",
8930       "rflags",
8931       "es", "cs", "ss", "ds", "fs", "gs", NULL, NULL,
8932       "fs.base", "gs.base", NULL, NULL,
8933       "tr", "ldtr",
8934       "mxcsr", "fcw", "fsw"
8935     };
8936   const char *const *regnames;
8937
8938   if (flag_code == CODE_64BIT)
8939     {
8940       regnames = regnames_64;
8941       regnames_count = ARRAY_SIZE (regnames_64);
8942     }
8943   else
8944     {
8945       regnames = regnames_32;
8946       regnames_count = ARRAY_SIZE (regnames_32);
8947     }
8948
8949   for (regnum = 0; regnum < regnames_count; regnum++)
8950     if (regnames[regnum] != NULL
8951         && strcmp (regname, regnames[regnum]) == 0)
8952       return regnum;
8953
8954   return -1;
8955 }
8956
8957 void
8958 tc_x86_frame_initial_instructions (void)
8959 {
8960   static unsigned int sp_regno;
8961
8962   if (!sp_regno)
8963     sp_regno = tc_x86_regname_to_dw2regnum (flag_code == CODE_64BIT
8964                                             ? "rsp" : "esp");
8965
8966   cfi_add_CFA_def_cfa (sp_regno, -x86_cie_data_alignment);
8967   cfi_add_CFA_offset (x86_dwarf2_return_column, x86_cie_data_alignment);
8968 }
8969
8970 int
8971 i386_elf_section_type (const char *str, size_t len)
8972 {
8973   if (flag_code == CODE_64BIT
8974       && len == sizeof ("unwind") - 1
8975       && strncmp (str, "unwind", 6) == 0)
8976     return SHT_X86_64_UNWIND;
8977
8978   return -1;
8979 }
8980
8981 #ifdef TE_PE
8982 void
8983 tc_pe_dwarf2_emit_offset (symbolS *symbol, unsigned int size)
8984 {
8985   expressionS expr;
8986
8987   expr.X_op = O_secrel;
8988   expr.X_add_symbol = symbol;
8989   expr.X_add_number = 0;
8990   emit_expr (&expr, size);
8991 }
8992 #endif
8993
8994 #if defined (OBJ_ELF) || defined (OBJ_MAYBE_ELF)
8995 /* For ELF on x86-64, add support for SHF_X86_64_LARGE.  */
8996
8997 int
8998 x86_64_section_letter (int letter, char **ptr_msg)
8999 {
9000   if (flag_code == CODE_64BIT)
9001     {
9002       if (letter == 'l')
9003         return SHF_X86_64_LARGE;
9004
9005       *ptr_msg = _("Bad .section directive: want a,l,w,x,M,S,G,T in string");
9006     }
9007   else
9008     *ptr_msg = _("Bad .section directive: want a,w,x,M,S,G,T in string");
9009   return -1;
9010 }
9011
9012 int
9013 x86_64_section_word (char *str, size_t len)
9014 {
9015   if (len == 5 && flag_code == CODE_64BIT && CONST_STRNEQ (str, "large"))
9016     return SHF_X86_64_LARGE;
9017
9018   return -1;
9019 }
9020
9021 static void
9022 handle_large_common (int small ATTRIBUTE_UNUSED)
9023 {
9024   if (flag_code != CODE_64BIT)
9025     {
9026       s_comm_internal (0, elf_common_parse);
9027       as_warn (_(".largecomm supported only in 64bit mode, producing .comm"));
9028     }
9029   else
9030     {
9031       static segT lbss_section;
9032       asection *saved_com_section_ptr = elf_com_section_ptr;
9033       asection *saved_bss_section = bss_section;
9034
9035       if (lbss_section == NULL)
9036         {
9037           flagword applicable;
9038           segT seg = now_seg;
9039           subsegT subseg = now_subseg;
9040
9041           /* The .lbss section is for local .largecomm symbols.  */
9042           lbss_section = subseg_new (".lbss", 0);
9043           applicable = bfd_applicable_section_flags (stdoutput);
9044           bfd_set_section_flags (stdoutput, lbss_section,
9045                                  applicable & SEC_ALLOC);
9046           seg_info (lbss_section)->bss = 1;
9047
9048           subseg_set (seg, subseg);
9049         }
9050
9051       elf_com_section_ptr = &_bfd_elf_large_com_section;
9052       bss_section = lbss_section;
9053
9054       s_comm_internal (0, elf_common_parse);
9055
9056       elf_com_section_ptr = saved_com_section_ptr;
9057       bss_section = saved_bss_section;
9058     }
9059 }
9060 #endif /* OBJ_ELF || OBJ_MAYBE_ELF */