From Cary Coutant: More shared library support, some refactorization.
[external/binutils.git] / gold / symtab.h
1 // symtab.h -- the gold symbol table   -*- C++ -*-
2
3 // Copyright 2006, 2007 Free Software Foundation, Inc.
4 // Written by Ian Lance Taylor <iant@google.com>.
5
6 // This file is part of gold.
7
8 // This program is free software; you can redistribute it and/or modify
9 // it under the terms of the GNU General Public License as published by
10 // the Free Software Foundation; either version 3 of the License, or
11 // (at your option) any later version.
12
13 // This program is distributed in the hope that it will be useful,
14 // but WITHOUT ANY WARRANTY; without even the implied warranty of
15 // MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16 // GNU General Public License for more details.
17
18 // You should have received a copy of the GNU General Public License
19 // along with this program; if not, write to the Free Software
20 // Foundation, Inc., 51 Franklin Street - Fifth Floor, Boston,
21 // MA 02110-1301, USA.
22
23 // Symbol_table
24 //   The symbol table.
25
26 #include <string>
27 #include <utility>
28 #include <vector>
29
30 #include "elfcpp.h"
31 #include "parameters.h"
32 #include "stringpool.h"
33 #include "object.h"
34
35 #ifndef GOLD_SYMTAB_H
36 #define GOLD_SYMTAB_H
37
38 namespace gold
39 {
40
41 class Object;
42 class Relobj;
43 template<int size, bool big_endian>
44 class Sized_relobj;
45 class Dynobj;
46 template<int size, bool big_endian>
47 class Sized_dynobj;
48 class Versions;
49 class Output_data;
50 class Output_section;
51 class Output_segment;
52 class Output_file;
53 class Target;
54
55 // The base class of an entry in the symbol table.  The symbol table
56 // can have a lot of entries, so we don't want this class to big.
57 // Size dependent fields can be found in the template class
58 // Sized_symbol.  Targets may support their own derived classes.
59
60 class Symbol
61 {
62  public:
63   // Because we want the class to be small, we don't use any virtual
64   // functions.  But because symbols can be defined in different
65   // places, we need to classify them.  This enum is the different
66   // sources of symbols we support.
67   enum Source
68   {
69     // Symbol defined in a relocatable or dynamic input file--this is
70     // the most common case.
71     FROM_OBJECT,
72     // Symbol defined in an Output_data, a special section created by
73     // the target.
74     IN_OUTPUT_DATA,
75     // Symbol defined in an Output_segment, with no associated
76     // section.
77     IN_OUTPUT_SEGMENT,
78     // Symbol value is constant.
79     CONSTANT
80   };
81
82   // When the source is IN_OUTPUT_SEGMENT, we need to describe what
83   // the offset means.
84   enum Segment_offset_base
85   {
86     // From the start of the segment.
87     SEGMENT_START,
88     // From the end of the segment.
89     SEGMENT_END,
90     // From the filesz of the segment--i.e., after the loaded bytes
91     // but before the bytes which are allocated but zeroed.
92     SEGMENT_BSS
93   };
94
95   // Return the symbol name.
96   const char*
97   name() const
98   { return this->name_; }
99
100   // Return the symbol version.  This will return NULL for an
101   // unversioned symbol.
102   const char*
103   version() const
104   { return this->version_; }
105
106   // Return the symbol source.
107   Source
108   source() const
109   { return this->source_; }
110
111   // Return the object with which this symbol is associated.
112   Object*
113   object() const
114   {
115     gold_assert(this->source_ == FROM_OBJECT);
116     return this->u_.from_object.object;
117   }
118
119   // Return the index of the section in the input relocatable or
120   // dynamic object file.
121   unsigned int
122   shndx() const
123   {
124     gold_assert(this->source_ == FROM_OBJECT);
125     return this->u_.from_object.shndx;
126   }
127
128   // Return the output data section with which this symbol is
129   // associated, if the symbol was specially defined with respect to
130   // an output data section.
131   Output_data*
132   output_data() const
133   {
134     gold_assert(this->source_ == IN_OUTPUT_DATA);
135     return this->u_.in_output_data.output_data;
136   }
137
138   // If this symbol was defined with respect to an output data
139   // section, return whether the value is an offset from end.
140   bool
141   offset_is_from_end() const
142   {
143     gold_assert(this->source_ == IN_OUTPUT_DATA);
144     return this->u_.in_output_data.offset_is_from_end;
145   }
146
147   // Return the output segment with which this symbol is associated,
148   // if the symbol was specially defined with respect to an output
149   // segment.
150   Output_segment*
151   output_segment() const
152   {
153     gold_assert(this->source_ == IN_OUTPUT_SEGMENT);
154     return this->u_.in_output_segment.output_segment;
155   }
156
157   // If this symbol was defined with respect to an output segment,
158   // return the offset base.
159   Segment_offset_base
160   offset_base() const
161   {
162     gold_assert(this->source_ == IN_OUTPUT_SEGMENT);
163     return this->u_.in_output_segment.offset_base;
164   }
165
166   // Return the symbol binding.
167   elfcpp::STB
168   binding() const
169   { return this->binding_; }
170
171   // Return the symbol type.
172   elfcpp::STT
173   type() const
174   { return this->type_; }
175
176   // Return the symbol visibility.
177   elfcpp::STV
178   visibility() const
179   { return this->visibility_; }
180
181   // Return the non-visibility part of the st_other field.
182   unsigned char
183   nonvis() const
184   { return this->nonvis_; }
185
186   // Return whether this symbol is a forwarder.  This will never be
187   // true of a symbol found in the hash table, but may be true of
188   // symbol pointers attached to object files.
189   bool
190   is_forwarder() const
191   { return this->is_forwarder_; }
192
193   // Mark this symbol as a forwarder.
194   void
195   set_forwarder()
196   { this->is_forwarder_ = true; }
197
198   // Return whether this symbol has an alias in the weak aliases table
199   // in Symbol_table.
200   bool
201   has_alias() const
202   { return this->has_alias_; }
203
204   // Mark this symbol as having an alias.
205   void
206   set_has_alias()
207   { this->has_alias_ = true; }
208
209   // Return whether this symbol needs an entry in the dynamic symbol
210   // table.
211   bool
212   needs_dynsym_entry() const
213   {
214     return (this->needs_dynsym_entry_
215             || (this->in_reg() && this->in_dyn()));
216   }
217
218   // Mark this symbol as needing an entry in the dynamic symbol table.
219   void
220   set_needs_dynsym_entry()
221   { this->needs_dynsym_entry_ = true; }
222
223   // Return whether this symbol should be added to the dynamic symbol
224   // table.
225   bool
226   should_add_dynsym_entry() const;
227
228   // Return whether this symbol has been seen in a regular object.
229   bool
230   in_reg() const
231   { return this->in_reg_; }
232
233   // Mark this symbol as having been seen in a regular object.
234   void
235   set_in_reg()
236   { this->in_reg_ = true; }
237
238   // Return whether this symbol has been seen in a dynamic object.
239   bool
240   in_dyn() const
241   { return this->in_dyn_; }
242
243   // Mark this symbol as having been seen in a dynamic object.
244   void
245   set_in_dyn()
246   { this->in_dyn_ = true; }
247
248   // Return the index of this symbol in the output file symbol table.
249   // A value of -1U means that this symbol is not going into the
250   // output file.  This starts out as zero, and is set to a non-zero
251   // value by Symbol_table::finalize.  It is an error to ask for the
252   // symbol table index before it has been set.
253   unsigned int
254   symtab_index() const
255   {
256     gold_assert(this->symtab_index_ != 0);
257     return this->symtab_index_;
258   }
259
260   // Set the index of the symbol in the output file symbol table.
261   void
262   set_symtab_index(unsigned int index)
263   {
264     gold_assert(index != 0);
265     this->symtab_index_ = index;
266   }
267
268   // Return whether this symbol already has an index in the output
269   // file symbol table.
270   bool
271   has_symtab_index() const
272   { return this->symtab_index_ != 0; }
273
274   // Return the index of this symbol in the dynamic symbol table.  A
275   // value of -1U means that this symbol is not going into the dynamic
276   // symbol table.  This starts out as zero, and is set to a non-zero
277   // during Layout::finalize.  It is an error to ask for the dynamic
278   // symbol table index before it has been set.
279   unsigned int
280   dynsym_index() const
281   {
282     gold_assert(this->dynsym_index_ != 0);
283     return this->dynsym_index_;
284   }
285
286   // Set the index of the symbol in the dynamic symbol table.
287   void
288   set_dynsym_index(unsigned int index)
289   {
290     gold_assert(index != 0);
291     this->dynsym_index_ = index;
292   }
293
294   // Return whether this symbol already has an index in the dynamic
295   // symbol table.
296   bool
297   has_dynsym_index() const
298   { return this->dynsym_index_ != 0; }
299
300   // Return whether this symbol has an entry in the GOT section.
301   bool
302   has_got_offset() const
303   { return this->has_got_offset_; }
304
305   // Return the offset into the GOT section of this symbol.
306   unsigned int
307   got_offset() const
308   {
309     gold_assert(this->has_got_offset());
310     return this->got_offset_;
311   }
312
313   // Set the GOT offset of this symbol.
314   void
315   set_got_offset(unsigned int got_offset)
316   {
317     this->has_got_offset_ = true;
318     this->got_offset_ = got_offset;
319   }
320
321   // Return whether this symbol has an entry in the PLT section.
322   bool
323   has_plt_offset() const
324   { return this->has_plt_offset_; }
325
326   // Return the offset into the PLT section of this symbol.
327   unsigned int
328   plt_offset() const
329   {
330     gold_assert(this->has_plt_offset());
331     return this->plt_offset_;
332   }
333
334   // Set the PLT offset of this symbol.
335   void
336   set_plt_offset(unsigned int plt_offset)
337   {
338     this->has_plt_offset_ = true;
339     this->plt_offset_ = plt_offset;
340   }
341
342   // Return whether this dynamic symbol needs a special value in the
343   // dynamic symbol table.
344   bool
345   needs_dynsym_value() const
346   { return this->needs_dynsym_value_; }
347
348   // Set that this dynamic symbol needs a special value in the dynamic
349   // symbol table.
350   void
351   set_needs_dynsym_value()
352   {
353     gold_assert(this->object()->is_dynamic());
354     this->needs_dynsym_value_ = true;
355   }
356
357   // Return true if the final value of this symbol is known at link
358   // time.
359   bool
360   final_value_is_known() const;
361
362   // Return whether this is a defined symbol (not undefined or
363   // common).
364   bool
365   is_defined() const
366   {
367     return (this->source_ != FROM_OBJECT
368             || (this->shndx() != elfcpp::SHN_UNDEF
369                 && this->shndx() != elfcpp::SHN_COMMON));
370   }
371
372   // Return true if this symbol is from a dynamic object.
373   bool
374   is_from_dynobj() const
375   {
376     return this->source_ == FROM_OBJECT && this->object()->is_dynamic();
377   }
378
379   // Return whether this is an undefined symbol.
380   bool
381   is_undefined() const
382   {
383     return this->source_ == FROM_OBJECT && this->shndx() == elfcpp::SHN_UNDEF;
384   }
385
386   // Return whether this is a common symbol.
387   bool
388   is_common() const
389   {
390     return (this->source_ == FROM_OBJECT
391             && (this->shndx() == elfcpp::SHN_COMMON
392                 || this->type_ == elfcpp::STT_COMMON));
393   }
394
395   // Return whether this symbol can be seen outside this object.
396   bool
397   is_externally_visible() const
398   {
399     return (this->visibility_ == elfcpp::STV_DEFAULT
400             || this->visibility_ == elfcpp::STV_PROTECTED);
401   }
402
403   // Return true if this symbol can be preempted by a definition in
404   // another link unit.
405   bool
406   is_preemptible() const
407   {
408     return (this->visibility_ != elfcpp::STV_INTERNAL
409             && this->visibility_ != elfcpp::STV_HIDDEN
410             && this->visibility_ != elfcpp::STV_PROTECTED
411             && parameters->output_is_shared()
412             && !parameters->symbolic());
413   }
414
415   // Return true if this symbol is a function that needs a PLT entry.
416   // If the symbol is defined in a dynamic object or if it is subject
417   // to pre-emption, we need to make a PLT entry.
418   bool
419   needs_plt_entry() const
420   {
421     return (this->type() == elfcpp::STT_FUNC
422             && (this->is_from_dynobj() || this->is_preemptible()));
423   }
424
425   // Given a direct absolute or pc-relative static relocation against
426   // the global symbol, this function returns whether a dynamic relocation
427   // is needed.
428
429   bool
430   needs_dynamic_reloc(bool is_absolute_ref, bool is_function_call) const
431   {
432     // An absolute reference within a position-independent output file
433     // will need a dynamic relocaion.
434     if (is_absolute_ref && parameters->output_is_position_independent())
435       return true;
436
437     // A function call that can branch to a local PLT entry does not need
438     // a dynamic relocation.
439     if (is_function_call && this->has_plt_offset())
440       return false;
441
442     // A reference to any PLT entry in a non-position-independent executable
443     // does not need a dynamic relocation.
444     if (!parameters->output_is_position_independent()
445         && this->has_plt_offset())
446       return false;
447
448     // A reference to a symbol defined in a dynamic object or to a
449     // symbol that is preemptible will need a dynamic relocation.
450     if (this->is_from_dynobj() || this->is_preemptible())
451       return true;
452
453     // For all other cases, return FALSE.
454     return false;
455   }
456
457   // Given a direct absolute static relocation against
458   // the global symbol, where a dynamic relocation is needed, this
459   // function returns whether a relative dynamic relocation can be used.
460   // The caller must determine separately whether the static relocation
461   // is compatible with a relative relocation.
462
463   bool
464   can_use_relative_reloc(bool is_function_call) const
465   {
466     // A function call that can branch to a local PLT entry can
467     // use a RELATIVE relocation.
468     if (is_function_call && this->has_plt_offset())
469       return true;
470
471     // A reference to a symbol defined in a dynamic object or to a
472     // symbol that is preemptible can not use a RELATIVE relocaiton.
473     if (this->is_from_dynobj() || this->is_preemptible())
474       return false;
475
476     // For all other cases, return TRUE.
477     return true;
478   }
479
480   // Return whether there should be a warning for references to this
481   // symbol.
482   bool
483   has_warning() const
484   { return this->has_warning_; }
485
486   // Mark this symbol as having a warning.
487   void
488   set_has_warning()
489   { this->has_warning_ = true; }
490
491   // Return whether this symbol is defined by a COPY reloc from a
492   // dynamic object.
493   bool
494   is_copied_from_dynobj() const
495   { return this->is_copied_from_dynobj_; }
496
497   // Mark this symbol as defined by a COPY reloc.
498   void
499   set_is_copied_from_dynobj()
500   { this->is_copied_from_dynobj_ = true; }
501
502   // Mark this symbol as needing its value written to the GOT even when
503   // the value is subject to dynamic relocation (e.g., when the target
504   // uses a RELATIVE relocation for the GOT entry).
505   void
506   set_needs_value_in_got()
507   { this->needs_value_in_got_ = true; }
508
509   // Return whether this symbol needs its value written to the GOT even
510   // when the value is subject to dynamic relocation.
511   bool
512   needs_value_in_got() const
513   { return this->needs_value_in_got_; }
514
515  protected:
516   // Instances of this class should always be created at a specific
517   // size.
518   Symbol()
519   { memset(this, 0, sizeof *this); }
520
521   // Initialize the general fields.
522   void
523   init_fields(const char* name, const char* version,
524               elfcpp::STT type, elfcpp::STB binding,
525               elfcpp::STV visibility, unsigned char nonvis);
526
527   // Initialize fields from an ELF symbol in OBJECT.
528   template<int size, bool big_endian>
529   void
530   init_base(const char *name, const char* version, Object* object,
531             const elfcpp::Sym<size, big_endian>&);
532
533   // Initialize fields for an Output_data.
534   void
535   init_base(const char* name, Output_data*, elfcpp::STT, elfcpp::STB,
536             elfcpp::STV, unsigned char nonvis, bool offset_is_from_end);
537
538   // Initialize fields for an Output_segment.
539   void
540   init_base(const char* name, Output_segment* os, elfcpp::STT type,
541             elfcpp::STB binding, elfcpp::STV visibility,
542             unsigned char nonvis, Segment_offset_base offset_base);
543
544   // Initialize fields for a constant.
545   void
546   init_base(const char* name, elfcpp::STT type, elfcpp::STB binding,
547             elfcpp::STV visibility, unsigned char nonvis);
548
549   // Override existing symbol.
550   template<int size, bool big_endian>
551   void
552   override_base(const elfcpp::Sym<size, big_endian>&, Object* object,
553                 const char* version);
554
555   // Override existing symbol with a special symbol.
556   void
557   override_base_with_special(const Symbol* from);
558
559  private:
560   Symbol(const Symbol&);
561   Symbol& operator=(const Symbol&);
562
563   // Symbol name (expected to point into a Stringpool).
564   const char* name_;
565   // Symbol version (expected to point into a Stringpool).  This may
566   // be NULL.
567   const char* version_;
568
569   union
570   {
571     // This struct is used if SOURCE_ == FROM_OBJECT.
572     struct
573     {
574       // Object in which symbol is defined, or in which it was first
575       // seen.
576       Object* object;
577       // Section number in object_ in which symbol is defined.
578       unsigned int shndx;
579     } from_object;
580
581     // This struct is used if SOURCE_ == IN_OUTPUT_DATA.
582     struct
583     {
584       // Output_data in which symbol is defined.  Before
585       // Layout::finalize the symbol's value is an offset within the
586       // Output_data.
587       Output_data* output_data;
588       // True if the offset is from the end, false if the offset is
589       // from the beginning.
590       bool offset_is_from_end;
591     } in_output_data;
592
593     // This struct is used if SOURCE_ == IN_OUTPUT_SEGMENT.
594     struct
595     {
596       // Output_segment in which the symbol is defined.  Before
597       // Layout::finalize the symbol's value is an offset.
598       Output_segment* output_segment;
599       // The base to use for the offset before Layout::finalize.
600       Segment_offset_base offset_base;
601     } in_output_segment;
602   } u_;
603
604   // The index of this symbol in the output file.  If the symbol is
605   // not going into the output file, this value is -1U.  This field
606   // starts as always holding zero.  It is set to a non-zero value by
607   // Symbol_table::finalize.
608   unsigned int symtab_index_;
609
610   // The index of this symbol in the dynamic symbol table.  If the
611   // symbol is not going into the dynamic symbol table, this value is
612   // -1U.  This field starts as always holding zero.  It is set to a
613   // non-zero value during Layout::finalize.
614   unsigned int dynsym_index_;
615
616   // If this symbol has an entry in the GOT section (has_got_offset_
617   // is true), this is the offset from the start of the GOT section.
618   unsigned int got_offset_;
619
620   // If this symbol has an entry in the PLT section (has_plt_offset_
621   // is true), then this is the offset from the start of the PLT
622   // section.
623   unsigned int plt_offset_;
624
625   // Symbol type.
626   elfcpp::STT type_ : 4;
627   // Symbol binding.
628   elfcpp::STB binding_ : 4;
629   // Symbol visibility.
630   elfcpp::STV visibility_ : 2;
631   // Rest of symbol st_other field.
632   unsigned int nonvis_ : 6;
633   // The type of symbol.
634   Source source_ : 3;
635   // True if this symbol always requires special target-specific
636   // handling.
637   bool is_target_special_ : 1;
638   // True if this is the default version of the symbol.
639   bool is_def_ : 1;
640   // True if this symbol really forwards to another symbol.  This is
641   // used when we discover after the fact that two different entries
642   // in the hash table really refer to the same symbol.  This will
643   // never be set for a symbol found in the hash table, but may be set
644   // for a symbol found in the list of symbols attached to an Object.
645   // It forwards to the symbol found in the forwarders_ map of
646   // Symbol_table.
647   bool is_forwarder_ : 1;
648   // True if the symbol has an alias in the weak_aliases table in
649   // Symbol_table.
650   bool has_alias_ : 1;
651   // True if this symbol needs to be in the dynamic symbol table.
652   bool needs_dynsym_entry_ : 1;
653   // True if we've seen this symbol in a regular object.
654   bool in_reg_ : 1;
655   // True if we've seen this symbol in a dynamic object.
656   bool in_dyn_ : 1;
657   // True if the symbol has an entry in the GOT section.
658   bool has_got_offset_ : 1;
659   // True if the symbol has an entry in the PLT section.
660   bool has_plt_offset_ : 1;
661   // True if this is a dynamic symbol which needs a special value in
662   // the dynamic symbol table.
663   bool needs_dynsym_value_ : 1;
664   // True if there is a warning for this symbol.
665   bool has_warning_ : 1;
666   // True if we are using a COPY reloc for this symbol, so that the
667   // real definition lives in a dynamic object.
668   bool is_copied_from_dynobj_ : 1;
669   // True if the static value should be written to the GOT even
670   // when the final value is subject to dynamic relocation.
671   bool needs_value_in_got_ : 1;
672 };
673
674 // The parts of a symbol which are size specific.  Using a template
675 // derived class like this helps us use less space on a 32-bit system.
676
677 template<int size>
678 class Sized_symbol : public Symbol
679 {
680  public:
681   typedef typename elfcpp::Elf_types<size>::Elf_Addr Value_type;
682   typedef typename elfcpp::Elf_types<size>::Elf_WXword Size_type;
683
684   Sized_symbol()
685   { }
686
687   // Initialize fields from an ELF symbol in OBJECT.
688   template<bool big_endian>
689   void
690   init(const char *name, const char* version, Object* object,
691        const elfcpp::Sym<size, big_endian>&);
692
693   // Initialize fields for an Output_data.
694   void
695   init(const char* name, Output_data*, Value_type value, Size_type symsize,
696        elfcpp::STT, elfcpp::STB, elfcpp::STV, unsigned char nonvis,
697        bool offset_is_from_end);
698
699   // Initialize fields for an Output_segment.
700   void
701   init(const char* name, Output_segment*, Value_type value, Size_type symsize,
702        elfcpp::STT, elfcpp::STB, elfcpp::STV, unsigned char nonvis,
703        Segment_offset_base offset_base);
704
705   // Initialize fields for a constant.
706   void
707   init(const char* name, Value_type value, Size_type symsize,
708        elfcpp::STT, elfcpp::STB, elfcpp::STV, unsigned char nonvis);
709
710   // Override existing symbol.
711   template<bool big_endian>
712   void
713   override(const elfcpp::Sym<size, big_endian>&, Object* object,
714            const char* version);
715
716   // Override existing symbol with a special symbol.
717   void
718   override_with_special(const Sized_symbol<size>*);
719
720   // Return the symbol's value.
721   Value_type
722   value() const
723   { return this->value_; }
724
725   // Return the symbol's size (we can't call this 'size' because that
726   // is a template parameter).
727   Size_type
728   symsize() const
729   { return this->symsize_; }
730
731   // Set the symbol size.  This is used when resolving common symbols.
732   void
733   set_symsize(Size_type symsize)
734   { this->symsize_ = symsize; }
735
736   // Set the symbol value.  This is called when we store the final
737   // values of the symbols into the symbol table.
738   void
739   set_value(Value_type value)
740   { this->value_ = value; }
741
742  private:
743   Sized_symbol(const Sized_symbol&);
744   Sized_symbol& operator=(const Sized_symbol&);
745
746   // Symbol value.  Before Layout::finalize this is the offset in the
747   // input section.  This is set to the final value during
748   // Layout::finalize.
749   Value_type value_;
750   // Symbol size.
751   Size_type symsize_;
752 };
753
754 // A struct describing a symbol defined by the linker, where the value
755 // of the symbol is defined based on an output section.  This is used
756 // for symbols defined by the linker, like "_init_array_start".
757
758 struct Define_symbol_in_section
759 {
760   // The symbol name.
761   const char* name;
762   // The name of the output section with which this symbol should be
763   // associated.  If there is no output section with that name, the
764   // symbol will be defined as zero.
765   const char* output_section;
766   // The offset of the symbol within the output section.  This is an
767   // offset from the start of the output section, unless start_at_end
768   // is true, in which case this is an offset from the end of the
769   // output section.
770   uint64_t value;
771   // The size of the symbol.
772   uint64_t size;
773   // The symbol type.
774   elfcpp::STT type;
775   // The symbol binding.
776   elfcpp::STB binding;
777   // The symbol visibility.
778   elfcpp::STV visibility;
779   // The rest of the st_other field.
780   unsigned char nonvis;
781   // If true, the value field is an offset from the end of the output
782   // section.
783   bool offset_is_from_end;
784   // If true, this symbol is defined only if we see a reference to it.
785   bool only_if_ref;
786 };
787
788 // A struct describing a symbol defined by the linker, where the value
789 // of the symbol is defined based on a segment.  This is used for
790 // symbols defined by the linker, like "_end".  We describe the
791 // segment with which the symbol should be associated by its
792 // characteristics.  If no segment meets these characteristics, the
793 // symbol will be defined as zero.  If there is more than one segment
794 // which meets these characteristics, we will use the first one.
795
796 struct Define_symbol_in_segment
797 {
798   // The symbol name.
799   const char* name;
800   // The segment type where the symbol should be defined, typically
801   // PT_LOAD.
802   elfcpp::PT segment_type;
803   // Bitmask of segment flags which must be set.
804   elfcpp::PF segment_flags_set;
805   // Bitmask of segment flags which must be clear.
806   elfcpp::PF segment_flags_clear;
807   // The offset of the symbol within the segment.  The offset is
808   // calculated from the position set by offset_base.
809   uint64_t value;
810   // The size of the symbol.
811   uint64_t size;
812   // The symbol type.
813   elfcpp::STT type;
814   // The symbol binding.
815   elfcpp::STB binding;
816   // The symbol visibility.
817   elfcpp::STV visibility;
818   // The rest of the st_other field.
819   unsigned char nonvis;
820   // The base from which we compute the offset.
821   Symbol::Segment_offset_base offset_base;
822   // If true, this symbol is defined only if we see a reference to it.
823   bool only_if_ref;
824 };
825
826 // This class manages warnings.  Warnings are a GNU extension.  When
827 // we see a section named .gnu.warning.SYM in an object file, and if
828 // we wind using the definition of SYM from that object file, then we
829 // will issue a warning for any relocation against SYM from a
830 // different object file.  The text of the warning is the contents of
831 // the section.  This is not precisely the definition used by the old
832 // GNU linker; the old GNU linker treated an occurrence of
833 // .gnu.warning.SYM as defining a warning symbol.  A warning symbol
834 // would trigger a warning on any reference.  However, it was
835 // inconsistent in that a warning in a dynamic object only triggered
836 // if there was no definition in a regular object.  This linker is
837 // different in that we only issue a warning if we use the symbol
838 // definition from the same object file as the warning section.
839
840 class Warnings
841 {
842  public:
843   Warnings()
844     : warnings_()
845   { }
846
847   // Add a warning for symbol NAME in section SHNDX in object OBJ.
848   void
849   add_warning(Symbol_table* symtab, const char* name, Object* obj,
850               unsigned int shndx);
851
852   // For each symbol for which we should give a warning, make a note
853   // on the symbol.
854   void
855   note_warnings(Symbol_table* symtab);
856
857   // Issue a warning for a reference to SYM at RELINFO's location.
858   template<int size, bool big_endian>
859   void
860   issue_warning(const Symbol* sym, const Relocate_info<size, big_endian>*,
861                 size_t relnum, off_t reloffset) const;
862
863  private:
864   Warnings(const Warnings&);
865   Warnings& operator=(const Warnings&);
866
867   // What we need to know to get the warning text.
868   struct Warning_location
869   {
870     // The object the warning is in.
871     Object* object;
872     // The index of the warning section.
873     unsigned int shndx;
874     // The warning text if we have already loaded it.
875     std::string text;
876
877     Warning_location()
878       : object(NULL), shndx(0), text()
879     { }
880
881     void
882     set(Object* o, unsigned int s)
883     {
884       this->object = o;
885       this->shndx = s;
886     }
887
888     void
889     set_text(const char* t, off_t l)
890     { this->text.assign(t, l); }
891   };
892
893   // A mapping from warning symbol names (canonicalized in
894   // Symbol_table's namepool_ field) to 
895   typedef Unordered_map<const char*, Warning_location> Warning_table;
896
897   Warning_table warnings_;
898 };
899
900 // The main linker symbol table.
901
902 class Symbol_table
903 {
904  public:
905   Symbol_table();
906
907   ~Symbol_table();
908
909   // Add COUNT external symbols from the relocatable object RELOBJ to
910   // the symbol table.  SYMS is the symbols, SYM_NAMES is their names,
911   // SYM_NAME_SIZE is the size of SYM_NAMES.  This sets SYMPOINTERS to
912   // point to the symbols in the symbol table.
913   template<int size, bool big_endian>
914   void
915   add_from_relobj(Sized_relobj<size, big_endian>* relobj,
916                   const unsigned char* syms, size_t count,
917                   const char* sym_names, size_t sym_name_size,
918                   typename Sized_relobj<size, big_endian>::Symbols*);
919
920   // Add COUNT dynamic symbols from the dynamic object DYNOBJ to the
921   // symbol table.  SYMS is the symbols.  SYM_NAMES is their names.
922   // SYM_NAME_SIZE is the size of SYM_NAMES.  The other parameters are
923   // symbol version data.
924   template<int size, bool big_endian>
925   void
926   add_from_dynobj(Sized_dynobj<size, big_endian>* dynobj,
927                   const unsigned char* syms, size_t count,
928                   const char* sym_names, size_t sym_name_size,
929                   const unsigned char* versym, size_t versym_size,
930                   const std::vector<const char*>*);
931
932   // Define a special symbol based on an Output_data.  It is a
933   // multiple definition error if this symbol is already defined.
934   Symbol*
935   define_in_output_data(const Target*, const char* name, const char* version,
936                         Output_data*, uint64_t value, uint64_t symsize,
937                         elfcpp::STT type, elfcpp::STB binding,
938                         elfcpp::STV visibility, unsigned char nonvis,
939                         bool offset_is_from_end, bool only_if_ref);
940
941   // Define a special symbol based on an Output_segment.  It is a
942   // multiple definition error if this symbol is already defined.
943   Symbol*
944   define_in_output_segment(const Target*, const char* name,
945                            const char* version, Output_segment*,
946                            uint64_t value, uint64_t symsize,
947                            elfcpp::STT type, elfcpp::STB binding,
948                            elfcpp::STV visibility, unsigned char nonvis,
949                            Symbol::Segment_offset_base, bool only_if_ref);
950
951   // Define a special symbol with a constant value.  It is a multiple
952   // definition error if this symbol is already defined.
953   Symbol*
954   define_as_constant(const Target*, const char* name, const char* version,
955                      uint64_t value, uint64_t symsize, elfcpp::STT type,
956                      elfcpp::STB binding, elfcpp::STV visibility,
957                      unsigned char nonvis, bool only_if_ref);
958
959   // Define a set of symbols in output sections.
960   void
961   define_symbols(const Layout*, const Target*, int count,
962                  const Define_symbol_in_section*);
963
964   // Define a set of symbols in output segments.
965   void
966   define_symbols(const Layout*, const Target*, int count,
967                  const Define_symbol_in_segment*);  
968
969   // Define SYM using a COPY reloc.  POSD is the Output_data where the
970   // symbol should be defined--typically a .dyn.bss section.  VALUE is
971   // the offset within POSD.
972   template<int size>
973   void
974   define_with_copy_reloc(const Target*, Sized_symbol<size>* sym,
975                          Output_data* posd, uint64_t value);
976
977   // Look up a symbol.
978   Symbol*
979   lookup(const char*, const char* version = NULL) const;
980
981   // Return the real symbol associated with the forwarder symbol FROM.
982   Symbol*
983   resolve_forwards(const Symbol* from) const;
984
985   // Return the sized version of a symbol in this table.
986   template<int size>
987   Sized_symbol<size>*
988   get_sized_symbol(Symbol* ACCEPT_SIZE) const;
989
990   template<int size>
991   const Sized_symbol<size>*
992   get_sized_symbol(const Symbol* ACCEPT_SIZE) const;
993
994   // Return the count of undefined symbols seen.
995   int
996   saw_undefined() const
997   { return this->saw_undefined_; }
998
999   // Allocate the common symbols
1000   void
1001   allocate_commons(const General_options&, Layout*);
1002
1003   // Add a warning for symbol NAME in section SHNDX in object OBJ.
1004   void
1005   add_warning(const char* name, Object* obj, unsigned int shndx)
1006   { this->warnings_.add_warning(this, name, obj, shndx); }
1007
1008   // Canonicalize a symbol name for use in the hash table.
1009   const char*
1010   canonicalize_name(const char* name)
1011   { return this->namepool_.add(name, true, NULL); }
1012
1013   // Possibly issue a warning for a reference to SYM at LOCATION which
1014   // is in OBJ.
1015   template<int size, bool big_endian>
1016   void
1017   issue_warning(const Symbol* sym,
1018                 const Relocate_info<size, big_endian>* relinfo,
1019                 size_t relnum, off_t reloffset) const
1020   { this->warnings_.issue_warning(sym, relinfo, relnum, reloffset); }
1021
1022   // SYM is defined using a COPY reloc.  Return the dynamic object
1023   // where the original definition was found.
1024   Dynobj*
1025   get_copy_source(const Symbol* sym) const;
1026
1027   // Set the dynamic symbol indexes.  INDEX is the index of the first
1028   // global dynamic symbol.  Pointers to the symbols are stored into
1029   // the vector.  The names are stored into the Stringpool.  This
1030   // returns an updated dynamic symbol index.
1031   unsigned int
1032   set_dynsym_indexes(const Target*, unsigned int index,
1033                      std::vector<Symbol*>*, Stringpool*, Versions*);
1034
1035   // Finalize the symbol table after we have set the final addresses
1036   // of all the input sections.  This sets the final symbol indexes,
1037   // values and adds the names to *POOL.  INDEX is the index of the
1038   // first global symbol.  OFF is the file offset of the global symbol
1039   // table, DYNOFF is the offset of the globals in the dynamic symbol
1040   // table, DYN_GLOBAL_INDEX is the index of the first global dynamic
1041   // symbol, and DYNCOUNT is the number of global dynamic symbols.
1042   // This records the parameters, and returns the new file offset.
1043   off_t
1044   finalize(unsigned int index, off_t off, off_t dynoff,
1045            size_t dyn_global_index, size_t dyncount, Stringpool* pool);
1046
1047   // Write out the global symbols.
1048   void
1049   write_globals(const Target*, const Stringpool*, const Stringpool*,
1050                 Output_file*) const;
1051
1052   // Write out a section symbol.  Return the updated offset.
1053   void
1054   write_section_symbol(const Output_section*, Output_file*, off_t) const;
1055
1056  private:
1057   Symbol_table(const Symbol_table&);
1058   Symbol_table& operator=(const Symbol_table&);
1059
1060   // Make FROM a forwarder symbol to TO.
1061   void
1062   make_forwarder(Symbol* from, Symbol* to);
1063
1064   // Add a symbol.
1065   template<int size, bool big_endian>
1066   Sized_symbol<size>*
1067   add_from_object(Object*, const char *name, Stringpool::Key name_key,
1068                   const char *version, Stringpool::Key version_key,
1069                   bool def, const elfcpp::Sym<size, big_endian>& sym);
1070
1071   // Resolve symbols.
1072   template<int size, bool big_endian>
1073   void
1074   resolve(Sized_symbol<size>* to,
1075           const elfcpp::Sym<size, big_endian>& sym,
1076           Object*, const char* version);
1077
1078   template<int size, bool big_endian>
1079   void
1080   resolve(Sized_symbol<size>* to, const Sized_symbol<size>* from,
1081           const char* version ACCEPT_SIZE_ENDIAN);
1082
1083   // Whether we should override a symbol, based on flags in
1084   // resolve.cc.
1085   static bool
1086   should_override(const Symbol*, unsigned int, Object*, bool*);
1087
1088   // Override a symbol.
1089   template<int size, bool big_endian>
1090   void
1091   override(Sized_symbol<size>* tosym,
1092            const elfcpp::Sym<size, big_endian>& fromsym,
1093            Object* object, const char* version);
1094
1095   // Whether we should override a symbol with a special symbol which
1096   // is automatically defined by the linker.
1097   static bool
1098   should_override_with_special(const Symbol*);
1099
1100   // Override a symbol with a special symbol.
1101   template<int size>
1102   void
1103   override_with_special(Sized_symbol<size>* tosym,
1104                         const Sized_symbol<size>* fromsym);
1105
1106   // Record all weak alias sets for a dynamic object.
1107   template<int size>
1108   void
1109   record_weak_aliases(std::vector<Sized_symbol<size>*>*);
1110
1111   // Define a special symbol.
1112   template<int size, bool big_endian>
1113   Sized_symbol<size>*
1114   define_special_symbol(const Target* target, const char** pname,
1115                         const char** pversion, bool only_if_ref,
1116                         Sized_symbol<size>** poldsym ACCEPT_SIZE_ENDIAN);
1117
1118   // Define a symbol in an Output_data, sized version.
1119   template<int size>
1120   Sized_symbol<size>*
1121   do_define_in_output_data(const Target*, const char* name,
1122                            const char* version, Output_data*,
1123                            typename elfcpp::Elf_types<size>::Elf_Addr value,
1124                            typename elfcpp::Elf_types<size>::Elf_WXword ssize,
1125                            elfcpp::STT type, elfcpp::STB binding,
1126                            elfcpp::STV visibility, unsigned char nonvis,
1127                            bool offset_is_from_end, bool only_if_ref);
1128
1129   // Define a symbol in an Output_segment, sized version.
1130   template<int size>
1131   Sized_symbol<size>*
1132   do_define_in_output_segment(
1133     const Target*, const char* name, const char* version, Output_segment* os,
1134     typename elfcpp::Elf_types<size>::Elf_Addr value,
1135     typename elfcpp::Elf_types<size>::Elf_WXword ssize,
1136     elfcpp::STT type, elfcpp::STB binding,
1137     elfcpp::STV visibility, unsigned char nonvis,
1138     Symbol::Segment_offset_base offset_base, bool only_if_ref);
1139
1140   // Define a symbol as a constant, sized version.
1141   template<int size>
1142   Sized_symbol<size>*
1143   do_define_as_constant(
1144     const Target*, const char* name, const char* version,
1145     typename elfcpp::Elf_types<size>::Elf_Addr value,
1146     typename elfcpp::Elf_types<size>::Elf_WXword ssize,
1147     elfcpp::STT type, elfcpp::STB binding,
1148     elfcpp::STV visibility, unsigned char nonvis,
1149     bool only_if_ref);
1150
1151   // Allocate the common symbols, sized version.
1152   template<int size>
1153   void
1154   do_allocate_commons(const General_options&, Layout*);
1155
1156   // Finalize symbols specialized for size.
1157   template<int size>
1158   off_t
1159   sized_finalize(unsigned int, off_t, Stringpool*);
1160
1161   // Write globals specialized for size and endianness.
1162   template<int size, bool big_endian>
1163   void
1164   sized_write_globals(const Target*, const Stringpool*, const Stringpool*,
1165                       Output_file*) const;
1166
1167   // Write out a symbol to P.
1168   template<int size, bool big_endian>
1169   void
1170   sized_write_symbol(Sized_symbol<size>*,
1171                      typename elfcpp::Elf_types<size>::Elf_Addr value,
1172                      unsigned int shndx,
1173                      const Stringpool*, unsigned char* p
1174                      ACCEPT_SIZE_ENDIAN) const;
1175
1176   // Write out a section symbol, specialized for size and endianness.
1177   template<int size, bool big_endian>
1178   void
1179   sized_write_section_symbol(const Output_section*, Output_file*, off_t) const;
1180
1181   // The type of the symbol hash table.
1182
1183   typedef std::pair<Stringpool::Key, Stringpool::Key> Symbol_table_key;
1184
1185   struct Symbol_table_hash
1186   {
1187     size_t
1188     operator()(const Symbol_table_key&) const;
1189   };
1190
1191   struct Symbol_table_eq
1192   {
1193     bool
1194     operator()(const Symbol_table_key&, const Symbol_table_key&) const;
1195   };
1196
1197   typedef Unordered_map<Symbol_table_key, Symbol*, Symbol_table_hash,
1198                         Symbol_table_eq> Symbol_table_type;
1199
1200   // The type of the list of common symbols.
1201   typedef std::vector<Symbol*> Commons_type;
1202
1203   // A map from symbols with COPY relocs to the dynamic objects where
1204   // they are defined.
1205   typedef Unordered_map<const Symbol*, Dynobj*> Copied_symbol_dynobjs;
1206
1207   // We increment this every time we see a new undefined symbol, for
1208   // use in archive groups.
1209   int saw_undefined_;
1210   // The index of the first global symbol in the output file.
1211   unsigned int first_global_index_;
1212   // The file offset within the output symtab section where we should
1213   // write the table.
1214   off_t offset_;
1215   // The number of global symbols we want to write out.
1216   size_t output_count_;
1217   // The file offset of the global dynamic symbols, or 0 if none.
1218   off_t dynamic_offset_;
1219   // The index of the first global dynamic symbol.
1220   unsigned int first_dynamic_global_index_;
1221   // The number of global dynamic symbols, or 0 if none.
1222   off_t dynamic_count_;
1223   // The symbol hash table.
1224   Symbol_table_type table_;
1225   // A pool of symbol names.  This is used for all global symbols.
1226   // Entries in the hash table point into this pool.
1227   Stringpool namepool_;
1228   // Forwarding symbols.
1229   Unordered_map<const Symbol*, Symbol*> forwarders_;
1230   // Weak aliases.  A symbol in this list points to the next alias.
1231   // The aliases point to each other in a circular list.
1232   Unordered_map<Symbol*, Symbol*> weak_aliases_;
1233   // We don't expect there to be very many common symbols, so we keep
1234   // a list of them.  When we find a common symbol we add it to this
1235   // list.  It is possible that by the time we process the list the
1236   // symbol is no longer a common symbol.  It may also have become a
1237   // forwarder.
1238   Commons_type commons_;
1239   // Manage symbol warnings.
1240   Warnings warnings_;
1241   // When we emit a COPY reloc for a symbol, we define it in an
1242   // Output_data.  When it's time to emit version information for it,
1243   // we need to know the dynamic object in which we found the original
1244   // definition.  This maps symbols with COPY relocs to the dynamic
1245   // object where they were defined.
1246   Copied_symbol_dynobjs copied_symbol_dynobjs_;
1247 };
1248
1249 // We inline get_sized_symbol for efficiency.
1250
1251 template<int size>
1252 Sized_symbol<size>*
1253 Symbol_table::get_sized_symbol(Symbol* sym ACCEPT_SIZE) const
1254 {
1255   gold_assert(size == parameters->get_size());
1256   return static_cast<Sized_symbol<size>*>(sym);
1257 }
1258
1259 template<int size>
1260 const Sized_symbol<size>*
1261 Symbol_table::get_sized_symbol(const Symbol* sym ACCEPT_SIZE) const
1262 {
1263   gold_assert(size == parameters->get_size());
1264   return static_cast<const Sized_symbol<size>*>(sym);
1265 }
1266
1267 } // End namespace gold.
1268
1269 #endif // !defined(GOLD_SYMTAB_H)