TIVI-153: Add as dependency for iputils
[profile/ivi/opensp.git] / doc / sgmldecl.htm
1 <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML Strict//EN">
2 <HTML>
3 <HEAD>
4 <TITLE>OpenSP - SGML declaration</TITLE>
5 </HEAD>
6 <BODY>
7 <H1>Handling of the SGML declaration in OpenSP</H1>
8 <H2>Extended Naming Rules</H2>
9 <P>
10 OpenSP supports the Extended Naming Rules as specified in Annex J
11 of ISO 8879:1986 (added by the 1996 technical corrigendum).
12 <H2>Web SGML Adaptations</H2>
13 <P>
14 OpenSP supports most of the Web SGML Adaptations as specified in
15 Annex K of ISO 8879:1996 (added by the second technical corrigendum, 1998)
16 <H2>Default SGML declaration</H2>
17 <P>
18 If the SGML declaration is omitted
19 and there is no applicable
20 <A HREF="catalog.htm#sgmldecl"><SAMP>SGMLDECL</SAMP></A>
21 or <A HREF="catalog.htm#dtddecl"><SAMP>DTDDECL</SAMP></A>
22 entry in a catalog,
23 the following declaration will be implied:
24 <PRE>
25                     &lt;!SGML "ISO 8879:1986"
26                             CHARSET
27 BASESET  "ISO 646-1983//CHARSET
28           International Reference Version (IRV)//ESC 2/5 4/0"
29 DESCSET    0  9 UNUSED
30            9  2  9
31           11  2 UNUSED
32           13  1 13
33           14 18 UNUSED
34           32 95 32
35          127  1 UNUSED
36 CAPACITY PUBLIC    "ISO 8879:1986//CAPACITY Reference//EN"
37 SCOPE    DOCUMENT
38 SYNTAX
39 SHUNCHAR CONTROLS 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
40          18 19 20 21 22 23 24 25 26 27 28 29 30 31 127 255
41 BASESET  "ISO 646-1983//CHARSET International Reference Version
42           (IRV)//ESC 2/5 4/0"
43 DESCSET  0 128 0
44 FUNCTION RE                    13
45          RS                    10
46          SPACE                 32
47          TAB       SEPCHAR     9
48 NAMING   LCNMSTRT  ""
49          UCNMSTRT  ""
50          LCNMCHAR  "-."
51          UCNMCHAR  "-."
52          NAMECASE  GENERAL     YES
53                    ENTITY      NO
54 DELIM    GENERAL   SGMLREF
55          SHORTREF  SGMLREF
56 NAMES    SGMLREF
57 QUANTITY SGMLREF
58          ATTCNT    99999999
59          ATTSPLEN  99999999
60          DTEMPLEN  24000
61          ENTLVL    99999999
62          GRPCNT    99999999
63          GRPGTCNT  99999999
64          GRPLVL    99999999
65          LITLEN    24000
66          NAMELEN   99999999
67          PILEN     24000
68          TAGLEN    99999999
69          TAGLVL    99999999
70                            FEATURES
71 MINIMIZE DATATAG   NO
72          OMITTAG   YES
73          RANK      YES
74          SHORTTAG  YES
75 LINK     SIMPLE    YES 1000
76          IMPLICIT  YES
77          EXPLICIT  YES 1
78 OTHER    CONCUR    NO
79          SUBDOC    YES 99999999
80          FORMAL    YES
81                           APPINFO NONE>
82 </PRE>
83 <P>
84 with the exception that all characters that are neither significant
85 nor shunned will be assigned to DATACHAR.
86 <H2><A NAME="charset">Character sets</A></H2>
87 <P>
88 A character in a base character set is described either by giving its
89 number in a <i>universal</i> character set, or by specifying a minimum
90 literal.
91 The first 65536 character numbers in the <i>universal</i> character
92 set are assumed to be the same as in Unicode 2.0 (ISO/IEC 10646).
93 The remaining character numbers can be assigned in any way convenient.
94 <P>
95 The public identifier of a base character set can be associated
96 with an entity that describes it by using a
97 <SAMP>PUBLIC</SAMP>
98 entry in the catalog entry file.
99 The entity must be a fragment
100 of an SGML declaration
101 consisting of the
102 portion of a character set description,
103 following the DESCSET keyword,
104 that is, it must be a sequence of character descriptions,
105 where each character description specifies a described character
106 number, the number of characters and
107 either a character number in the universal character set, a minimum literal
108 or the keyword
109 <SAMP>UNUSED</SAMP>.
110 Character numbers in the universal character set can be as big as
111 99999999.
112 <P>
113 In addition OpenSP has built in knowledge of many character sets.
114 These are identified using the designating sequence in the
115 public identifier.  The following designating sequences are
116 recognized:
117 <DL>
118 <DT>
119 <SAMP>ESC 2/5 4/0</SAMP>
120 <DD>
121 The full set of ISO 646 IRV.
122 This is not a registered character set,
123 but is recommended by ISO 8879 (clause 10.2.2.4).
124 <DT>
125 <SAMP>ESC 2/8 4/0</SAMP>
126 <DD>
127 G0 set of ISO 646 IRV,
128 ISO Registration Number 2.
129 <DT>
130 <SAMP>ESC 2/8 4/2</SAMP>
131 <DD>
132 G0 set of ASCII,
133 ISO Registration Number 6.
134 <DT>
135 <SAMP>ESC 2/1 4/0</SAMP>
136 <DD>
137 C0 set of ISO 646,
138 ISO Registration Number 1.
139 <DT>
140 <SAMP>ESC 2/13 4/1</SAMP>
141 <DD>
142 G1 set of ISO 8859-1
143 <DT>
144 <SAMP>ESC 2/13 4/2</SAMP>
145 <DD>
146 G1 set of ISO 8859-2
147 <DT>
148 <SAMP>ESC 2/13 4/3</SAMP>
149 <DD>
150 G1 set of ISO 8859-3
151 <DT>
152 <SAMP>ESC 2/13 4/4</SAMP>
153 <DD>
154 G1 set of ISO 8859-4
155 <DT>
156 <SAMP>ESC 2/13 4/12</SAMP>
157 <DD>
158 G1 set of ISO 8859-5
159 <DT>
160 <SAMP>ESC 2/13 4/7</SAMP>
161 <DD>
162 G1 set of ISO 8859-6
163 <DT>
164 <SAMP>ESC 2/13 4/6</SAMP>
165 <DD>
166 G1 set of ISO 8859-7
167 <DT>
168 <SAMP>ESC 2/13 4/8</SAMP>
169 <DD>
170 G1 set of ISO 8859-8
171 <DT>
172 <SAMP>ESC 2/13 4/13</SAMP>
173 <DD>
174 G1 set of ISO 8859-9
175 <DT>
176 <SAMP>ESC 2/8 4/10</SAMP>
177 <DD>
178 Roman set from JIS-X-0202.
179 JIS version of ISO 646.
180 ISO Registration Number 14.
181 <DT>
182 <SAMP>ESC 2/8 4/9</SAMP>
183 <DD>
184 Katakana set from JIS X 0201.
185 ISO Registration Number 13.
186 <DT>
187 <SAMP>ESC 2/4 4/2</SAMP>
188 <DT>
189 <SAMP>ESC 2/6 4/0 ESC 2/4 4/2</SAMP>
190 <DD>
191 JIS X 0208-1990.
192 ISO Registration Numbers 87 and 168.
193 <DT>
194 <SAMP>ESC 2/4 2/8 4/4</SAMP>
195 <DD>
196 JIS X 0212-1990.
197 ISO Registration Number 159.
198 <DT>
199 <SAMP>ESC 2/4 4/1</SAMP>
200 <DD>
201 GB 2312-80.
202 ISO Registration Number 58.
203 <DT>
204 <SAMP>ESC 2/4 2/8 4/3</SAMP>
205 <DD>
206 KS C 5601-1992.
207 ISO Registration Number 149.
208 <DT>
209 <SAMP>ESC 2/5 2/15 4/0</SAMP>
210 <DT>
211 <SAMP>ESC 2/5 2/15 4/3</SAMP>
212 <DT>
213 <SAMP>ESC 2/5 2/15 4/5</SAMP>
214 <DD>
215 ISO/IEC 10646 UCS-2
216 <DT>
217 <SAMP>ESC 2/5 2/15 4/1</SAMP>
218 <DT>
219 <SAMP>ESC 2/5 2/15 4/4</SAMP>
220 <DT>
221 <SAMP>ESC 2/5 2/15 4/6</SAMP>
222 <DD>
223 ISO/IEC 10646 UCS-4
224 </DL>
225
226 <H2>Concrete syntaxes</H2>
227 <P>
228 The public identifier for a public concrete syntax can be associated
229 with an entity that describes using a
230 <SAMP>PUBLIC</SAMP>
231 entry in the catalog entry file.
232 The entity must be a fragment of an SGML declaration
233 consisting of a concrete syntax description
234 starting with the
235 <SAMP>SHUNCHAR</SAMP>
236 keyword
237 as in an SGML declaration.
238 The entity can also make use of the following extensions:
239 <UL>
240 <LI>
241 The Extended Naming Rules extensions can be used regardless of the minimum
242 literal used in the SGML declaration.
243 <LI>
244 An
245 <I>added function</I>
246 can be expressed as a parameter literal
247 instead of a name.
248 <LI>
249 The replacement for a reference reserved name
250 can be expressed as a parameter literal instead of a name.
251 <LI>
252 The total number of characters specified for
253 <SAMP>UCNMCHAR</SAMP>
254 or
255 <SAMP>UCNMSTRT</SAMP>
256 may exceed the total number of characters specified for
257 <SAMP>LCNMCHAR</SAMP>
258 or
259 <SAMP>LCNMSTRT</SAMP>
260 respectively.
261 Each character in
262 <SAMP>UCNMCHAR</SAMP>
263 or
264 <SAMP>UCNMSTRT</SAMP>
265 which does not have a corresponding character in the same position in
266 <SAMP>LCNMCHAR</SAMP>
267 or
268 <SAMP>LCNMSTRT</SAMP>
269 is simply assigned to <SAMP>UCNMCHAR</SAMP> or <SAMP>UCNMSTRT</SAMP>
270 without making it the upper-case form of any character.
271 <LI>
272 Within the specification of the short reference delimiters,
273 a parameter literal containing exactly one character
274 may be followed by the delimiter <SAMP>-</SAMP>
275 and another parameter literal containing exactly one character.
276 This has the same meaning as a sequence of parameter literals
277 one for each character number that is greater than or equal
278 to the number of the character in the first parameter literal
279 and less than or equal to the number of the character in the
280 second parameter literal.
281 <LI>
282 A number may be used as a delimiter in the
283 <SAMP>DELIM</SAMP>
284 section with the same meaning as a parameter literal
285 containing just a numeric character reference with that number.
286 </UL>
287 <H2>Capacity sets</H2>
288 <P>
289 The public identifier for a public capacity set can be associated
290 with an entity that describes using a
291 <SAMP>PUBLIC</SAMP>
292 entry in the catalog entry file.
293 The entity must be a fragment of an SGML declaration
294 consisting of a sequence of capacity names and numbers.
295 </BODY>
296 </HTML>