Imported Upstream version 7.1
[platform/upstream/dos2unix.git] / man / nl / man1 / dos2unix.htm
1 <?xml version="1.0" ?>
2 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
3 <html xmlns="http://www.w3.org/1999/xhtml">
4 <head>
5 <title>dos2unix 7.1 - DOS/Mac naar Unix en vice versa tekstbestand formaat omzetter</title>
6 <meta http-equiv="content-type" content="text/html; charset=utf-8" />
7 <link rev="made" href="mailto:root@localhost" />
8 </head>
9
10 <body style="background-color: white">
11
12
13
14 <ul id="index">
15   <li><a href="#NAAM">NAAM</a></li>
16   <li><a href="#OVERZICHT">OVERZICHT</a></li>
17   <li><a href="#BESCHRIJVING">BESCHRIJVING</a></li>
18   <li><a href="#OPTIES">OPTIES</a></li>
19   <li><a href="#MAC-MODUS">MAC-MODUS</a></li>
20   <li><a href="#CONVERSIEMODI">CONVERSIEMODI</a></li>
21   <li><a href="#UNICODE">UNICODE</a>
22     <ul>
23       <li><a href="#Coderingen">Coderingen</a></li>
24       <li><a href="#Conversie">Conversie</a></li>
25       <li><a href="#Byte-Order-Mark">Byte-Order-Mark</a></li>
26       <li><a href="#Unicode-voorbeelden">Unicode-voorbeelden</a></li>
27     </ul>
28   </li>
29   <li><a href="#VOORBEELDEN">VOORBEELDEN</a></li>
30   <li><a href="#RECURSIEVE-CONVERSIE">RECURSIEVE CONVERSIE</a></li>
31   <li><a href="#LOKALISATIE">LOKALISATIE</a></li>
32   <li><a href="#AFSLUITWAARDE">AFSLUITWAARDE</a></li>
33   <li><a href="#STANDAARDEN">STANDAARDEN</a></li>
34   <li><a href="#AUTEURS">AUTEURS</a></li>
35   <li><a href="#ZIE-OOK">ZIE OOK</a></li>
36 </ul>
37
38 <h1 id="NAAM">NAAM</h1>
39
40 <p>dos2unix - omzetter van tekstbestandsindelingen, van DOS/Mac naar Unix en vice versa</p>
41
42 <h1 id="OVERZICHT">OVERZICHT</h1>
43
44 <pre><code>    dos2unix [opties] [BESTAND ...] [-n INVOERBESTAND UITVOERBESTAND ...]
45     unix2dos [opties] [BESTAND ...] [-n INVOERBESTAND UITVOERBESTAND ...]</code></pre>
46
47 <h1 id="BESCHRIJVING">BESCHRIJVING</h1>
48
49 <p>Het Dos2unix pakket bevat de toepassingen <code>dos2unix</code> en <code>unix2dos</code> om platte tekstbestanden in DOS- of Mac-indeling naar Unix-indeling om te zetten, en vice versa.</p>
50
51 <p>In DOS/Windows-tekstbestanden bestaat een regeleinde uit een combinatie van twee tekens: een &#39;Carriage Return&#39; (CR) gevolgd door een &#39;Line Feed&#39; (LF). In Unix-tekstbestanden bestaat een regeleinde uit &eacute;&eacute;n enkel &#39;Newline&#39;-teken, dat gelijk is aan een DOS &#39;Line Feed&#39;-teken (LF). In Mac-tekstbestanden, van v&oacute;&oacute;r Mac OS X, bestaan regeleindes uit &eacute;&eacute;n enkel &#39;Carriage Return&#39;-teken. Mac OS X is op Unix gebaseerd en heeft dezelfde regeleindes als Unix.</p>
52
53 <p>Naast regeleindes kan Dos2unix ook de codering van bestanden converteren. Enkele DOS-codetabellen kunnen omgezet worden naar Unix Latin-1. En Windows Unicode-bestanden (UTF-16) kunnen geconverteerd worden naar Unix Unicode-bestanden (UTF-8).</p>
54
55 <p>Binaire bestanden worden automatisch overgeslagen, behalve als de omzetting geforceerd wordt.</p>
56
57 <p>Niet-reguliere bestanden, zoals mappen en FIFO&#39;s, worden automatisch overgeslagen.</p>
58
59 <p>Symbolische koppelingen en hun doelen blijven standaard onaangeroerd. Optioneel kunnen symbolische koppelingen worden vervangen, of de uitvoer kan naar het doel van de symbolische koppeling worden geschreven. Op Windows wordt het schrijven naar het doel van een symbolische koppeling niet ondersteund.</p>
60
61 <p>Dos2unix is gemodelleerd naar dos2unix op SunOS/Solaris, maar er is &eacute;&eacute;n belangrijk verschil: deze versie van dos2unix voert standaard een vervangende conversie uit (oud-bestand-modus) terwijl de oorspronkelijke SunOS/Solaris-versie alleen de gepaarde conversie (nieuw-bestand-modus) kent. Zie ook de opties <code>-o</code> en <code>-n</code>.</p>
62
63 <h1 id="OPTIES">OPTIES</h1>
64
65 <dl>
66
67 <dt id="pod"><b>--</b></dt>
68 <dd>
69
70 <p>Alle volgende opties als bestandsnamen behandelen. Gebruik deze optie als u een bestand wilt converteren waarvan de naam met een streepje begint. Bijvoorbeeld, om een bestand genaamd &quot;-foo&quot; om te zetten, gebruikt u de volgende opdracht:</p>
71
72 <pre><code>    dos2unix -- -foo</code></pre>
73
74 <p>Of in nieuw-bestand-modus:</p>
75
76 <pre><code>    dos2unix -n -- -foo uit.txt</code></pre>
77
78 </dd>
79 <dt id="ascii"><b>-ascii</b></dt>
80 <dd>
81
82 <p>Alleen regeleindes converteren. Dit is de standaardconversiemodus.</p>
83
84 </dd>
85 <dt id="iso"><b>-iso</b></dt>
86 <dd>
87
88 <p>Conversie tussen de tekensets DOS en ISO-8859-1. Zie ook de sectie CONVERSIEMODI.</p>
89
90 </dd>
91 <dt id="pod-1252"><b>-1252</b></dt>
92 <dd>
93
94 <p>Windows-codetabel 1252 (West-Europees) gebruiken.</p>
95
96 </dd>
97 <dt id="pod-437"><b>-437</b></dt>
98 <dd>
99
100 <p>DOS-codetabel 437 (VS) gebruiken. Dit is de standaard codetabel die gebruikt wordt bij ISO-conversie.</p>
101
102 </dd>
103 <dt id="pod-850"><b>-850</b></dt>
104 <dd>
105
106 <p>DOS-codetabel 850 (West-Europees) gebruiken.</p>
107
108 </dd>
109 <dt id="pod-860"><b>-860</b></dt>
110 <dd>
111
112 <p>DOS-codetabel 860 (Portugees) gebruiken.</p>
113
114 </dd>
115 <dt id="pod-863"><b>-863</b></dt>
116 <dd>
117
118 <p>DOS-codetabel 863 (Canadees Frans) gebruiken.</p>
119
120 </dd>
121 <dt id="pod-865"><b>-865</b></dt>
122 <dd>
123
124 <p>DOS-codetabel 865 (Scandinavisch) gebruiken.</p>
125
126 </dd>
127 <dt id="pod-7"><b>-7</b></dt>
128 <dd>
129
130 <p>Lettertekens met het achtste bit gezet converteren naar spaties.</p>
131
132 </dd>
133 <dt id="b---keep-bom"><b>-b</b>, <b>--keep-bom</b></dt>
134 <dd>
135
136 <p>Een Byte-Order-Mark (BOM) behouden. Als het invoerbestand een BOM bevat, dan wordt ook een BOM naar het uitvoerbestand geschreven. Dit is het standaardgedrag bij conversie naar DOS. Zie ook optie <code>-r</code>.</p>
137
138 </dd>
139 <dt id="c---convmode-CONVERSIEMODUS"><b>-c</b>, <b>--convmode CONVERSIEMODUS</b></dt>
140 <dd>
141
142 <p>De te gebruiken conversiemodus. CONVERSIEMODUS kan zijn: <i>ascii</i>, <i>7bit</i>, <i>iso</i>, of <i>mac</i>, waarbij ascii de standaardinstelling is.</p>
143
144 </dd>
145 <dt id="f---force"><b>-f</b>, <b>--force</b></dt>
146 <dd>
147
148 <p>Conversie van binaire bestanden afdwingen.</p>
149
150 </dd>
151 <dt id="h---help"><b>-h</b>, <b>--help</b></dt>
152 <dd>
153
154 <p>Een hulptekst tonen.</p>
155
156 </dd>
157 <dt id="i-VLAGGEN---info-VLAGGEN-BESTAND"><b>-i</b>[<b>VLAGGEN</b>], <b>--info</b>[<b>=VLAGGEN</b>] <b>BESTAND</b>...</dt>
158 <dd>
159
160 <p>Bestandsinformatie tonen. Er wordt niets geconverteerd.</p>
161
162 <p>De volgende informatie wordt weergegeven, in deze volgorde: het aantal DOS-regeleindes, het aantal Unix-regeleindes, het aantal Mac-regeleindes, de Byte-Order-Mark, of het een tekst- of binair bestand is, en de bestandsnaam.</p>
163
164 <p>Voorbeelduitvoer:</p>
165
166 <pre><code>     6       0       0  no_bom    text    dos.txt
167      0       6       0  no_bom    text    unix.txt
168      0       0       6  no_bom    text    mac.txt
169      6       6       6  no_bom    text    mixed.txt
170     50       0       0  UTF-16LE  text    utf16le.txt
171      0      50       0  no_bom    text    utf8unix.txt
172     50       0       0  UTF-8     text    utf8dos.txt
173      2     418     219  no_bom    binary  dos2unix.exe</code></pre>
174
175 <p>Bij de optie kunnen &eacute;&eacute;n of meer vlaggen meegegeven worden om de uitvoer te beperken.</p>
176
177 <dl>
178
179 <dt id="d"><b>d</b></dt>
180 <dd>
181
182 <p>Het aantal DOS-regeleindes tonen.</p>
183
184 </dd>
185 <dt id="u"><b>u</b></dt>
186 <dd>
187
188 <p>Het aantal Unix-regeleindes tonen.</p>
189
190 </dd>
191 <dt id="m"><b>m</b></dt>
192 <dd>
193
194 <p>Het aantal Mac-regeleindes tonen.</p>
195
196 </dd>
197 <dt id="b"><b>b</b></dt>
198 <dd>
199
200 <p>De Byte-Order-Mark tonen.</p>
201
202 </dd>
203 <dt id="t"><b>t</b></dt>
204 <dd>
205
206 <p>Tonen of het bestand tekst is of binair.</p>
207
208 </dd>
209 <dt id="c"><b>c</b></dt>
210 <dd>
211
212 <p>Alleen de namen tonen van de bestanden die geconverteerd zouden worden.</p>
213
214 <p>Met de vlag <code>c</code> toont dos2unix alleen de bestanden die DOS-regeleindes bevatten, en unix2dos alleen de bestanden die Unix-regeleindes bevatten.</p>
215
216 </dd>
217 </dl>
218
219 <p>Voorbeelden:</p>
220
221 <p>Informatie weergeven voor alle bestanden met de extensie &#39;txt&#39;:</p>
222
223 <pre><code>    dos2unix -i *.txt</code></pre>
224
225 <p>Alleen de aantallen DOS-regeleindes en Unix-regeleindes tonen:</p>
226
227 <pre><code>    dos2unix -idu *.txt</code></pre>
228
229 <p>Alleen de Byte-Order-Mark tonen:</p>
230
231 <pre><code>    dos2unix --info=b *.txt</code></pre>
232
233 <p>De bestanden opsommen die DOS-regeleindes bevatten.</p>
234
235 <pre><code>    dos2unix -ic *.txt</code></pre>
236
237 <p>De bestanden opsommen die Unix-regeleindes bevatten.</p>
238
239 <pre><code>    unix2dos -ic *.txt</code></pre>
240
241 </dd>
242 <dt id="k---keepdate"><b>-k</b>, <b>--keepdate</b></dt>
243 <dd>
244
245 <p>Het tijdsstempel van het invoerbestand behouden voor het uitvoerbestand.</p>
246
247 </dd>
248 <dt id="L---license"><b>-L</b>, <b>--license</b></dt>
249 <dd>
250
251 <p>De softwarelicentie tonen.</p>
252
253 </dd>
254 <dt id="l---newline"><b>-l</b>, <b>--newline</b></dt>
255 <dd>
256
257 <p>Een extra regeleinde toevoegen.</p>
258
259 <p><b>dos2unix</b>: Alleen DOS-regeleindes worden omgezet naar twee Unix-regeleindes. In Mac-modus worden alleen Mac-regeleindes omgezet naar twee Unix-regeleindes.</p>
260
261 <p><b>unix2dos</b>: Alleen Unix-regeleindes worden omgezet naar twee DOS-regeleindes. In Mac-modus worden Unix-regeleindes omgezet naar twee Mac-regeleindes.</p>
262
263 </dd>
264 <dt id="m---add-bom"><b>-m</b>, <b>--add-bom</b></dt>
265 <dd>
266
267 <p>Een Byte-Order-Mark (BOM) naar het uitvoerbestand schrijven. Standaard wordt een UTF-8-BOM geschreven.</p>
268
269 <p>Als het invoerbestand in UTF-16 is, en de optie <code>-u</code> is gegeven, dan wordt een UTF-16-BOM geschreven.</p>
270
271 <p>Gebruik deze optie nooit als de codering van het uitvoerbestand niet UTF-8 of UTF-16 is. Zie ook de sectie UNICODE.</p>
272
273 </dd>
274 <dt id="n---newfile-INVOERBESTAND-UITVOERBESTAND"><b>-n</b>, <b>--newfile INVOERBESTAND UITVOERBESTAND</b> ...</dt>
275 <dd>
276
277 <p>Nieuw-bestand-modus. Het bestand INVOERBESTAND converteren en naar bestand UITVOERBESTAND schrijven. Bestandsnamen moeten opgegeven worden in paren. Jokertekens moeten <i>niet</i>gebruikt worden, anders <i>verlies</i> je de bestanden.</p>
278
279 <p>De gebruiker die de conversie start in nieuw-bestand (gepaarde) modus wordt de eigenaar van het geconverteerde bestand. De lees/schrijf-toegangsrechten van het nieuwe bestand worden de toegangsrechten van het originele bestand minus de umask(1) van de gebruiker die de conversie draait.</p>
280
281 </dd>
282 <dt id="o---oldfile-BESTAND"><b>-o</b>, <b>--oldfile BESTAND</b> ...</dt>
283 <dd>
284
285 <p>Oud-bestand-modus. Het bestand BESTAND converteren en overschrijven. Dit is de standaard modus. Jokertekens kunnen gebruikt worden.</p>
286
287 <p>In oud-bestand (vervangende) modus krijgt het geconverteerde bestand dezelfde eigenaar, groep en lees/schrijf-rechten als het originele bestand. Ook wanneer het bestand wordt omgezet door een andere gebruiker die schrijfrechten heeft op het bestand (b.v. gebruiker root). De omzetting wordt afgebroken wanneer het niet mogelijk is de originele waardes te behouden. Verandering van eigenaar kan betekenen dat de originele eigenaar het bestand niet meer kan lezen. Verandering van groep zou een veiligheidsrisico kunnen zijn, het bestand zou leesbaar kunnen worden voor personen voor wie het niet bestemd is. Behoud van eigenaar, groep en lees/schrijf-rechten wordt alleen ondersteund op Unix.</p>
288
289 </dd>
290 <dt id="q---quiet"><b>-q</b>, <b>--quiet</b></dt>
291 <dd>
292
293 <p>Stille werking. Alle waarschuwingen onderdrukken. De aflsuitwaarde is nul, behalve wanneer verkeerde opties worden gegeven.</p>
294
295 </dd>
296 <dt id="r---remove-bom"><b>-r</b>, <b>--remove-bom</b></dt>
297 <dd>
298
299 <p>Een Byte-Order-Mark (BOM) verwijderen. Er wordt geen BOM naar het uitvoerbestand geschreven. Dit is het standaardgedrag bij conversie naar Unix. Zie ook optie <code>-b</code>.</p>
300
301 </dd>
302 <dt id="s---safe"><b>-s</b>, <b>--safe</b></dt>
303 <dd>
304
305 <p>Binaire bestanden overslaan (standaard).</p>
306
307 </dd>
308 <dt id="u---keep-utf16"><b>-u</b>, <b>--keep-utf16</b></dt>
309 <dd>
310
311 <p>De originele UTF-16-codering van het invoerbestand behouden. Het uitvoerbestand wordt in dezelfde UTF-16-codering (little endian of big endian) geschreven als het invoerbestand. Dit voorkomt conversie naar UTF-8. Er wordt ook een corresponderende UTF-16-BOM geschreven. Deze optie kan uitgeschakeld worden met de optie <code>-ascii</code>.</p>
312
313 </dd>
314 <dt id="ul---assume-utf16le"><b>-ul</b>, <b>--assume-utf16le</b></dt>
315 <dd>
316
317 <p>Veronderstellen dat de indeling van het invoerbestand UTF-16LE is.</p>
318
319 <p>Wanneer het invoerbestand een Byte-Order-Mark (BOM) bevat, dan gaat deze BOM v&oacute;&oacute;r deze optie.</p>
320
321 <p>Wanneer een verkeerde aanname is gemaakt (het invoerbestand was geen UTF-16LE) en de conversie verliep met succes, dan krijgt u een UTF-8-bestand met verkeerde tekst. De verkeerde conversie kan ongedaan worden gemaakt door met iconv(1) het UTF-8-uitvoerbestand terug om te zetten naar UTF-16LE. Dit zal het originele bestand terug brengen.</p>
322
323 <p>De aanname van UTF-16LE werkt als een <i>conversiemodus</i>. Door de standaardmodus <i>ascii</i> in te schakelen wordt de UTF-16LE-veronderstelling uitgeschakeld.</p>
324
325 </dd>
326 <dt id="ub---assume-utf16be"><b>-ub</b>, <b>--assume-utf16be</b></dt>
327 <dd>
328
329 <p>Veronderstellen dat de indeling van het invoerbestand UTF-16BE is.</p>
330
331 <p>Deze optie werkt hetzelfde als optie <code>-ul</code>.</p>
332
333 </dd>
334 <dt id="v---verbose"><b>-v</b>, <b>--verbose</b></dt>
335 <dd>
336
337 <p>Extra meldingen weergeven. Er wordt extra informatie getoond over Byte-Order-Marks en het aantal geconverteerde regeleindes.</p>
338
339 </dd>
340 <dt id="F---follow-symlink"><b>-F</b>, <b>--follow-symlink</b></dt>
341 <dd>
342
343 <p>Symbolische koppelingen volgen en de doelen converteren.</p>
344
345 </dd>
346 <dt id="R---replace-symlink"><b>-R</b>, <b>--replace-symlink</b></dt>
347 <dd>
348
349 <p>Symbolische koppelingen vervangen door geconverteerde bestanden (de originele doelbestanden blijven ongewijzigd).</p>
350
351 </dd>
352 <dt id="S---skip-symlink"><b>-S</b>, <b>--skip-symlink</b></dt>
353 <dd>
354
355 <p>Symbolische koppelingen en doelen ongewijzigd laten (standaard).</p>
356
357 </dd>
358 <dt id="V---version"><b>-V</b>, <b>--version</b></dt>
359 <dd>
360
361 <p>Versie-informatie tonen.</p>
362
363 </dd>
364 </dl>
365
366 <h1 id="MAC-MODUS">MAC-MODUS</h1>
367
368 <p>In normale modus worden DOS-regeleindes naar Unix omgezet en vice versa. Mac-regeleindes worden niet omgezet.</p>
369
370 <p>In Mac-modus worden Mac-regeleindes naar Unix omgezet en vice versa. DOS-regeleindes blijven ongewijzigd.</p>
371
372 <p>Om in Mac-modus te draaien kunt u de opdrachtregeloptie <code>-c mac</code> gebruiken, of de opdrachten <code>mac2unix</code> of <code>unix2mac</code>.</p>
373
374 <h1 id="CONVERSIEMODI">CONVERSIEMODI</h1>
375
376 <dl>
377
378 <dt id="ascii1"><b>ascii</b></dt>
379 <dd>
380
381 <p>In modus <code>ascii</code> worden alleen regeleindes omgezet. Dit is de standaardmodus.</p>
382
383 <p>Hoewel de naam van deze modus ASCII is, wat een 7-bits standaard is, is de werkelijke modus 8-bits. Gebruik altijd deze modus wanneer u Unicode UTF-8-bestanden omzet.</p>
384
385 </dd>
386 <dt id="bit"><b>7bit</b></dt>
387 <dd>
388
389 <p>Alle 8-bits niet-ASCII lettertekens (met waardes van 128 t/m 255) worden omgezet naar een 7-bits spatie.</p>
390
391 </dd>
392 <dt id="iso1"><b>iso</b></dt>
393 <dd>
394
395 <p>Tekens worden omgezet tussen een DOS-tekenset (codetabel) en de ISO-tekenset ISO-8859-1 (Latin-1) op Unix. DOS-tekens zonder een ISO-8859-1-equivalent, waarvoor dus geen omzetting mogelijk is, worden omgezet in een punt. Hetzelfde geldt voor ISO-8859-1-tekens zonder DOS-tegenhanger.</p>
396
397 <p>Wanneer alleen optie <code>-iso</code> gebruikt wordt, zal dos2unix proberen de actieve codetabel te gebruiken. Als dat niet mogelijk is wordt codetabel CP437 gebruikt, die vooral in de VS gebruikt wordt. Om een bepaalde codetabel te forceren, kunt u de opties <code>-850</code> (West-Europees), <code>-860</code> (Portugees), <code>-863</code> (Canadees Frans) of <code>-865</code> (Scandinavisch) gebruiken. Windows-codetabel CP1252 (West-Europees) wordt ook ondersteund met optie <code>-1252</code>. Gebruik voor andere codetabellen dos2unix in combinatie met iconv(1). Iconv kan omzetten tussen een lange lijst tekensetcoderingen.</p>
398
399 <p>Gebruik ISO-conversie nooit op Unicode-tekstbestanden. Het zal UTF-8-gecodeerde bestanden beschadigen.</p>
400
401 <p>Enkele voorbeelden:</p>
402
403 <p>Omzetten van de standaard DOS-codetabel naar Unix Latin-1</p>
404
405 <pre><code>    dos2unix -iso -n in.txt uit.txt</code></pre>
406
407 <p>Omzetten van DOS CP850 naar Unix Latin-1</p>
408
409 <pre><code>    dos2unix -850 -n in.txt uit.txt</code></pre>
410
411 <p>Omzetten van Windows CP1252 naar Unix Latin-1</p>
412
413 <pre><code>    dos2unix -1252 -n in.txt uit.txt</code></pre>
414
415 <p>Omzetten van Windows CP1252 naar Unix UTF-8 (Unicode)</p>
416
417 <pre><code>    iconv -f CP1252 -t UTF-8 in.txt | dos2unix &gt; uit.txt</code></pre>
418
419 <p>Omzetten van Unix Latin-1 naar de standaard DOS-codetabel</p>
420
421 <pre><code>    unix2dos -iso -n in.txt uit.txt</code></pre>
422
423 <p>Omzetten van Unix Latin-1 naar DOS CP850</p>
424
425 <pre><code>    unix2dos -850 -n in.txt uit.txt</code></pre>
426
427 <p>Omzetten van Unix Latin-1 naar Windows CP1252</p>
428
429 <pre><code>    unix2dos -1252 -n in.txt uit.txt</code></pre>
430
431 <p>Omzetten van Unix UTF-8 (Unicode) naar Windows CP1252</p>
432
433 <pre><code>    unix2dos &lt; in.txt | iconv -f UTF-8 -t CP1252 &gt; uit.txt</code></pre>
434
435 <p>Zie ook <a href="http://czyborra.com/charsets/codepages.html">http://czyborra.com/charsets/codepages.html</a> en <a href="http://czyborra.com/charsets/iso8859.html">http://czyborra.com/charsets/iso8859.html</a>.</p>
436
437 </dd>
438 </dl>
439
440 <h1 id="UNICODE">UNICODE</h1>
441
442 <h2 id="Coderingen">Coderingen</h2>
443
444 <p>Er bestaan verschillende Unicode-coderingen. Op Unix en Linux zijn Unicode-bestanden typisch gecodeerd in UTF-8. Op Windows kunnen Unicode-tekstbestanden gecodeerd zijn in UTF-8, UTF-16 of UTF-16 big endian, maar ze zijn meestal gecodeerd in UTF-16.</p>
445
446 <h2 id="Conversie">Conversie</h2>
447
448 <p>Unicode-tekstbestanden kunnen DOS-, Unix- of Mac-regeleindes hebben, net als reguliere tekstbestanden.</p>
449
450 <p>Alle versies van dos2unix en unix2dos kunnen UTF-8-gecodeerde bestanden omzetten, want UTF-8 is ontworpen op compatibiliteit met ASCII.</p>
451
452 <p>Dos2unix en unix2dos met Unicode UTF-16-ondersteuning, kunnen little en big endian UTF-16 gecodeerde tekstbestanden lezen. Om er achter te komen of dos2unix gebouwd is met UTF-16- ondersteuning, typt u <code>dos2unix -V</code>.</p>
453
454 <p>In UTF-16 gecodeerde bestanden worden standaard geconverteerd naar UTF-8. Op Unix/Linux dient de codering van de taalregio op UTF-8 ingesteld te zijn. Gebruik de opdracht locale(1) om uit te vinden wat de codering van uw taalregio is. In UTF-8 gecodeerde bestanden worden wijdverbreid ondersteund, zowel in Windows als op Unix/Linux.</p>
455
456 <p>De UTF-16- en UTF-8-coderingen zijn volledig compatibel, er gaat bij het converteren niets verloren. Als er tijdens de conversie van UTF-16 naar UTF-8 een fout optreedt, bijvoorbeeld omdat het UTF-16-invoerbestand een fout bevat, dan wordt het bestand overgeslagen.</p>
457
458 <p>Wanneer <code>-u</code> gebruikt wordt, wordt het uitvoerbestand in dezelfde UTF-16-codering geschreven als het invoerbestand. Optie <code>-u</code> voorkomt conversie naar UTF-8.</p>
459
460 <p>Dos2unix en unix2dos hebben geen optie om van UTF-8 naar UTF-16 te converteren.</p>
461
462 <p>ISO- en 7-bits-conversie werken niet op UTF-16-bestanden.</p>
463
464 <h2 id="Byte-Order-Mark">Byte-Order-Mark</h2>
465
466 <p>Op Windows bevatten Unicode-tekstbestanden typisch een Byte-Order-Mark (BOM), omdat veel Windows-programma&#39;s (inclusief Kladblok) standaard een BOM toevoegen. Zie ook <a href="http://en.wikipedia.org/wiki/Byte_order_mark">http://en.wikipedia.org/wiki/Byte_order_mark</a>.</p>
467
468 <p>Op Unix hebben Unicode-tekstbestanden typisch geen BOM. Er wordt aangenomen dat de codering van tekstbestanden gelijk is aan de lokale tekencodering.</p>
469
470 <p>Dos2unix kan alleen detecteren of een bestand in UTF-16-codering is als het bestand een BOM bevat. Wanneer een UTF-16-bestand geen BOM heeft, ziet dos2unix het bestand als een binair bestand.</p>
471
472 <p>Gebruik optie <code>-ul</code> of <code>-ub</code> om een UTF-16-bestand zonder BOM om te zetten.</p>
473
474 <p>Dos2unix schrijft standaard geen BOM in het uitvoerbestand. Met optie <code>-b</code> schrijft dos2unix een BOM wanneer het invoerbestand een BOM bevat.</p>
475
476 <p>Unix2dos schrijft standaard een BOM in het uitvoerbestand wanneer het invoerbestand een BOM bevat. Gebruik optie <code>-r</code> om de BOM te verwijderen.</p>
477
478 <p>Dos2unix en unix2dos schrijven altijd een BOM wanneer optie <code>-m</code> gebruikt wordt.</p>
479
480 <h2 id="Unicode-voorbeelden">Unicode-voorbeelden</h2>
481
482 <p>Omzetten van Windows UTF-16 (met BOM) naar Unix UTF-8</p>
483
484 <pre><code>    dos2unix -n in.txt uit.txt</code></pre>
485
486 <p>Omzetten van Windows UTF-16LE (zonder BOM) naar Unix UTF-8</p>
487
488 <pre><code>    dos2unix -ul -n in.txt uit.txt</code></pre>
489
490 <p>Omzetten van Unix UTF-8 naar Windows UTF-8 met BOM</p>
491
492 <pre><code>    unix2dos -m -n in.txt uit.txt</code></pre>
493
494 <p>Omzetten van Unix UTF-8 naar Windows UTF-16</p>
495
496 <pre><code>    unix2dos &lt; in.txt | iconv -f UTF-8 -t UTF-16 &gt; uit.txt</code></pre>
497
498 <h1 id="VOORBEELDEN">VOORBEELDEN</h1>
499
500 <p>Invoer lezen van standaardinvoer en uitvoer schrijven naar standaarduitvoer.</p>
501
502 <pre><code>    dos2unix
503     dos2unix -l -c mac</code></pre>
504
505 <p>Omzetten en vervangen van a.txt. Omzetten en vervangen van b.txt.</p>
506
507 <pre><code>    dos2unix a.txt b.txt
508     dos2unix -o a.txt b.txt</code></pre>
509
510 <p>Omzetten en vervangen van a.txt in ascii-conversiemodus.</p>
511
512 <pre><code>    dos2unix a.txt</code></pre>
513
514 <p>Omzetten en vervangen van a.txt in ascii-conversiemodus. Omzetten en vervangen b.txt in 7-bits conversiemodus.</p>
515
516 <pre><code>    dos2unix a.txt -c 7bit b.txt
517     dos2unix -c ascii a.txt -c 7bit b.txt
518     dos2unix -ascii a.txt -7 b.txt</code></pre>
519
520 <p>Omzetten van a.txt van Mac- naar Unix-indeling.</p>
521
522 <pre><code>    dos2unix -c mac a.txt
523     mac2unix a.txt</code></pre>
524
525 <p>Omzetten van a.txt van Unix- naar Mac-indeling.</p>
526
527 <pre><code>    unix2dos -c mac a.txt
528     unix2mac a.txt</code></pre>
529
530 <p>Omzetten en vervangen van a.txt met behoud van origineel tijdsstempel.</p>
531
532 <pre><code>    dos2unix -k a.txt
533     dos2unix -k -o a.txt</code></pre>
534
535 <p>Omzetten van a.txt en naar e.txt schrijven.</p>
536
537 <pre><code>    dos2unix -n a.txt e.txt</code></pre>
538
539 <p>Omzetten van a.txt en naar e.txt schrijven, met tijdsstempel van e.txt gelijk aan die van a.txt.</p>
540
541 <pre><code>    dos2unix -k -n a.txt e.txt</code></pre>
542
543 <p>Omzetten en vervangen van a.txt. Omzetten van b.txt en naar e.txt schrijven.</p>
544
545 <pre><code>    dos2unix a.txt -n b.txt e.txt
546     dos2unix -o a.txt -n b.txt e.txt</code></pre>
547
548 <p>Omzetten van c.txt en naar e.txt schrijven. Omzetten en vervangen van a.txt. Omzetten en vervangen van b.txt. Omzetten van d.txt en naar f.txt schrijven.</p>
549
550 <pre><code>    dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt</code></pre>
551
552 <h1 id="RECURSIEVE-CONVERSIE">RECURSIEVE CONVERSIE</h1>
553
554 <p>Gebruik dos2unix in combinatie met de opdrachten find(1) en xargs(1) om tekstbestanden in een mappenboom recursief om te zetten. Bijvoorbeeld om alle .txt-bestanden in de mappenboom onder de huidige map te converteren, typt u:</p>
555
556 <pre><code>    find . -name *.txt |xargs dos2unix</code></pre>
557
558 <h1 id="LOKALISATIE">LOKALISATIE</h1>
559
560 <dl>
561
562 <dt id="LANG"><b>LANG</b></dt>
563 <dd>
564
565 <p>The primaire taal wordt geselecteerd via de omgevingsvariabele LANG. De variabele LANG bestaat uit verschillende onderdelen. Het eerste deel is in kleine letters de taalcode. Het tweede deel is optioneel en is de landcode in hoofdletters, voorafgegaan door een liggend streepje. Er is ook een optioneel derde deel: de tekencodering, voorafgegaan door een punt. Enkele voorbeelden voor een POSIX-shell:</p>
566
567 <pre><code>    export LANG=nl               Nederlands
568     export LANG=nl_NL            Nederlands, Nederland
569     export LANG=nl_BE            Nederlands, Belgi&euml;
570     export LANG=es_ES            Spaans, Spanje
571     export LANG=es_MX            Spaans, Mexico
572     export LANG=en_US.iso88591   Engels, VS, Latin-1-codering
573     export LANG=en_GB.UTF-8      Engels, GB, UTF-8-codering</code></pre>
574
575 <p>Voor een complete lijst van taal- en landcodes zie de gettext-handleiding: <a href="http://www.gnu.org/software/gettext/manual/gettext.html#Language-Codes">http://www.gnu.org/software/gettext/manual/gettext.html#Language-Codes</a></p>
576
577 <p>Op Unix-systemen kunt u de opdracht locale(1) gebruiken om specifieke taalregio-informatie te verkrijgen.</p>
578
579 </dd>
580 <dt id="LANGUAGE"><b>LANGUAGE</b></dt>
581 <dd>
582
583 <p>Met de omgevingsvariabele LANGUAGE kunt u een prioriteitenlijst specificeren van talen, gescheiden door dubbele punten. Dos2unix geeft voorrang aan LANGUAGE boven LANG. Bijvoorbeeld, eerst Nederlands en dan Duits: <code>LANGUAGE=nl:de</code>. U moet eerst lokalisatie in werking stellen, door het instellen van LANG (of LC_ALL) op een waarde ongelijk aan &quot;C&quot;, voordat u een talen-prioriteitenlijst kunt gebruiken via de variabele LANGUAGE. Zie ook de gettext-handleiding: <a href="http://www.gnu.org/software/gettext/manual/gettext.html#The-LANGUAGE-variable">http://www.gnu.org/software/gettext/manual/gettext.html#The-LANGUAGE-variable</a></p>
584
585 <p>Als u een taal kiest die niet beschikbaar is, worden de standaard Engelse berichten gebruikt.</p>
586
587 </dd>
588 <dt id="DOS2UNIX_LOCALEDIR"><b>DOS2UNIX_LOCALEDIR</b></dt>
589 <dd>
590
591 <p>Met de omgevingsvariabele DOS2UNIX_LOCALEDIR kan de LOCALEDIR die ingesteld werd tijdens compilatie worden overstemd. LOCALEDIR wordt gebruikt om de taalbestanden te vinden. De GNU standaardwaarde is <code>/usr/local/share/locale</code>. De optie <b>--version</b> laat de gebruikte LOCALEDIR zien.</p>
592
593 <p>Voorbeeld (POSIX-shell):</p>
594
595 <pre><code>    export DOS2UNIX_LOCALEDIR=$HOME/share/locale</code></pre>
596
597 </dd>
598 </dl>
599
600 <h1 id="AFSLUITWAARDE">AFSLUITWAARDE</h1>
601
602 <p>Bij succes wordt nul teruggegeven. Wanneer een systeemfout optreedt wordt het laatste systeemfoutnummer teruggegeven. Bij andere fouten wordt 1 teruggegeven.</p>
603
604 <p>De afsluitwaarde is altijd nul in de stillewerkingsmodus, behalve wanneer verkeerde opties worden gegeven.</p>
605
606 <h1 id="STANDAARDEN">STANDAARDEN</h1>
607
608 <p><a href="http://nl.wikipedia.org/wiki/Tekstbestand">http://nl.wikipedia.org/wiki/Tekstbestand</a></p>
609
610 <p><a href="http://nl.wikipedia.org/wiki/Carriage_Return">http://nl.wikipedia.org/wiki/Carriage_Return</a></p>
611
612 <p><a href="http://nl.wikipedia.org/wiki/Linefeed">http://nl.wikipedia.org/wiki/Linefeed</a></p>
613
614 <p>&lt;http://nl.wikipedia.org/wiki/Unicode&gt;</p>
615
616 <h1 id="AUTEURS">AUTEURS</h1>
617
618 <p>Benjamin Lin - &lt;blin@socs.uts.edu.au&gt; Bernd Johannes Wuebben (mac2unix-modus) - &lt;wuebben@kde.org&gt;, Christian Wurll (toevoegen van extra regeleindes) - &lt;wurll@ira.uka.de&gt;, Erwin Waterlander - &lt;waterlan@xs4all.nl&gt; (beheerder)</p>
619
620 <p>Projectpagina: <a href="http://waterlan.home.xs4all.nl/dos2unix.html">http://waterlan.home.xs4all.nl/dos2unix.html</a></p>
621
622 <p>SourceForge-pagina: <a href="http://sourceforge.net/projects/dos2unix/">http://sourceforge.net/projects/dos2unix/</a></p>
623
624 <h1 id="ZIE-OOK">ZIE OOK</h1>
625
626 <p>file(1) find(1) iconv(1) locale(1) xargs(1)</p>
627
628
629 </body>
630
631 </html>
632
633