0c2469f72d27a97e84b95699232c0a80b02e5ed4
[platform/upstream/dos2unix.git] / man / nl / man1 / dos2unix.txt
1 NAAM
2     dos2unix - omzetter van tekstbestandsindelingen, van DOS/Mac naar Unix
3     en vice versa
4
5 OVERZICHT
6         dos2unix [opties] [BESTAND ...] [-n INVOERBESTAND UITVOERBESTAND ...]
7         unix2dos [opties] [BESTAND ...] [-n INVOERBESTAND UITVOERBESTAND ...]
8
9 BESCHRIJVING
10     Het Dos2unix pakket bevat de toepassingen "dos2unix" en "unix2dos" om
11     platte tekstbestanden in DOS- of Mac-indeling naar Unix-indeling om te
12     zetten, en vice versa.
13
14     In DOS/Windows-tekstbestanden bestaat een regeleinde uit een combinatie
15     van twee tekens: een 'Carriage Return' (CR) gevolgd door een 'Line Feed'
16     (LF). In Unix-tekstbestanden bestaat een regeleinde uit één enkel
17     'Newline'-teken, dat gelijk is aan een DOS 'Line Feed'-teken (LF). In
18     Mac-tekstbestanden, van vóór Mac OS X, bestaan regeleindes uit één enkel
19     'Carriage Return'-teken. Mac OS X is op Unix gebaseerd en heeft dezelfde
20     regeleindes als Unix.
21
22     Naast regeleindes kan Dos2unix ook de codering van bestanden
23     converteren. Enkele DOS-codetabellen kunnen omgezet worden naar Unix
24     Latin-1. En Windows Unicode-bestanden (UTF-16) kunnen geconverteerd
25     worden naar Unix Unicode-bestanden (UTF-8).
26
27     Binaire bestanden worden automatisch overgeslagen, behalve als de
28     omzetting geforceerd wordt.
29
30     Niet-reguliere bestanden, zoals mappen en FIFO's, worden automatisch
31     overgeslagen.
32
33     Symbolische koppelingen en hun doelen blijven standaard onaangeroerd.
34     Optioneel kunnen symbolische koppelingen worden vervangen, of de uitvoer
35     kan naar het doel van de symbolische koppeling worden geschreven. Op
36     Windows wordt het schrijven naar het doel van een symbolische koppeling
37     niet ondersteund.
38
39     Dos2unix is gemodelleerd naar dos2unix op SunOS/Solaris, maar er is één
40     belangrijk verschil: deze versie van dos2unix voert standaard een
41     vervangende conversie uit (oud-bestand-modus) terwijl de oorspronkelijke
42     SunOS/Solaris-versie alleen de gepaarde conversie (nieuw-bestand-modus)
43     kent. Zie ook de opties "-o" en "-n".
44
45 OPTIES
46     --  Alle volgende opties als bestandsnamen behandelen. Gebruik deze
47         optie als u een bestand wilt converteren waarvan de naam met een
48         streepje begint. Bijvoorbeeld, om een bestand genaamd "-foo" om te
49         zetten, gebruikt u de volgende opdracht:
50
51             dos2unix -- -foo
52
53         Of in nieuw-bestand-modus:
54
55             dos2unix -n -- -foo uit.txt
56
57     -ascii
58         Alleen regeleindes converteren. Dit is de standaardconversiemodus.
59
60     -iso
61         Conversie tussen de tekensets DOS en ISO-8859-1. Zie ook de sectie
62         CONVERSIEMODI.
63
64     -1252
65         Windows-codetabel 1252 (West-Europees) gebruiken.
66
67     -437
68         DOS-codetabel 437 (VS) gebruiken. Dit is de standaard codetabel die
69         gebruikt wordt bij ISO-conversie.
70
71     -850
72         DOS-codetabel 850 (West-Europees) gebruiken.
73
74     -860
75         DOS-codetabel 860 (Portugees) gebruiken.
76
77     -863
78         DOS-codetabel 863 (Canadees Frans) gebruiken.
79
80     -865
81         DOS-codetabel 865 (Scandinavisch) gebruiken.
82
83     -7  Lettertekens met het achtste bit gezet converteren naar spaties.
84
85     -b, --keep-bom
86         Een Byte Order Mark (BOM) behouden. Als het invoerbestand een BOM
87         bevat, dan wordt ook een BOM naar het uitvoerbestand geschreven. Dit
88         is het standaardgedrag bij conversie naar DOS. Zie ook optie "-r".
89
90     -c, --convmode CONVERSIEMODUS
91         De te gebruiken conversiemodus. CONVERSIEMODUS kan zijn: *ascii*,
92         *7bit*, *iso*, of *mac*, waarbij ascii de standaardinstelling is.
93
94     -f, --force
95         Conversie van binaire bestanden afdwingen.
96
97     -h, --help
98         Een hulptekst tonen.
99
100     -k, --keepdate
101         Het tijdsstempel van het invoerbestand behouden voor het
102         uitvoerbestand.
103
104     -L, --license
105         De softwarelicentie tonen.
106
107     -l, --newline
108         Een extra regeleinde toevoegen.
109
110         dos2unix: Alleen DOS-regeleindes worden omgezet naar twee
111         Unix-regeleindes. In Mac-modus worden alleen Mac-regeleindes omgezet
112         naar twee Unix-regeleindes.
113
114         unix2dos: Alleen Unix-regeleindes worden omgezet naar twee
115         DOS-regeleindes. In Mac-modus worden Unix-regeleindes omgezet naar
116         twee Mac-regeleindes.
117
118     -m, --add-bom
119         Een Byte Order Mark (BOM) naar het uitvoerbestand schrijven.
120         Standaard wordt een UTF-8-BOM geschreven.
121
122         Als het invoerbestand in UTF-16 is, en de optie "-u" is gegeven, dan
123         wordt een UTF-16-BOM geschreven.
124
125         Gebruik deze optie nooit als de codering van het uitvoerbestand niet
126         UTF-8 of UTF-16 is. Zie ook de sectie UNICODE.
127
128     -n, --newfile INVOERBESTAND UITVOERBESTAND ...
129         Nieuw-bestand-modus. Het bestand INVOERBESTAND converteren en naar
130         bestand UITVOERBESTAND schrijven. Bestandsnamen moeten opgegeven
131         worden in paren. Jokertekens moeten *niet*gebruikt worden, anders
132         *verlies* je de bestanden.
133
134         De gebruiker die de conversie start in nieuw-bestand (gepaarde)
135         modus wordt de eigenaar van het geconverteerde bestand. De
136         lees/schrijf-toegangsrechten van het nieuwe bestand worden de
137         toegangsrechten van het originele bestand minus de umask(1) van de
138         gebruiker die de conversie draait.
139
140     -o, --oldfile BESTAND ...
141         Oud-bestand-modus. Het bestand BESTAND converteren en overschrijven.
142         Dit is de standaard modus. Jokertekens kunnen gebruikt worden.
143
144         In oud-bestand (vervangende) modus krijgt het geconverteerde bestand
145         dezelfde eigenaar, groep en lees/schrijf-rechten als het originele
146         bestand. Ook wanneer het bestand wordt omgezet door een andere
147         gebruiker die schrijfrechten heeft op het bestand (b.v. gebruiker
148         root). De omzetting wordt afgebroken wanneer het niet mogelijk is de
149         originele waardes te behouden. Verandering van eigenaar kan
150         betekenen dat de originele eigenaar het bestand niet meer kan lezen.
151         Verandering van groep zou een veiligheidsrisico kunnen zijn, het
152         bestand zou leesbaar kunnen worden voor personen voor wie het niet
153         bestemd is. Behoud van eigenaar, groep en lees/schrijf-rechten wordt
154         alleen ondersteund op Unix.
155
156     -q, --quiet
157         Stille werking. Alle waarschuwingen onderdrukken. De aflsuitwaarde
158         is nul, behalve wanneer verkeerde opties worden gegeven.
159
160     -r, --remove-bom
161         Een Byte Order Mark (BOM) verwijderen. Er wordt geen BOM naar het
162         uitvoerbestand geschreven. Dit is het standaardgedrag bij conversie
163         naar Unix. Zie ook optie "-b".
164
165     -s, --safe
166         Binaire bestanden overslaan (standaard).
167
168     -u, --keep-utf16
169         De originele UTF-16-codering van het invoerbestand behouden. Het
170         uitvoerbestand wordt in dezelfde UTF-16-codering (little endian of
171         big endian) geschreven als het invoerbestand. Dit voorkomt conversie
172         naar UTF-8. Er wordt ook een corresponderende UTF-16-BOM geschreven.
173         Deze optie kan uitgeschakeld worden met de optie "-ascii".
174
175     -ul, --assume-utf16le
176         Veronderstellen dat de indeling van het invoerbestand UTF-16LE is.
177
178         Wanneer het invoerbestand een Byte Order Mark (BOM) bevat, dan gaat
179         deze BOM vóór deze optie.
180
181         Wanneer een verkeerde aanname is gemaakt (het invoerbestand was geen
182         UTF-16LE) en de conversie verliep met succes, dan krijgt u een
183         UTF-8-bestand met verkeerde tekst. De verkeerde conversie kan
184         ongedaan worden gemaakt door met iconv(1) het UTF-8-uitvoerbestand
185         terug om te zetten naar UTF-16LE. Dit zal het originele bestand
186         terug brengen.
187
188         De aanname van UTF-16LE werkt als een *conversiemodus*. Door de
189         standaardmodus *ascii* in te schakelen wordt de
190         UTF-16LE-veronderstelling uitgeschakeld.
191
192     -ub, --assume-utf16be
193         Veronderstellen dat de indeling van het invoerbestand UTF-16BE is.
194
195         Deze optie werkt hetzelfde als optie "-ul".
196
197     -v, --verbose
198         Extra meldingen weergeven. Er wordt extra informatie getoond over
199         'Byte Order Marks' en het aantal geconverteerde regeleindes.
200
201     -F, --follow-symlink
202         Symbolische koppelingen volgen en de doelen converteren.
203
204     -R, --replace-symlink
205         Symbolische koppelingen vervangen door geconverteerde bestanden (de
206         originele doelbestanden blijven ongewijzigd).
207
208     -S, --skip-symlink
209         Symbolische koppelingen en doelen ongewijzigd laten (standaard).
210
211     -V, --version
212         Versie-informatie tonen.
213
214 MAC-MODUS
215     In normale modus worden DOS-regeleindes naar Unix omgezet en vice versa.
216     Mac-regeleindes worden niet omgezet.
217
218     In Mac-modus worden Mac-regeleindes naar Unix omgezet en vice versa.
219     DOS-regeleindes blijven ongewijzigd.
220
221     Om in Mac-modus te draaien kunt u de opdrachtregeloptie "-c mac"
222     gebruiken, of de opdrachten "mac2unix" of "unix2mac".
223
224 CONVERSIEMODI
225     ascii
226         In modus "ascii" worden alleen regeleindes omgezet. Dit is de
227         standaardmodus.
228
229         Hoewel de naam van deze modus ASCII is, wat een 7-bits standaard is,
230         is de werkelijke modus 8-bits. Gebruik altijd deze modus wanneer u
231         Unicode UTF-8-bestanden omzet.
232
233     7bit
234         Alle 8-bits niet-ASCII lettertekens (met waardes van 128 t/m 255)
235         worden omgezet naar een 7-bits spatie.
236
237     iso Tekens worden omgezet tussen een DOS-tekenset (codetabel) en de
238         ISO-tekenset ISO-8859-1 (Latin-1) op Unix. DOS-tekens zonder een
239         ISO-8859-1-equivalent, waarvoor dus geen omzetting mogelijk is,
240         worden omgezet in een punt. Hetzelfde geldt voor ISO-8859-1-tekens
241         zonder DOS-tegenhanger.
242
243         Wanneer alleen optie "-iso" gebruikt wordt, zal dos2unix proberen de
244         actieve codetabel te gebruiken. Als dat niet mogelijk is wordt
245         codetabel CP437 gebruikt, die vooral in de VS gebruikt wordt. Om een
246         bepaalde codetabel te forceren, kunt u de opties -850
247         (West-Europees), -860 (Portugees), -863 (Canadees Frans) of -865
248         (Scandinavisch) gebruiken. Windows-codetabel CP1252 (West-Europees)
249         wordt ook ondersteund met optie -1252. Gebruik voor andere
250         codetabellen dos2unix in combinatie met iconv(1). Iconv kan omzetten
251         tussen een lange lijst tekensetcoderingen.
252
253         Gebruik ISO-conversie nooit op Unicode-tekstbestanden. Het zal
254         UTF-8-gecodeerde bestanden beschadigen.
255
256         Enkele voorbeelden:
257
258         Omzetten van de standaard DOS-codetabel naar Unix Latin-1
259
260             dos2unix -iso -n in.txt uit.txt
261
262         Omzetten van DOS CP850 naar Unix Latin-1
263
264             dos2unix -850 -n in.txt uit.txt
265
266         Omzetten van Windows CP1252 naar Unix Latin-1
267
268             dos2unix -1252 -n in.txt uit.txt
269
270         Omzetten van Windows CP1252 naar Unix UTF-8 (Unicode)
271
272             iconv -f CP1252 -t UTF-8 in.txt | dos2unix > uit.txt
273
274         Omzetten van Unix Latin-1 naar de standaard DOS-codetabel
275
276             unix2dos -iso -n in.txt uit.txt
277
278         Omzetten van Unix Latin-1 naar DOS CP850
279
280             unix2dos -850 -n in.txt uit.txt
281
282         Omzetten van Unix Latin-1 naar Windows CP1252
283
284             unix2dos -1252 -n in.txt uit.txt
285
286         Omzetten van Unix UTF-8 (Unicode) naar Windows CP1252
287
288             unix2dos < in.txt | iconv -f UTF-8 -t CP1252 > uit.txt
289
290         Zie ook <http://czyborra.com/charsets/codepages.html> en
291         <http://czyborra.com/charsets/iso8859.html>.
292
293 UNICODE
294   Coderingen
295     Er bestaan verschillende Unicode-coderingen. Op Unix en Linux zijn
296     Unicode-bestanden typisch gecodeerd in UTF-8. Op Windows kunnen
297     Unicode-tekstbestanden gecodeerd zijn in UTF-8, UTF-16 of UTF-16 big
298     endian, maar ze zijn meestal gecodeerd in UTF-16.
299
300   Conversie
301     Unicode-tekstbestanden kunnen DOS-, Unix- of Mac-regeleindes hebben, net
302     als reguliere tekstbestanden.
303
304     Alle versies van dos2unix en unix2dos kunnen UTF-8-gecodeerde bestanden
305     omzetten, want UTF-8 is ontworpen op compatibiliteit met ASCII.
306
307     Dos2unix en unix2dos met Unicode UTF-16-ondersteuning, kunnen little en
308     big endian UTF-16 gecodeerde tekstbestanden lezen. Om er achter te komen
309     of dos2unix gebouwd is met UTF-16- ondersteuning, typt u "dos2unix -V".
310
311     In UTF-16 gecodeerde bestanden worden standaard geconverteerd naar
312     UTF-8. Op Unix/Linux dient de codering van de taalregio op UTF-8
313     ingesteld te zijn. Gebruik de opdracht locale(1) om uit te vinden wat de
314     codering van uw taalregio is. In UTF-8 gecodeerde bestanden worden
315     wijdverbreid ondersteund, zowel in Windows als op Unix/Linux.
316
317     De UTF-16- en UTF-8-coderingen zijn volledig compatibel, er gaat bij het
318     converteren niets verloren. Als er tijdens de conversie van UTF-16 naar
319     UTF-8 een fout optreedt, bijvoorbeeld omdat het UTF-16-invoerbestand een
320     fout bevat, dan wordt het bestand overgeslagen.
321
322     Wanneer "-u" gebruikt wordt, wordt het uitvoerbestand in dezelfde
323     UTF-16-codering geschreven als het invoerbestand. Optie "-u" voorkomt
324     conversie naar UTF-8.
325
326     Dos2unix en unix2dos hebben geen optie om van UTF-8 naar UTF-16 te
327     converteren.
328
329     ISO- en 7-bits-conversie werken niet op UTF-16-bestanden.
330
331   Byte Order Mark
332     Op Windows bevatten Unicode-tekstbestanden typisch een 'Byte Order Mark'
333     (BOM), omdat veel Windows-programma's (inclusief Kladblok) standaard een
334     BOM toevoegen. Zie ook <http://en.wikipedia.org/wiki/Byte_order_mark>.
335
336     Op Unix hebben Unicode-tekstbestanden typisch geen BOM. Er wordt
337     aangenomen dat de codering van tekstbestanden gelijk is aan de lokale
338     tekencodering.
339
340     Dos2unix kan alleen detecteren of een bestand in UTF-16-codering is als
341     het bestand een BOM bevat. Wanneer een UTF-16-bestand geen BOM heeft,
342     ziet dos2unix het bestand als een binair bestand.
343
344     Gebruik optie "-ul" of "-ub" om een UTF-16-bestand zonder BOM om te
345     zetten.
346
347     Dos2unix schrijft standaard geen BOM in het uitvoerbestand. Met optie
348     "-b" schrijft dos2unix een BOM wanneer het invoerbestand een BOM bevat.
349
350     Unix2dos schrijft standaard een BOM in het uitvoerbestand wanneer het
351     invoerbestand een BOM bevat. Gebruik optie "-r" om de BOM te
352     verwijderen.
353
354     Dos2unix en unix2dos schrijven altijd een BOM wanneer optie "-m"
355     gebruikt wordt.
356
357   Unicode-voorbeelden
358     Omzetten van Windows UTF-16 (met BOM) naar Unix UTF-8
359
360         dos2unix -n in.txt uit.txt
361
362     Omzetten van Windows UTF-16LE (zonder BOM) naar Unix UTF-8
363
364         dos2unix -ul -n in.txt uit.txt
365
366     Omzetten van Unix UTF-8 naar Windows UTF-8 met BOM
367
368         unix2dos -m -n in.txt uit.txt
369
370     Omzetten van Unix UTF-8 naar Windows UTF-16
371
372         unix2dos < in.txt | iconv -f UTF-8 -t UTF-16 > uit.txt
373
374 VOORBEELDEN
375     Invoer lezen van standaardinvoer en uitvoer schrijven naar
376     standaarduitvoer.
377
378         dos2unix
379         dos2unix -l -c mac
380
381     Omzetten en vervangen van a.txt. Omzetten en vervangen van b.txt.
382
383         dos2unix a.txt b.txt
384         dos2unix -o a.txt b.txt
385
386     Omzetten en vervangen van a.txt in ascii-conversiemodus.
387
388         dos2unix a.txt
389
390     Omzetten en vervangen van a.txt in ascii-conversiemodus. Omzetten en
391     vervangen b.txt in 7-bits conversiemodus.
392
393         dos2unix a.txt -c 7bit b.txt
394         dos2unix -c ascii a.txt -c 7bit b.txt
395         dos2unix -ascii a.txt -7 b.txt
396
397     Omzetten van a.txt van Mac- naar Unix-indeling.
398
399         dos2unix -c mac a.txt
400         mac2unix a.txt
401
402     Omzetten van a.txt van Unix- naar Mac-indeling.
403
404         unix2dos -c mac a.txt
405         unix2mac a.txt
406
407     Omzetten en vervangen van a.txt met behoud van origineel tijdsstempel.
408
409         dos2unix -k a.txt
410         dos2unix -k -o a.txt
411
412     Omzetten van a.txt en naar e.txt schrijven.
413
414         dos2unix -n a.txt e.txt
415
416     Omzetten van a.txt en naar e.txt schrijven, met tijdsstempel van e.txt
417     gelijk aan die van a.txt.
418
419         dos2unix -k -n a.txt e.txt
420
421     Omzetten en vervangen van a.txt. Omzetten van b.txt en naar e.txt
422     schrijven.
423
424         dos2unix a.txt -n b.txt e.txt
425         dos2unix -o a.txt -n b.txt e.txt
426
427     Omzetten van c.txt en naar e.txt schrijven. Omzetten en vervangen van
428     a.txt. Omzetten en vervangen van b.txt. Omzetten van d.txt en naar f.txt
429     schrijven.
430
431         dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt
432
433 RECURSIEVE CONVERSIE
434     Gebruik dos2unix in combinatie met de opdrachten find(1) en xargs(1) om
435     tekstbestanden in een mappenboom recursief om te zetten. Bijvoorbeeld om
436     alle .txt-bestanden in de mappenboom onder de huidige map te
437     converteren, typt u:
438
439         find . -name *.txt |xargs dos2unix
440
441 LOKALISATIE
442     LANG
443         The primaire taal wordt geselecteerd via de omgevingsvariabele LANG.
444         De variabele LANG bestaat uit verschillende onderdelen. Het eerste
445         deel is in kleine letters de taalcode. Het tweede deel is optioneel
446         en is de landcode in hoofdletters, voorafgegaan door een liggend
447         streepje. Er is ook een optioneel derde deel: de tekencodering,
448         voorafgegaan door een punt. Enkele voorbeelden voor een POSIX-shell:
449
450             export LANG=nl               Nederlands
451             export LANG=nl_NL            Nederlands, Nederland
452             export LANG=nl_BE            Nederlands, België
453             export LANG=es_ES            Spaans, Spanje
454             export LANG=es_MX            Spaans, Mexico
455             export LANG=en_US.iso88591   Engels, VS, Latin-1-codering
456             export LANG=en_GB.UTF-8      Engels, GB, UTF-8-codering
457
458         Voor een complete lijst van taal- en landcodes zie de
459         gettext-handleiding:
460         <http://www.gnu.org/software/gettext/manual/gettext.html#Language-Co
461         des>
462
463         Op Unix-systemen kunt u de opdracht locale(1) gebruiken om
464         specifieke taalregio-informatie te verkrijgen.
465
466     LANGUAGE
467         Met de omgevingsvariabele LANGUAGE kunt u een prioriteitenlijst
468         specificeren van talen, gescheiden door dubbele punten. Dos2unix
469         geeft voorrang aan LANGUAGE boven LANG. Bijvoorbeeld, eerst
470         Nederlands en dan Duits: "LANGUAGE=nl:de". U moet eerst lokalisatie
471         in werking stellen, door het instellen van LANG (of LC_ALL) op een
472         waarde ongelijk aan "C", voordat u een talen-prioriteitenlijst kunt
473         gebruiken via de variabele LANGUAGE. Zie ook de gettext-handleiding:
474         <http://www.gnu.org/software/gettext/manual/gettext.html#The-LANGUAG
475         E-variable>
476
477         Als u een taal kiest die niet beschikbaar is, worden de standaard
478         Engelse berichten gebruikt.
479
480     DOS2UNIX_LOCALEDIR
481         Met de omgevingsvariabele DOS2UNIX_LOCALEDIR kan de LOCALEDIR die
482         ingesteld werd tijdens compilatie worden overstemd. LOCALEDIR wordt
483         gebruikt om de taalbestanden te vinden. De GNU standaardwaarde is
484         "/usr/local/share/locale". De optie --version laat de gebruikte
485         LOCALEDIR zien.
486
487         Voorbeeld (POSIX-shell):
488
489             export DOS2UNIX_LOCALEDIR=$HOME/share/locale
490
491 AFSLUITWAARDE
492     Bij succes wordt nul teruggegeven. Wanneer een systeemfout optreedt
493     wordt het laatste systeemfoutnummer teruggegeven. Bij andere fouten
494     wordt 1 teruggegeven.
495
496     De afsluitwaarde is altijd nul in de stillewerkingsmodus, behalve
497     wanneer verkeerde opties worden gegeven.
498
499 STANDAARDEN
500     <http://nl.wikipedia.org/wiki/Tekstbestand>
501
502     <http://nl.wikipedia.org/wiki/Carriage_Return>
503
504     <http://nl.wikipedia.org/wiki/Linefeed>
505
506     <http://nl.wikipedia.org/wiki/Unicode>
507
508 AUTEURS
509     Benjamin Lin - <blin@socs.uts.edu.au> Bernd Johannes Wuebben
510     (mac2unix-modus) - <wuebben@kde.org>, Christian Wurll (toevoegen van
511     extra regeleindes) - <wurll@ira.uka.de>, Erwin Waterlander -
512     <waterlan@xs4all.nl> (beheerder)
513
514     Projectpagina: <http://waterlan.home.xs4all.nl/dos2unix.html>
515
516     SourceForge-pagina: <http://sourceforge.net/projects/dos2unix/>
517
518 ZIE OOK
519     file(1) find(1) iconv(1) locale(1) xargs(1)
520