Imported Upstream version 7.1
[platform/upstream/dos2unix.git] / man / pt_BR / man1 / dos2unix.1
1 .\" Automatically generated by Pod::Man 2.27 (Pod::Simple 3.28)
2 .\"
3 .\" Standard preamble:
4 .\" ========================================================================
5 .de Sp \" Vertical space (when we can't use .PP)
6 .if t .sp .5v
7 .if n .sp
8 ..
9 .de Vb \" Begin verbatim text
10 .ft CW
11 .nf
12 .ne \\$1
13 ..
14 .de Ve \" End verbatim text
15 .ft R
16 .fi
17 ..
18 .\" Set up some character translations and predefined strings.  \*(-- will
19 .\" give an unbreakable dash, \*(PI will give pi, \*(L" will give a left
20 .\" double quote, and \*(R" will give a right double quote.  \*(C+ will
21 .\" give a nicer C++.  Capital omega is used to do unbreakable dashes and
22 .\" therefore won't be available.  \*(C` and \*(C' expand to `' in nroff,
23 .\" nothing in troff, for use with C<>.
24 .tr \(*W-
25 .ds C+ C\v'-.1v'\h'-1p'\s-2+\h'-1p'+\s0\v'.1v'\h'-1p'
26 .ie n \{\
27 .    ds -- \(*W-
28 .    ds PI pi
29 .    if (\n(.H=4u)&(1m=24u) .ds -- \(*W\h'-12u'\(*W\h'-12u'-\" diablo 10 pitch
30 .    if (\n(.H=4u)&(1m=20u) .ds -- \(*W\h'-12u'\(*W\h'-8u'-\"  diablo 12 pitch
31 .    ds L" ""
32 .    ds R" ""
33 .    ds C` ""
34 .    ds C' ""
35 'br\}
36 .el\{\
37 .    ds -- \|\(em\|
38 .    ds PI \(*p
39 .    ds L" ``
40 .    ds R" ''
41 .    ds C`
42 .    ds C'
43 'br\}
44 .\"
45 .\" Escape single quotes in literal strings from groff's Unicode transform.
46 .ie \n(.g .ds Aq \(aq
47 .el       .ds Aq '
48 .\"
49 .\" If the F register is turned on, we'll generate index entries on stderr for
50 .\" titles (.TH), headers (.SH), subsections (.SS), items (.Ip), and index
51 .\" entries marked with X<> in POD.  Of course, you'll have to process the
52 .\" output yourself in some meaningful fashion.
53 .\"
54 .\" Avoid warning from groff about undefined register 'F'.
55 .de IX
56 ..
57 .nr rF 0
58 .if \n(.g .if rF .nr rF 1
59 .if (\n(rF:(\n(.g==0)) \{
60 .    if \nF \{
61 .        de IX
62 .        tm Index:\\$1\t\\n%\t"\\$2"
63 ..
64 .        if !\nF==2 \{
65 .            nr % 0
66 .            nr F 2
67 .        \}
68 .    \}
69 .\}
70 .rr rF
71 .\" ========================================================================
72 .\"
73 .IX Title "dos2unix 1"
74 .TH dos2unix 1 "2014-10-06" "dos2unix" "2014-10-06"
75 .\" For nroff, turn off justification.  Always turn off hyphenation; it makes
76 .\" way too many mistakes in technical documents.
77 .if n .ad l
78 .nh
79 .SH "NOME"
80 .IX Header "NOME"
81 dos2unix \- Conversor de formato de arquivo texto de DOS/Mac para Unix e
82 vice-versa
83 .SH "SINOPSE"
84 .IX Header "SINOPSE"
85 .Vb 2
86 \&    dos2unix [opções] [ARQUIVO ...] [\-n ARQENT ARQSAÍDA ...]
87 \&    unix2dos [opções] [ARQUIVO ...] [\-n ARQENT ARQSAÍDA ...]
88 .Ve
89 .SH "DESCRIÇÃO"
90 .IX Header "DESCRIÇÃO"
91 O pacote Dos2unix inclui utilitários de \f(CW\*(C`dos2unix\*(C'\fR e \f(CW\*(C`unix2dos\*(C'\fR para
92 converter arquivos texto nos formatos \s-1DOS\s0 ou Mac para formato Unix e
93 vice-versa.
94 .PP
95 Em arquivos texto DOS/Windows uma quebra de linha, também conhecida como
96 nova linha, é uma combinação de dois caracteres: um Carriage Return (\s-1CR\s0)
97 seguido por um Line Feed (\s-1LF\s0). Em arquivos texto do Unix uma quebra de linha
98 é um único caractere: o Line Feed (\s-1LF\s0). Em arquivos texto do Mac, anteriores
99 ao Mac \s-1OS X,\s0 uma quebra de linha era um único caractere Carriage Return
100 (\s-1CR\s0). Hoje em dia, Mac \s-1OS\s0 usa quebras de linha no estilo do Unix (\s-1LF\s0).
101 .PP
102 Além das quebras de linhas, Dos2unix também pode converter as codificações
103 de arquivos. Algumas poucas páginas podem ser convertidos para Latin\-1 para
104 Unix. E arquivos Unicode do Windows (\s-1UTF\-16\s0) podem ser convertidos para
105 arquivos Unicode do Unix (\s-1UTF\-8\s0).
106 .PP
107 Arquivos binários são ignorados automaticamente, a menos que a conversão
108 seja forçada.
109 .PP
110 Arquivos não regulares, tais como diretórios e FIFOs, são ignorados
111 automaticamente.
112 .PP
113 Ligações simbólicas e seus alvos são por padrão mantidas
114 intocáveis. Ligações simbólicas podem opcionalmente ser substituídas, ou a
115 saída pode ser escrita para o alvo das ligações simbólicas. Não há suporte
116 às ligações simbólicas do Windows.
117 .PP
118 Dos2unix foi modelado seguindo dos2unix do SunOS/Solaris. Há uma diferença
119 importante em relação à versão original do SunOS/Solaris. Essa versão faz
120 conversão no-lugar (modo arquivo antigo) por padrão, enquanto a versão
121 original do SunOS/Solaris fornecia suporte apenas a conversão pareada (modo
122 de novo arquivo). Veja também as opções \f(CW\*(C`\-o\*(C'\fR e \f(CW\*(C`\-n\*(C'\fR.
123 .SH "OPÇÕES"
124 .IX Header "OPÇÕES"
125 .IP "\fB\-\-\fR" 4
126 .IX Item "--"
127 Trata as opções seguintes como nomes de arquivos. Use essa opção se você
128 quiser converter arquivos cujos nomes iniciam com um traço. Por exemplo,
129 para converter um arquivo chamado \*(L"foo\*(R", você pode usar este comando:
130 .Sp
131 .Vb 1
132 \&    dos2unix \-\- \-foo
133 .Ve
134 .Sp
135 Ou em modo de novo arquivo:
136 .Sp
137 .Vb 1
138 \&    dos2unix \-n \-\- \-foo saída.txt
139 .Ve
140 .IP "\fB\-ascii\fR" 4
141 .IX Item "-ascii"
142 Converte apenas as quebras de linhas. Esse é o modo de conversão padrão.
143 .IP "\fB\-iso\fR" 4
144 .IX Item "-iso"
145 Conversão entre conjunto de caractere do \s-1DOS\s0 e \s-1ISO\-8859\-1.\s0 Veja também a
146 seção \s-1MODOS DE\s0 CONVERSÃO.
147 .IP "\fB\-1252\fR" 4
148 .IX Item "-1252"
149 Usa a página de código 1252 do Windows (Europa ocidental).
150 .IP "\fB\-437\fR" 4
151 .IX Item "-437"
152 Usa a página de código 437 do \s-1DOS \s0(\s-1EUA\s0). Essa é a página de código padrão
153 usada para conversão \s-1ISO.\s0
154 .IP "\fB\-850\fR" 4
155 .IX Item "-850"
156 Usa a página de código 850 do \s-1DOS \s0(Europa ocidental).
157 .IP "\fB\-860\fR" 4
158 .IX Item "-860"
159 Usa a página de código 860 do \s-1DOS \s0(Português).
160 .IP "\fB\-863\fR" 4
161 .IX Item "-863"
162 Usa a página de código 863 do \s-1DOS \s0(Francês do Canadá).
163 .IP "\fB\-865\fR" 4
164 .IX Item "-865"
165 Usa a página de código 865 do \s-1DOS \s0(Nórdico).
166 .IP "\fB\-7\fR" 4
167 .IX Item "-7"
168 Converte caracteres de 8 bit para espaço de 7 bit.
169 .IP "\fB\-b, \-\-keep\-bom\fR" 4
170 .IX Item "-b, --keep-bom"
171 Mantém marca de ordem de bytes (\s-1BOM\s0). Quando o arquivo de entrada possuir um
172 \&\s-1BOM,\s0 escreve um \s-1BOM\s0 no arquivo de saída. Esse é o comportamento padrão ao
173 converter para quebras de linha do \s-1DOS.\s0 Veja também a opção \f(CW\*(C`\-r\*(C'\fR.
174 .IP "\fB\-c, \-\-convmode \s-1MODOCONV\s0\fR" 4
175 .IX Item "-c, --convmode MODOCONV"
176 Define o modo de conversão, sendo \s-1MODOCONV\s0 um dentre: \fIascii\fR, \fI7bit\fR,
177 \&\fIiso\fR, \fImac\fR com ascii sendo o padrão.
178 .IP "\fB\-f, \-\-force\fR" 4
179 .IX Item "-f, --force"
180 Força a conversão de arquivos binários.
181 .IP "\fB\-h, \-\-help\fR" 4
182 .IX Item "-h, --help"
183 Exibe ajuda e sai.
184 .IP "\fB\-i[OPÇÕES], \-\-info[=OPÇÕES] \s-1ARQUIVO ...\s0\fR" 4
185 .IX Item "-i[OPÇÕES], --info[=OPÇÕES] ARQUIVO ..."
186 Exibe informação do arquivo. Nenhuma conversão é feita.
187 .Sp
188 A seguinte informação é exibida, nesta ordem: número de quebras de linha do
189 \&\s-1DOS,\s0 número de quebras de linha do Unix, número de quebras de linha do Mac,
190 marca de ordem de byte, \*(L"text\*(R" ou \*(L"binário\*(R", nome de arquivo.
191 .Sp
192 Saída de exemplo:
193 .Sp
194 .Vb 8
195 \&     6       0       0  no_bom    text    dos.txt
196 \&     0       6       0  no_bom    text    unix.txt
197 \&     0       0       6  no_bom    text    mac.txt
198 \&     6       6       6  no_bom    text    mixed.txt
199 \&    50       0       0  UTF\-16LE  text    utf16le.txt
200 \&     0      50       0  no_bom    text    utf8unix.txt
201 \&    50       0       0  UTF\-8     text    utf8dos.txt
202 \&     2     418     219  no_bom    binary  dos2unix.exe
203 .Ve
204 .Sp
205 Opcionalmente, opções extra podem ser definidas para alterar a saída. Uma ou
206 mais opções podem ser adicionadas.
207 .RS 4
208 .IP "\fBd\fR" 4
209 .IX Item "d"
210 Exibe o número de quebras de linhas do \s-1DOS.\s0
211 .IP "\fBu\fR" 4
212 .IX Item "u"
213 Exibe o número de quebras de linhas do Unix.
214 .IP "\fBm\fR" 4
215 .IX Item "m"
216 Exibe o número de quebras de linhas do Mac.
217 .IP "\fBb\fR" 4
218 .IX Item "b"
219 Exibe a marca de ordem de byte.
220 .IP "\fBt\fR" 4
221 .IX Item "t"
222 Exibe se arquivo é texto ou binário.
223 .IP "\fBc\fR" 4
224 .IX Item "c"
225 Exib apenas os arquivos que seriam convertidos.
226 .Sp
227 Com a opção \f(CW\*(C`c\*(C'\fR, dos2unix vai exibir apenas os arquivos que contêm quebras
228 de linha do \s-1DOS,\s0 unix2dos vai exibir apenas os nomes de arquivos que contêm
229 quebras de linha do Unix.
230 .RE
231 .RS 4
232 .Sp
233 Exemplos:
234 .Sp
235 Mostra informação sobre todos os arquivos *.txt:
236 .Sp
237 .Vb 1
238 \&    dos2unix \-i *.txt
239 .Ve
240 .Sp
241 Mostra apenas o número de quebras de linha \s-1DOS\s0 e Unix:
242 .Sp
243 .Vb 1
244 \&    dos2unix \-idu *.txt
245 .Ve
246 .Sp
247 Mostra apenas a marca de ordem de byte:
248 .Sp
249 .Vb 1
250 \&    dos2unix \-\-info=b *.txt
251 .Ve
252 .Sp
253 Lista os arquivos que possuem quebras de linha do \s-1DOS.\s0
254 .Sp
255 .Vb 1
256 \&    dos2unix \-ic *.txt
257 .Ve
258 .Sp
259 Lista os arquivos que possuem quebras de linha do Unix.
260 .Sp
261 .Vb 1
262 \&    unix2dos \-ic *.txt
263 .Ve
264 .RE
265 .IP "\fB\-k, \-\-keepdate\fR" 4
266 .IX Item "-k, --keepdate"
267 Mantém a marca da data do arquivo de saída igual ao do arquivo de entrada.
268 .IP "\fB\-L, \-\-license\fR" 4
269 .IX Item "-L, --license"
270 Exibe a licença do programa.
271 .IP "\fB\-l, \-\-newline\fR" 4
272 .IX Item "-l, --newline"
273 Adiciona nova linha adicional.
274 .Sp
275 \&\fBdos2unix\fR: Apenas quebras de linha do \s-1DOS\s0 são alteradas para duas quebras
276 de linha do Unix. No modo Mac, apenas quebras de linha do Mac são alterados
277 para duas quebras de linha do Unix.
278 .Sp
279 \&\fBunix2dos\fR: Apenas quebras de linha do Unix são alteradas para duas quebras
280 de linha do \s-1DOS.\s0 No modo Mac, quebras de linha do Unix são alteradas para
281 duas quebras de linha do Mac.
282 .IP "\fB\-m, \-\-add\-bom\fR" 4
283 .IX Item "-m, --add-bom"
284 Escreve uma marca de ordem de byte (\s-1BOM\s0) no arquivo de saída. Por padrão, um
285 \&\s-1BOM UTF\-8\s0 é escrito.
286 .Sp
287 Quando o arquivo de entrada é \s-1UTF\-16,\s0 e a opção \f(CW\*(C`\-u\*(C'\fR é usada, um \s-1BOM UTF\-16\s0
288 será escrito.
289 .Sp
290 Nunca use essa opção quando a codificação de saída é outra além de \s-1UTF\-8\s0 ou
291 \&\s-1UTF\-16.\s0 Veja também a seção \s-1UNICODE.\s0
292 .IP "\fB\-n, \-\-newfile \s-1ARQENT\s0 ARQSAÍDA ...\fR" 4
293 .IX Item "-n, --newfile ARQENT ARQSAÍDA ..."
294 Modo de novo arquivo. Converte o arquivo \s-1ARQENT\s0 e escreve a saída para o
295 arquivo ARQSAÍDA. Os nomes de arquivos devem ser fornecidos em pares e nome
296 coringa \fInão\fR deveriam ser usados ou você \fIvai\fR perder seus arquivos.
297 .Sp
298 A pessoa que começa a conversão em modo novo arquivo (pareado) será o dono
299 do arquivo convertido. As permissões de leitura/escrita do novo arquivo
300 serão as permissões do arquivo original menos a \fIumask\fR\|(1) da pessoa que
301 executa a conversão.
302 .IP "\fB\-o, \-\-oldfile \s-1ARQUIVO ...\s0\fR" 4
303 .IX Item "-o, --oldfile ARQUIVO ..."
304 Modo arquivo antigo. Converte o arquivo \s-1ARQUIVO\s0 e o sobrescreve com a
305 saída. O programa, por padrão, executa neste modo. Nomes coringas podem ser
306 usados.
307 .Sp
308 No modo de arquivo antigo (no-lugar) o arquivo convertido recebe no mesmo
309 dono, grupo e permissões de leitura/escrita que o arquivo original. Também,
310 quando o arquivo é convertido por outro usuário que tenha permissões de
311 escrita no arquivo (ex.: usuário root). A conversão será abortada quando não
312 for possível preservar os valores originais. Alteração do dono pode
313 significar que o dono original não é mais capaz de ler o arquivo. Alteração
314 do grupo pode ser um risco para a segurança, pois o arquivo pode ficar
315 legível para pessoas cujo acesso não é desejado. Preservação do dono, grupo
316 e permissões de leitura/escrita tem suporte apenas no Unix.
317 .IP "\fB\-q, \-\-quiet\fR" 4
318 .IX Item "-q, --quiet"
319 Modo quieto. Suprime todos os avios e mensagens. O valor retornado é
320 zero. Exceto quando opções de linha de comando erradas forem usadas.
321 .IP "\fB\-r, \-\-remove\-bom\fR" 4
322 .IX Item "-r, --remove-bom"
323 remove marca de ordem de bytes (\s-1BOM\s0). Não escreve um \s-1BOM\s0 no arquivo de
324 saída. Esse é o comportamento padrão ao converter para quebras de linha
325 Unix. Veja também a opção \f(CW\*(C`\-b\*(C'\fR.
326 .IP "\fB\-s, \-\-safe\fR" 4
327 .IX Item "-s, --safe"
328 Ignora arquivo binários (padrão).
329 .IP "\fB\-u, \-\-keep\-utf16\fR" 4
330 .IX Item "-u, --keep-utf16"
331 Mantém a codificação \s-1UTF\-16\s0 original do arquivo de entrada. O arquivo de
332 saída será escrito na mesma codificação \s-1UTF\-16,\s0 em little ou big endian,
333 como o arquivo de entrada. Isso evita transformação para \s-1UTF\-8.\s0 Como
334 consequência, um \s-1BOM UTF\-16\s0 será escrito. Essa opção pode ser desabilitada
335 com a opção \f(CW\*(C`\-ascii\*(C'\fR.
336 .IP "\fB\-ul, \-\-assume\-utf16le\fR" 4
337 .IX Item "-ul, --assume-utf16le"
338 Presume que o formato de arquivo de entrada é \s-1UTF\-16LE.\s0
339 .Sp
340 Quando há uma marca de ordem de byte no arquivo de entrada, esta tem
341 prioridade sobre essa opção.
342 .Sp
343 Quando você fizer uma presunção equivocada (o arquivo de entrada não estava
344 no formato \s-1UTF\-16LE\s0) e a conversão funcionar, você terá um arquivo de saída
345 \&\s-1UTF\-8\s0 com texto errado. Você pode desfazer a conversão errada com \fIiconv\fR\|(1)
346 pela conversão do arquivo de saída \s-1UTF\-8\s0 de volta para \s-1UTF\-16LE.\s0 Isso vai
347 trazer de volta o arquivo para o original.
348 .Sp
349 A presunção de \s-1UTF\-16LE\s0 funciona como um \fImodo de conversão\fR. Ao alternara
350 o modo \fIascii\fR padrão, a presunção de \s-1UTF\-16LE\s0 é desativada.
351 .IP "\fB\-ub, \-\-assume\-utf16be\fR" 4
352 .IX Item "-ub, --assume-utf16be"
353 Presume que o formato de arquivo de entrada é \s-1UTF\-16BE.\s0
354 .Sp
355 Essa opção funciona o mesmo que a opção \f(CW\*(C`\-ul\*(C'\fR.
356 .IP "\fB\-v, \-\-verbose\fR" 4
357 .IX Item "-v, --verbose"
358 Exibe mensagens detalhadas. Informação extra é exibida sobre marcas de ordem
359 de byte e a quantidade de quebras de linha convertidas.
360 .IP "\fB\-F, \-\-follow\-symlink\fR" 4
361 .IX Item "-F, --follow-symlink"
362 Segue ligações simbólicas e converte os alvos.
363 .IP "\fB\-R, \-\-replace\-symlink\fR" 4
364 .IX Item "-R, --replace-symlink"
365 Substitui ligações simbólicas com arquivos convertidos (arquivos alvo
366 originais permanecem inalterados).
367 .IP "\fB\-S, \-\-skip\-symlink\fR" 4
368 .IX Item "-S, --skip-symlink"
369 Mentém ligações simbólicas e alvos inalterados (padrão).
370 .IP "\fB\-V, \-\-version\fR" 4
371 .IX Item "-V, --version"
372 Exibe informação da versão e sai.
373 .SH "MODO MAC"
374 .IX Header "MODO MAC"
375 No modo normal, as quebras de linhas são convertidas de \s-1DOS\s0 para Unix e
376 vice-versa. Quebras de linha do Mac não são convertidas.
377 .PP
378 No modo Mac, quebras de linha são convertidas de Mac para Unix e
379 vice-versa. Quebras de linha do \s-1DOS\s0 não são alteradas.
380 .PP
381 Para executar no modo Mac, use a opção de linha de comando \f(CW\*(C`\-c mac\*(C'\fR ou use
382 os comandos \f(CW\*(C`mac2unix\*(C'\fR ou \f(CW\*(C`unix2mac\*(C'\fR.
383 .SH "MODOS DE CONVERSÃO"
384 .IX Header "MODOS DE CONVERSÃO"
385 .IP "\fBascii\fR" 4
386 .IX Item "ascii"
387 No modo \f(CW\*(C`ascii\*(C'\fR, apenas as quebras de linha são convertidas. Esse é o modo
388 de conversão padrão.
389 .Sp
390 Apesar do nome deste modo ser \s-1ASCII,\s0 o qual é um padrão de 7 bit, o modo é
391 em verdade 8 bit. Sempre use este modo quando quiser converter arquivos
392 Unicode \s-1UTF\-8.\s0
393 .IP "\fB7bit\fR" 4
394 .IX Item "7bit"
395 Neste modo todos os caracteres não\-ASCII de 8 bit (com valores entre 128 e
396 255) são convertidos para um espaço de 7 bit.
397 .IP "\fBiso\fR" 4
398 .IX Item "iso"
399 Caracteres são convertidos entre um conjunto de caracteres do \s-1DOS \s0(página de
400 código) e conjunto de caracteres \s-1ISO\-8859\-1 \s0(Latin\-1) no Unix. Caracteres de
401 \&\s-1DOS\s0 sem um equivalente \s-1ISO\-8859\-1,\s0 para os quais a conversão não é possível,
402 são convertidos para um ponto. O mesmo vale para caracteres \s-1ISO\-8859\-1\s0 sem a
403 contraparte \s-1DOS.\s0
404 .Sp
405 Quando apenas a opção \f(CW\*(C`\-iso\*(C'\fR for usada, dos2unix vai tentar determinar a
406 página de código ativa. Quando isso não for possível, dos2unix vai usar a
407 página de código padrão \s-1CP437,\s0 a qual é usada principalmente nos \s-1EUA.\s0 Para
408 forçar uma página de código específica, use as opções \f(CW\*(C`\-437\*(C'\fR (\s-1EUA\s0), \f(CW\*(C`\-850\*(C'\fR
409 (Europeu oriental), \f(CW\*(C`\-860\*(C'\fR (Português), \f(CW\*(C`\-863\*(C'\fR (Franco-canadense) ou
410 \&\f(CW\*(C`\-865\*(C'\fR (Nórdico). Também há suporte à página de código do Windows \s-1CP1252
411 \&\s0(Europeu ocidental) com a opção \f(CW\*(C`\-1252\*(C'\fR. Para outras páginas de código, use
412 dos2unix em combinação cm \fIiconv\fR\|(1). Iconv pode converter entre uma lista
413 grande de codificações de caracteres.
414 .Sp
415 Nunca use conversão \s-1ISO\s0 em arquivos textos Unicode. Isso vai corromper os
416 arquivos codificados em \s-1UTF\-8.\s0
417 .Sp
418 Alguns exemplos:
419 .Sp
420 Conversão da página de código padrão do \s-1DOS\s0 para Latin\-1 do Unix
421 .Sp
422 .Vb 1
423 \&    dos2unix \-iso \-n entrada.txt saída.txt
424 .Ve
425 .Sp
426 Conversão da \s-1CP850\s0 do \s-1DOS\s0 para Latin\-1 do Unix
427 .Sp
428 .Vb 1
429 \&    dos2unix \-850 \-n entrada.txt saída.txt
430 .Ve
431 .Sp
432 Conversão da \s-1CP1252\s0 do Windows para Latin\-1 do Unix
433 .Sp
434 .Vb 1
435 \&    dos2unix \-1252 \-n entrada.txt saída.txt
436 .Ve
437 .Sp
438 Conversão da \s-1CP1252\s0 do Windows para \s-1UTF\-8 \s0(Unicode) do Unix
439 .Sp
440 .Vb 1
441 \&    iconv \-f CP1252 \-t UTF\-8 entrada.txt | dos2unix > saída.txt
442 .Ve
443 .Sp
444 Conversão de Latin\-1 do Unix para página de código padrão do \s-1DOS\s0
445 .Sp
446 .Vb 1
447 \&    unix2dos \-iso \-n entrada.txt saída.txt
448 .Ve
449 .Sp
450 Conversão do Latin\-1 do Unix para \s-1CP850\s0 do \s-1DOS\s0
451 .Sp
452 .Vb 1
453 \&    unix2dos \-850 \-n entrada.txt saída.txt
454 .Ve
455 .Sp
456 Conversão do Latin\-1 do unix para \s-1CP1252\s0 do Windows
457 .Sp
458 .Vb 1
459 \&    unix2dos \-1252 \-n entrada.txt saída.txt
460 .Ve
461 .Sp
462 Conversão do \s-1UTF\-8 \s0(Unicode) do Unix para \s-1CP1252\s0 do Windows
463 .Sp
464 .Vb 1
465 \&    unix2dos < entrada.txt | iconv \-f UTF\-8 \-t CP1252 > saída.txt
466 .Ve
467 .Sp
468 Veja também <http://czyborra.com/charsets/codepages.html> e
469 <http://czyborra.com/charsets/iso8859.html>.
470 .SH "UNICODE"
471 .IX Header "UNICODE"
472 .SS "Codificações"
473 .IX Subsection "Codificações"
474 Exitem codificações Unicode diferentes. No Unix e no Linux, arquivos Unicode
475 são geralmente codificados em \s-1UTF\-8.\s0 No Windows, arquivos texto Unicode
476 podem ser codificados em \s-1UTF\-8, UTF\-16\s0 ou \s-1UTF\-16\s0 big endian, mas na maioria
477 das vezes são codificados no formato \s-1UTF\-16.\s0
478 .SS "Conversão"
479 .IX Subsection "Conversão"
480 Arquivos texto em Unicode pode ter quebras de linha \s-1DOS,\s0 Unix ou Mac, como
481 arquivos texto comuns.
482 .PP
483 Todas as versões do dos2unix e unix2dos podem converter arquivos codificados
484 em \s-1UTF\-8\s0 porque \s-1UTF\-8\s0 foi projetado para ter compatibilidade reversa com
485 \&\s-1ASCII.\s0
486 .PP
487 Dos2unix e unix2dos com suporte a Unicode \s-1UTF\-16\s0 podem ler arquivos texto
488 codificados em little e big endian \s-1UTF\-16.\s0 Para ver se dos2unix foi
489 compilado com suporte a \s-1UTF\-16,\s0 digite \f(CW\*(C`dos2unix \-V\*(C'\fR.
490 .PP
491 Arquivos codificados em \s-1UTF\-16\s0 são, por padrão, convertidos para \s-1UTF\-8.\s0 No
492 Unix/Linux, é necessário que a codificação de caracteres da localização
493 esteja definida para \s-1UTF\-8.\s0 Use o comando \fIlocale\fR\|(1) para descobrir qual é a
494 codificação de caracteres da localização. Arquivos textos formatados em
495 \&\s-1UTF\-8\s0 possuem suporte em tanto Windows quanto Unix/Linux.
496 .PP
497 Codificações \s-1UTF\-16\s0 e \s-1UTF\-8\s0 são completamente compatíveis, não havendo
498 qualquer perda de texto na conversão. Quando um erro de conversão \s-1UTF\-16\s0
499 para \s-1UTF\-8\s0 ocorre, por exemplo quando o arquivo de entrada \s-1UTF\-16 \s0 contém um
500 erro, o arquivo será ignorado.
501 .PP
502 Quando a opção \f(CW\*(C`\-u\*(C'\fR é usada, o arquivo de saída será escrito na mesma
503 codificação \s-1UTF\-16\s0 que o arquivo de saída. A opção \f(CW\*(C`\-u\*(C'\fR evita conversão
504 para \s-1UTF\-8.\s0
505 .PP
506 Dos2unix e unix2dos não possuem opção para converter arquivos \s-1UTF\-8\s0 ára
507 \&\s-1UTF\-16.\s0
508 .PP
509 Modo de conversão \s-1ISO\s0 e 7\-bit não funciona em arquivos \s-1UTF\-16.\s0
510 .SS "Marca de ordem de byte"
511 .IX Subsection "Marca de ordem de byte"
512 No Windows, arquivos Unicode normalmente têm uma Marca de Ordem de Byte
513 (\s-1BOM\s0), porque muitos programas (incluindo o Bloco de Notas) adiciona BOMs
514 por padrão. Veja também <http://en.wikipedia.org/wiki/Byte_order_mark>.
515 .PP
516 No Unix, arquivos Unicode normalmente não têm \s-1BOM.\s0 Presume-se que arquivos
517 texto são codificados na codificação de caracteres da localização.
518 .PP
519 Dos2unix pode detectar apenas se um arquivo está no formato \s-1UTF\-16\s0 se o
520 arquivo tiver \s-1BOM.\s0 Quando um arquivo \s-1UTF\-16\s0 não tiver \s-1BOM,\s0 dos2unix vai ver
521 se o arquivo é um arquivo binário.
522 .PP
523 Use a opção \f(CW\*(C`\-ul\*(C'\fR ou \f(CW\*(C`\-ub\*(C'\fR para converter um arquivo \s-1UTF\-16\s0 sem \s-1BOM.\s0
524 .PP
525 Dos2unix escreve por padrão nenhum \s-1BOM\s0 no arquivo de saída. Com a opção
526 \&\f(CW\*(C`\-b\*(C'\fR, o Dos2unix escreve um \s-1BOM\s0 quando o arquivo de entrada possuir \s-1BOM.\s0
527 .PP
528 Unix2dos escreve por padrão um \s-1BOM\s0 no arquivo de saída quando o arquivo de
529 entrada tem \s-1BOM.\s0 Use a opção \f(CW\*(C`\-m\*(C'\fR para remover \s-1BOM.\s0
530 .PP
531 Dos2unix e unix2dos sempre escrevem \s-1BOM\s0 quando a opção \f(CW\*(C`\-m\*(C'\fR é usada.
532 .SS "Exemplos de Unicode"
533 .IX Subsection "Exemplos de Unicode"
534 Conversão de \s-1UTF\-16\s0 do Windows (com \s-1BOM\s0) para \s-1UTF\-8\s0 do Unix
535 .PP
536 .Vb 1
537 \&    dos2unix \-n entrada.txt saída.txt
538 .Ve
539 .PP
540 Conversão de \s-1UTF\-16LE\s0 do Windows (sem \s-1BOM\s0) para \s-1UTF\-8\s0 do Unix
541 .PP
542 .Vb 1
543 \&    dos2unix \-ul \-n entrada.txt saída.txt
544 .Ve
545 .PP
546 Conversão de \s-1UTF\-8\s0 Unix para \s-1UTF\-8\s0 do Windows com \s-1BOM\s0
547 .PP
548 .Vb 1
549 \&    unix2dos \-m \-n entrada.txt saída.txt
550 .Ve
551 .PP
552 Conversão de \s-1UTF\-8\s0 do Unix para \s-1UTF\-16\s0 do Windows
553 .PP
554 .Vb 1
555 \&    unix2dos < entrada.txt | iconv \-f UTF\-8 \-t UTF\-16 > saída.txt
556 .Ve
557 .SH "EXEMPLOS"
558 .IX Header "EXEMPLOS"
559 Lê a entrada da \*(L"stdin\*(R" e escreve a saída para \*(L"stdout\*(R".
560 .PP
561 .Vb 2
562 \&    dos2unix
563 \&    dos2unix \-l \-c mac
564 .Ve
565 .PP
566 Converte e substitui a.txt. Converte e substitui b.txt.
567 .PP
568 .Vb 2
569 \&    dos2unix a.txt b.txt
570 \&    dos2unix \-o a.txt b.txt
571 .Ve
572 .PP
573 Converte e substitui a.txt no modo de conversão ascii.
574 .PP
575 .Vb 1
576 \&    dos2unix a.txt
577 .Ve
578 .PP
579 Converte e substitui a.txt no modo de conversão ascii. Converte e substitui
580 b.txt no modo de conversão 7bit.
581 .PP
582 .Vb 3
583 \&    dos2unix a.txt \-c 7bit b.txt
584 \&    dos2unix \-c ascii a.txt \-c 7bit b.txt
585 \&    dos2unix \-ascii a.txt \-7 b.txt
586 .Ve
587 .PP
588 Converte a.txt do formato do Mac para Unix.
589 .PP
590 .Vb 2
591 \&    dos2unix \-c mac a.txt
592 \&    mac2unix a.txt
593 .Ve
594 .PP
595 Converte a.txt do formato do Unix para Mac.
596 .PP
597 .Vb 2
598 \&    unix2dos \-c mac a.txt
599 \&    unix2mac a.txt
600 .Ve
601 .PP
602 Converte e substitui a.txt enquanto mantém a marca de data original.
603 .PP
604 .Vb 2
605 \&    dos2unix \-k a.txt
606 \&    dos2unix \-k \-o a.txt
607 .Ve
608 .PP
609 Converte a.txt e escreve para e.txt.
610 .PP
611 .Vb 1
612 \&    dos2unix \-n a.txt e.txt
613 .Ve
614 .PP
615 Converte a.txt e escreve para e.txt, mantém a marca de data de e.txt igual a
616 a.txt.
617 .PP
618 .Vb 1
619 \&    dos2unix \-k \-n a.txt e.txt
620 .Ve
621 .PP
622 Converte e substitui a.txt. Converte b.txt e escreve para e.txt.
623 .PP
624 .Vb 2
625 \&    dos2unix a.txt \-n b.txt e.txt
626 \&    dos2unix \-o a.txt \-n b.txt e.txt
627 .Ve
628 .PP
629 Converte c.txt e escreve para e.txt. Converte e substitui a.txt. Converte e
630 substitui b.txt. Converte d.txt e escreve para f.txt.
631 .PP
632 .Vb 1
633 \&    dos2unix \-n c.txt e.txt \-o a.txt b.txt \-n d.txt f.txt
634 .Ve
635 .SH "Conversão recursiva"
636 .IX Header "Conversão recursiva"
637 Use dos2unix em combinação com os comandos \fIfind\fR\|(1) e \fIxargs\fR\|(1) para converter
638 recursivamente arquivos texto em uma estrutura de árvore de diretórios. Por
639 exemplo, para converter todos os arquivos .txt na árvore de diretórios sob o
640 diretório atual, digite:
641 .PP
642 .Vb 1
643 \&    find . \-name *.txt |xargs dos2unix
644 .Ve
645 .SH "LOCALIZAÇÃO"
646 .IX Header "LOCALIZAÇÃO"
647 .IP "\fB\s-1LANG\s0\fR" 4
648 .IX Item "LANG"
649 O idioma primário é selecionado com a variável de ambiente \s-1LANG. A\s0 variável
650 \&\s-1LANG\s0 consiste em várias partes. A primeira parte está em letras pequenas no
651 código do idioma. A segunda parte é opcional e é o código do país em letras
652 maiúsculo, precedido de um ponto. Alguns exemplos para shells do tipo padrão
653 \&\s-1POSIX:\s0
654 .Sp
655 .Vb 7
656 \&    export LANG=nl               Holandês
657 \&    export LANG=nl_NL            Holandês, Holanda
658 \&    export LANG=nl_BE            Holandês, Bélgica
659 \&    export LANG=es_ES            Espanhol, Espanha
660 \&    export LANG=es_MX            Espanhol, México
661 \&    export LANG=en_US.iso88591   Inglês, EUA, codificação Latin\-1
662 \&    export LANG=en_GB.UTF\-8      Inglês, Reino Unido, codificação UTF\-8
663 .Ve
664 .Sp
665 Para a lista completa de códigos de idioma e país, veja o manual do gettext:
666 <http://www.gnu.org/software/gettext/manual/gettext.html#Language\-Codes>
667 .Sp
668 Nos sistemas Unix, você pode usar o comando \fIlocale\fR\|(1) para obter informação
669 específica da localização.
670 .IP "\fB\s-1LANGUAGE\s0\fR" 4
671 .IX Item "LANGUAGE"
672 Com a variável de ambiente \s-1LANGUAGE,\s0 você pode especificar uma lista de
673 prioridades de idiomas, separada por vírgulas. Dos2unix fornece preferência
674 a \s-1LANGUAGE\s0 sobre \s-1LANG.\s0 Por exemplo, primeiro holandês e, então, alemão:
675 \&\f(CW\*(C`LANGUAGE=nl:de\*(C'\fR. Você primeiro tem que habilitar localização, definindo
676 \&\s-1LANG \s0(ou \s-1LC_ALL\s0) para um valor diferente de \*(L"C\*(R", antes que você possa usar
677 uma lista de prioridade de idioma por meio da variável \s-1LANGUAGE.\s0 Veja também
678 o manual do gettext:
679 <http://www.gnu.org/software/gettext/manual/gettext.html#The\-LANGUAGE\-variable>
680 .Sp
681 Se você selecionou um idioma que não está disponível, você vai terá as
682 mensagens em inglês (padrão).
683 .IP "\fB\s-1DOS2UNIX_LOCALEDIR\s0\fR" 4
684 .IX Item "DOS2UNIX_LOCALEDIR"
685 Com a variável de ambiente \s-1DOS2UNIX_LOCALEDIR,\s0 o \s-1LOCALEDIR\s0 definido durante
686 a compilação pode ser sobrescrito. \s-1LOCALEDIR\s0 é usada para localizar os
687 arquivos de idioma. O valor padrão do \s-1GNU\s0 é \f(CW\*(C`/usr/local/share/locale\*(C'\fR. A
688 opção \fB\-\-version\fR vai exibir o \s-1LOCALEDIR\s0 que é usado.
689 .Sp
690 Exemplo (shell \s-1POSIX\s0):
691 .Sp
692 .Vb 1
693 \&    export DOS2UNIX_LOCALEDIR=$HOME/share/locale
694 .Ve
695 .SH "VALOR RETORNADO"
696 .IX Header "VALOR RETORNADO"
697 No sucesso, zero é retornado. Quando um erro de sistema ocorre, o último
698 erro de sistema será retornado. Para outros erros, 1 é retornado.
699 .PP
700 O valor retornado é sempre zero no modo quieto, exceto quando opções de
701 linha de comando erradas são usadas.
702 .SH "PADRÕES"
703 .IX Header "PADRÕES"
704 <http://en.wikipedia.org/wiki/Text_file>
705 .PP
706 <http://en.wikipedia.org/wiki/Carriage_return>
707 .PP
708 <http://en.wikipedia.org/wiki/Newline>
709 .PP
710 <http://en.wikipedia.org/wiki/Unicode>
711 .SH "AUTORES"
712 .IX Header "AUTORES"
713 Benjamin Lin \- <blin@socs.uts.edu.au> Bernd Johannes Wuebben (modo mac2unix)
714 \&\- <wuebben@kde.org>, Christian Wurll (adiciona nova linha extra) \-
715 <wurll@ira.uka.de>, Erwin Waterlander \- <waterlan@xs4all.nl> (Mantenedor)
716 .PP
717 Página do projeto: <http://waterlan.home.xs4all.nl/dos2unix.html>
718 .PP
719 Página do SourceForge: <http://sourceforge.net/projects/dos2unix/>
720 .SH "Veja também"
721 .IX Header "Veja também"
722 \&\fIfile\fR\|(1)  \fIfind\fR\|(1)  \fIiconv\fR\|(1)  \fIlocale\fR\|(1)  \fIxargs\fR\|(1)