6ea2bdca1d9958ef287425ffcc1a114f4b694557
[platform/upstream/dos2unix.git] / man / pt_BR / man1 / dos2unix.txt
1 NOME
2     dos2unix - Conversor de formato de arquivo texto de DOS/Mac para Unix e
3     vice-versa
4
5 SINOPSE
6         dos2unix [opções] [ARQUIVO ...] [-n ARQENT ARQSAÍDA ...]
7         unix2dos [opções] [ARQUIVO ...] [-n ARQENT ARQSAÍDA ...]
8
9 DESCRIÇÃO
10     O pacote Dos2unix inclui utilitários de "dos2unix" e "unix2dos" para
11     converter arquivos texto nos formatos DOS ou Mac para formato Unix e
12     vice-versa.
13
14     Em arquivos texto DOS/Windows uma quebra de linha, também conhecida como
15     nova linha, é uma combinação de dois caracteres: um Carriage Return (CR)
16     seguido por um Line Feed (LF). Em arquivos texto do Unix uma quebra de
17     linha é um único caractere: o Line Feed (LF). Em arquivos texto do Mac,
18     anteriores ao Mac OS X, uma quebra de linha era um único caractere
19     Carriage Return (CR). Hoje em dia, Mac OS usa quebras de linha no estilo
20     do Unix (LF).
21
22     Além das quebras de linhas, Dos2unix também pode converter as
23     codificações de arquivos. Algumas poucas páginas podem ser convertidos
24     para Latin-1 para Unix. E arquivos Unicode do Windows (UTF-16) podem ser
25     convertidos para arquivos Unicode do Unix (UTF-8).
26
27     Arquivos binários são ignorados automaticamente, a menos que a conversão
28     seja forçada.
29
30     Arquivos não regulares, tais como diretórios e FIFOs, são ignorados
31     automaticamente.
32
33     Ligações simbólicas e seus alvos são por padrão mantidas intocáveis.
34     Ligações simbólicas podem opcionalmente ser substituídas, ou a saída
35     pode ser escrita para o alvo das ligações simbólicas. Não há suporte às
36     ligações simbólicas do Windows.
37
38     Dos2unix foi modelado seguindo dos2unix do SunOS/Solaris. Há uma
39     diferença importante em relação à versão original do SunOS/Solaris. Essa
40     versão faz conversão no-lugar (modo arquivo antigo) por padrão, enquanto
41     a versão original do SunOS/Solaris fornecia suporte apenas a conversão
42     pareada (modo de novo arquivo). Veja também as opções "-o" e "-n".
43
44 OPÇÕES
45     --  Trata as opções seguintes como nomes de arquivos. Use essa opção se
46         você quiser converter arquivos cujos nomes iniciam com um traço. Por
47         exemplo, para converter um arquivo chamado "foo", você pode usar
48         este comando:
49
50             dos2unix -- -foo
51
52         Ou em modo de novo arquivo:
53
54             dos2unix -n -- -foo saída.txt
55
56     -ascii
57         Converte apenas as quebras de linhas. Esse é o modo de conversão
58         padrão.
59
60     -iso
61         Conversão entre conjunto de caractere do DOS e ISO-8859-1. Veja
62         também a seção MODOS DE CONVERSÃO.
63
64     -1252
65         Usa a página de código 1252 do Windows (Europa ocidental).
66
67     -437
68         Usa a página de código 437 do DOS (EUA). Essa é a página de código
69         padrão usada para conversão ISO.
70
71     -850
72         Usa a página de código 850 do DOS (Europa ocidental).
73
74     -860
75         Usa a página de código 860 do DOS (Português).
76
77     -863
78         Usa a página de código 863 do DOS (Francês do Canadá).
79
80     -865
81         Usa a página de código 865 do DOS (Nórdico).
82
83     -7  Converte caracteres de 8 bit para espaço de 7 bit.
84
85     -b, --keep-bom
86         Mantém marca de ordem de bytes (BOM). Quando o arquivo de entrada
87         possuir um BOM, escreve um BOM no arquivo de saída. Esse é o
88         comportamento padrão ao converter para quebras de linha do DOS. Veja
89         também a opção "-r".
90
91     -c, --convmode MODOCONV
92         Define o modo de conversão, sendo MODOCONV um dentre: *ascii*,
93         *7bit*, *iso*, *mac* com ascii sendo o padrão.
94
95     -f, --force
96         Força a conversão de arquivos binários.
97
98     -h, --help
99         Exibe ajuda e sai.
100
101     -k, --keepdate
102         Mantém a marca da data do arquivo de saída igual ao do arquivo de
103         entrada.
104
105     -L, --license
106         Exibe a licença do programa.
107
108     -l, --newline
109         Adiciona nova linha adicional.
110
111         dos2unix: Apenas quebras de linha do DOS são alteradas para duas
112         quebras de linha do Unix. No modo Mac, apenas quebras de linha do
113         Mac são alterados para duas quebras de linha do Unix.
114
115         unix2dos: Apenas quebras de linha do Unix são alteradas para duas
116         quebras de linha do DOS. No modo Mac, quebras de linha do Unix são
117         alteradas para duas quebras de linha do Mac.
118
119     -m, --add-bom
120         Escreve uma marca de ordem de byte (BOM) no arquivo de saída. Por
121         padrão, um BOM UTF-8 é escrito.
122
123         Quando o arquivo de entrada é UTF-16, e a opção "-u" é usada, um BOM
124         UTF-16 será escrito.
125
126         Nunca use essa opção quando a codificação de saída é outra além de
127         UTF-8 ou UTF-16. Veja também a seção UNICODE.
128
129     -n, --newfile ARQENT ARQSAÍDA ...
130         Modo de novo arquivo. Converte o arquivo ARQENT e escreve a saída
131         para o arquivo ARQSAÍDA. Os nomes de arquivos devem ser fornecidos
132         em pares e nome coringa *não* deveriam ser usados ou você *vai*
133         perder seus arquivos.
134
135         A pessoa que começa a conversão em modo novo arquivo (pareado) será
136         o dono do arquivo convertido. As permissões de leitura/escrita do
137         novo arquivo serão as permissões do arquivo original menos a
138         umask(1) da pessoa que executa a conversão.
139
140     -o, --oldfile ARQUIVO ...
141         Modo arquivo antigo. Converte o arquivo ARQUIVO e o sobrescreve com
142         a saída. O programa, por padrão, executa neste modo. Nomes coringas
143         podem ser usados.
144
145         No modo de arquivo antigo (no-lugar) o arquivo convertido recebe no
146         mesmo dono, grupo e permissões de leitura/escrita que o arquivo
147         original. Também, quando o arquivo é convertido por outro usuário
148         que tenha permissões de escrita no arquivo (ex.: usuário root). A
149         conversão será abortada quando não for possível preservar os valores
150         originais. Alteração do dono pode significar que o dono original não
151         é mais capaz de ler o arquivo. Alteração do grupo pode ser um risco
152         para a segurança, pois o arquivo pode ficar legível para pessoas
153         cujo acesso não é desejado. Preservação do dono, grupo e permissões
154         de leitura/escrita tem suporte apenas no Unix.
155
156     -q, --quiet
157         Modo quieto. Suprime todos os avios e mensagens. O valor retornado é
158         zero. Exceto quando opções de linha de comando erradas forem usadas.
159
160     -r, --remove-bom
161         remove marca de ordem de bytes (BOM). Não escreve um BOM no arquivo
162         de saída. Esse é o comportamento padrão ao converter para quebras de
163         linha Unix. Veja também a opção "-b".
164
165     -s, --safe
166         Ignora arquivo binários (padrão).
167
168     -u, --keep-utf16
169         Mantém a codificação UTF-16 original do arquivo de entrada. O
170         arquivo de saída será escrito na mesma codificação UTF-16, em little
171         ou big endian, como o arquivo de entrada. Isso evita transformação
172         para UTF-8. Como consequência, um BOM UTF-16 será escrito. Essa
173         opção pode ser desabilitada com a opção "-ascii".
174
175     -ul, --assume-utf16le
176         Presume que o formato de arquivo de entrada é UTF-16LE.
177
178         Quando há uma marca de ordem de byte no arquivo de entrada, esta tem
179         prioridade sobre essa opção.
180
181         Quando você fizer uma presunção equivocada (o arquivo de entrada não
182         estava no formato UTF-16LE) e a conversão funcionar, você terá um
183         arquivo de saída UTF-8 com texto errado. Você pode desfazer a
184         conversão errada com iconv(1) pela conversão do arquivo de saída
185         UTF-8 de volta para UTF-16LE. Isso vai trazer de volta o arquivo
186         para o original.
187
188         A presunção de UTF-16LE funciona como um *modo de conversão*. Ao
189         alternara o modo *ascii* padrão, a presunção de UTF-16LE é
190         desativada.
191
192     -ub, --assume-utf16be
193         Presume que o formato de arquivo de entrada é UTF-16BE.
194
195         Essa opção funciona o mesmo que a opção "-ul".
196
197     -v, --verbose
198         Exibe mensagens detalhadas. Informação extra é exibida sobre marcas
199         de ordem de byte e a quantidade de quebras de linha convertidas.
200
201     -F, --follow-symlink
202         Segue ligações simbólicas e converte os alvos.
203
204     -R, --replace-symlink
205         Substitui ligações simbólicas com arquivos convertidos (arquivos
206         alvo originais permanecem inalterados).
207
208     -S, --skip-symlink
209         Mentém ligações simbólicas e alvos inalterados (padrão).
210
211     -V, --version
212         Exibe informação da versão e sai.
213
214 MODO MAC
215     No modo normal, as quebras de linhas são convertidas de DOS para Unix e
216     vice-versa. Quebras de linha do Mac não são convertidas.
217
218     No modo Mac, quebras de linha são convertidas de Mac para Unix e
219     vice-versa. Quebras de linha do DOS não são alteradas.
220
221     Para executar no modo Mac, use a opção de linha de comando "-c mac" ou
222     use os comandos "mac2unix" ou "unix2mac".
223
224 MODOS DE CONVERSÃO
225     ascii
226         No modo "ascii", apenas as quebras de linha são convertidas. Esse é
227         o modo de conversão padrão.
228
229         Apesar do nome deste modo ser ASCII, o qual é um padrão de 7 bit, o
230         modo é em verdade 8 bit. Sempre use este modo quando quiser
231         converter arquivos Unicode UTF-8.
232
233     7bit
234         Neste modo todos os caracteres não-ASCII de 8 bit (com valores entre
235         128 e 255) são convertidos para um espaço de 7 bit.
236
237     iso Caracteres são convertidos entre um conjunto de caracteres do DOS
238         (página de código) e conjunto de caracteres ISO-8859-1 (Latin-1) no
239         Unix. Caracteres de DOS sem um equivalente ISO-8859-1, para os quais
240         a conversão não é possível, são convertidos para um ponto. O mesmo
241         vale para caracteres ISO-8859-1 sem a contraparte DOS.
242
243         Quando apenas a opção "-iso" for usada, dos2unix vai tentar
244         determinar a página de código ativa. Quando isso não for possível,
245         dos2unix vai usar a página de código padrão CP437, a qual é usada
246         principalmente nos EUA. Para forçar uma página de código específica,
247         use as opções -437 (EUA), -850 (Europeu oriental), -860 (Português),
248         -863 (Franco-canadense) ou -865 (Nórdico). Também há suporte à
249         página de código do Windows CP1252 (Europeu ocidental) com a opção
250         -1252. Para outras páginas de código, use dos2unix em combinação cm
251         iconv(1). Iconv pode converter entre uma lista grande de
252         codificações de caracteres.
253
254         Nunca use conversão ISO em arquivos textos Unicode. Isso vai
255         corromper os arquivos codificados em UTF-8.
256
257         Alguns exemplos:
258
259         Conversão da página de código padrão do DOS para Latin-1 do Unix
260
261             dos2unix -iso -n entrada.txt saída.txt
262
263         Conversão da CP850 do DOS para Latin-1 do Unix
264
265             dos2unix -850 -n entrada.txt saída.txt
266
267         Conversão da CP1252 do Windows para Latin-1 do Unix
268
269             dos2unix -1252 -n entrada.txt saída.txt
270
271         Conversão da CP1252 do Windows para UTF-8 (Unicode) do Unix
272
273             iconv -f CP1252 -t UTF-8 entrada.txt | dos2unix > saída.txt
274
275         Conversão de Latin-1 do Unix para página de código padrão do DOS
276
277             unix2dos -iso -n entrada.txt saída.txt
278
279         Conversão do Latin-1 do Unix para CP850 do DOS
280
281             unix2dos -850 -n entrada.txt saída.txt
282
283         Conversão do Latin-1 do unix para CP1252 do Windows
284
285             unix2dos -1252 -n entrada.txt saída.txt
286
287         Conversão do UTF-8 (Unicode) do Unix para CP1252 do Windows
288
289             unix2dos < entrada.txt | iconv -f UTF-8 -t CP1252 > saída.txt
290
291         Veja também <http://czyborra.com/charsets/codepages.html> e
292         <http://czyborra.com/charsets/iso8859.html>.
293
294 UNICODE
295   Codificações
296     Exitem codificações Unicode diferentes. No Unix e no Linux, arquivos
297     Unicode são geralmente codificados em UTF-8. No Windows, arquivos texto
298     Unicode podem ser codificados em UTF-8, UTF-16 ou UTF-16 big endian, mas
299     na maioria das vezes são codificados no formato UTF-16.
300
301   Conversão
302     Arquivos texto em Unicode pode ter quebras de linha DOS, Unix ou Mac,
303     como arquivos texto comuns.
304
305     Todas as versões do dos2unix e unix2dos podem converter arquivos
306     codificados em UTF-8 porque UTF-8 foi projetado para ter compatibilidade
307     reversa com ASCII.
308
309     Dos2unix e unix2dos com suporte a Unicode UTF-16 podem ler arquivos
310     texto codificados em little e big endian UTF-16. Para ver se dos2unix
311     foi compilado com suporte a UTF-16, digite "dos2unix -V".
312
313     Arquivos codificados em UTF-16 são, por padrão, convertidos para UTF-8.
314     No Unix/Linux, é necessário que a codificação de caracteres da
315     localização esteja definida para UTF-8. Use o comando locale(1) para
316     descobrir qual é a codificação de caracteres da localização. Arquivos
317     textos formatados em UTF-8 possuem suporte em tanto Windows quanto
318     Unix/Linux.
319
320     Codificações UTF-16 e UTF-8 são completamente compatíveis, não havendo
321     qualquer perda de texto na conversão. Quando um erro de conversão UTF-16
322     para UTF-8 ocorre, por exemplo quando o arquivo de entrada UTF-16 contém
323     um erro, o arquivo será ignorado.
324
325     Quando a opção "-u" é usada, o arquivo de saída será escrito na mesma
326     codificação UTF-16 que o arquivo de saída. A opção "-u" evita conversão
327     para UTF-8.
328
329     Dos2unix e unix2dos não possuem opção para converter arquivos UTF-8 ára
330     UTF-16.
331
332     Modo de conversão ISO e 7-bit não funciona em arquivos UTF-16.
333
334   Marca de ordem de byte
335     No Windows, arquivos Unicode normalmente têm uma Marca de Ordem de Byte
336     (BOM), porque muitos programas (incluindo o Bloco de Notas) adiciona
337     BOMs por padrão. Veja também
338     <http://en.wikipedia.org/wiki/Byte_order_mark>.
339
340     No Unix, arquivos Unicode normalmente não têm BOM. Presume-se que
341     arquivos texto são codificados na codificação de caracteres da
342     localização.
343
344     Dos2unix pode detectar apenas se um arquivo está no formato UTF-16 se o
345     arquivo tiver BOM. Quando um arquivo UTF-16 não tiver BOM, dos2unix vai
346     ver se o arquivo é um arquivo binário.
347
348     Use a opção "-ul" ou "-ub" para converter um arquivo UTF-16 sem BOM.
349
350     Dos2unix escreve por padrão nenhum BOM no arquivo de saída. Com a opção
351     "-b", o Dos2unix escreve um BOM quando o arquivo de entrada possuir BOM.
352
353     Unix2dos escreve por padrão um BOM no arquivo de saída quando o arquivo
354     de entrada tem BOM. Use a opção "-m" para remover BOM.
355
356     Dos2unix e unix2dos sempre escrevem BOM quando a opção "-m" é usada.
357
358   Exemplos de Unicode
359     Conversão de UTF-16 do Windows (com BOM) para UTF-8 do Unix
360
361         dos2unix -n entrada.txt saída.txt
362
363     Conversão de UTF-16LE do Windows (sem BOM) para UTF-8 do Unix
364
365         dos2unix -ul -n entrada.txt saída.txt
366
367     Conversão de UTF-8 Unix para UTF-8 do Windows com BOM
368
369         unix2dos -m -n entrada.txt saída.txt
370
371     Conversão de UTF-8 do Unix para UTF-16 do Windows
372
373         unix2dos < entrada.txt | iconv -f UTF-8 -t UTF-16 > saída.txt
374
375 EXEMPLOS
376     Lê a entrada da "stdin" e escreve a saída para "stdout".
377
378         dos2unix
379         dos2unix -l -c mac
380
381     Converte e substitui a.txt. Converte e substitui b.txt.
382
383         dos2unix a.txt b.txt
384         dos2unix -o a.txt b.txt
385
386     Converte e substitui a.txt no modo de conversão ascii.
387
388         dos2unix a.txt
389
390     Converte e substitui a.txt no modo de conversão ascii. Converte e
391     substitui b.txt no modo de conversão 7bit.
392
393         dos2unix a.txt -c 7bit b.txt
394         dos2unix -c ascii a.txt -c 7bit b.txt
395         dos2unix -ascii a.txt -7 b.txt
396
397     Converte a.txt do formato do Mac para Unix.
398
399         dos2unix -c mac a.txt
400         mac2unix a.txt
401
402     Converte a.txt do formato do Unix para Mac.
403
404         unix2dos -c mac a.txt
405         unix2mac a.txt
406
407     Converte e substitui a.txt enquanto mantém a marca de data original.
408
409         dos2unix -k a.txt
410         dos2unix -k -o a.txt
411
412     Converte a.txt e escreve para e.txt.
413
414         dos2unix -n a.txt e.txt
415
416     Converte a.txt e escreve para e.txt, mantém a marca de data de e.txt
417     igual a a.txt.
418
419         dos2unix -k -n a.txt e.txt
420
421     Converte e substitui a.txt. Converte b.txt e escreve para e.txt.
422
423         dos2unix a.txt -n b.txt e.txt
424         dos2unix -o a.txt -n b.txt e.txt
425
426     Converte c.txt e escreve para e.txt. Converte e substitui a.txt.
427     Converte e substitui b.txt. Converte d.txt e escreve para f.txt.
428
429         dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt
430
431 Conversão recursiva
432     Use dos2unix em combinação com os comandos find(1) e xargs(1) para
433     converter recursivamente arquivos texto em uma estrutura de árvore de
434     diretórios. Por exemplo, para converter todos os arquivos .txt na árvore
435     de diretórios sob o diretório atual, digite:
436
437         find . -name *.txt |xargs dos2unix
438
439 LOCALIZAÇÃO
440     LANG
441         O idioma primário é selecionado com a variável de ambiente LANG. A
442         variável LANG consiste em várias partes. A primeira parte está em
443         letras pequenas no código do idioma. A segunda parte é opcional e é
444         o código do país em letras maiúsculo, precedido de um ponto. Alguns
445         exemplos para shells do tipo padrão POSIX:
446
447             export LANG=nl               Holandês
448             export LANG=nl_NL            Holandês, Holanda
449             export LANG=nl_BE            Holandês, Bélgica
450             export LANG=es_ES            Espanhol, Espanha
451             export LANG=es_MX            Espanhol, México
452             export LANG=en_US.iso88591   Inglês, EUA, codificação Latin-1
453             export LANG=en_GB.UTF-8      Inglês, Reino Unido, codificação UTF-8
454
455         Para a lista completa de códigos de idioma e país, veja o manual do
456         gettext:
457         <http://www.gnu.org/software/gettext/manual/gettext.html#Language-Co
458         des>
459
460         Nos sistemas Unix, você pode usar o comando locale(1) para obter
461         informação específica da localização.
462
463     LANGUAGE
464         Com a variável de ambiente LANGUAGE, você pode especificar uma lista
465         de prioridades de idiomas, separada por vírgulas. Dos2unix fornece
466         preferência a LANGUAGE sobre LANG. Por exemplo, primeiro holandês e,
467         então, alemão: "LANGUAGE=nl:de". Você primeiro tem que habilitar
468         localização, definindo LANG (ou LC_ALL) para um valor diferente de
469         "C", antes que você possa usar uma lista de prioridade de idioma por
470         meio da variável LANGUAGE. Veja também o manual do gettext:
471         <http://www.gnu.org/software/gettext/manual/gettext.html#The-LANGUAG
472         E-variable>
473
474         Se você selecionou um idioma que não está disponível, você vai terá
475         as mensagens em inglês (padrão).
476
477     DOS2UNIX_LOCALEDIR
478         Com a variável de ambiente DOS2UNIX_LOCALEDIR, o LOCALEDIR definido
479         durante a compilação pode ser sobrescrito. LOCALEDIR é usada para
480         localizar os arquivos de idioma. O valor padrão do GNU é
481         "/usr/local/share/locale". A opção --version vai exibir o LOCALEDIR
482         que é usado.
483
484         Exemplo (shell POSIX):
485
486             export DOS2UNIX_LOCALEDIR=$HOME/share/locale
487
488 VALOR RETORNADO
489     No sucesso, zero é retornado. Quando um erro de sistema ocorre, o último
490     erro de sistema será retornado. Para outros erros, 1 é retornado.
491
492     O valor retornado é sempre zero no modo quieto, exceto quando opções de
493     linha de comando erradas são usadas.
494
495 PADRÕES
496     <http://en.wikipedia.org/wiki/Text_file>
497
498     <http://en.wikipedia.org/wiki/Carriage_return>
499
500     <http://en.wikipedia.org/wiki/Newline>
501
502     <http://en.wikipedia.org/wiki/Unicode>
503
504 AUTORES
505     Benjamin Lin - <blin@socs.uts.edu.au> Bernd Johannes Wuebben (modo
506     mac2unix) - <wuebben@kde.org>, Christian Wurll (adiciona nova linha
507     extra) - <wurll@ira.uka.de>, Erwin Waterlander - <waterlan@xs4all.nl>
508     (Mantenedor)
509
510     Página do projeto: <http://waterlan.home.xs4all.nl/dos2unix.html>
511
512     Página do SourceForge: <http://sourceforge.net/projects/dos2unix/>
513
514 Veja também
515     file(1) find(1) iconv(1) locale(1) xargs(1)
516