Upstream version 8.36.161.0
[platform/framework/web/crosswalk.git] / src / third_party / hunspell_dictionaries / README.chromium
1 Name: hunspell dictionaries
2 URL: http://bgoffice.sourceforge.net/
3      http://code.google.com/p/tr-spell/
4      http://extensions.services.openoffice.org/dictionary
5      http://extensions.services.openoffice.org/en/project/dict_et
6      http://extensions.services.openoffice.org/en/project/dict_lv_LV
7      http://extensions.services.openoffice.org/en/project/dict-nl
8      http://extensions.services.openoffice.org/project/dict_ru_RU
9      http://extensions.services.openoffice.org/project/pl-dict
10      http://ftp.linux.ee/pub/openoffice/contrib/dictionaries/et_EE.zip
11      http://ftp.services.openoffice.org/pub/OpenOffice.org/contrib/dictionaries/de_DE_neu.zip
12      http://ispell-uk.sourceforge.net/
13      http://openoffice.rs/dict-sr/
14      https://addons.mozilla.org/en-US/firefox/addon/albanian-dictionary/
15      https://addons.mozilla.org/en-US/firefox/addon/thamizha-solthiruthi/
16      https://addons.mozilla.org/en-US/firefox/addon/turkce-imla-denetimi/
17      https://dsso.googlecode.com/files/sv-2.12.zip
18      http://sourceforge.net/projects/magyarispell/
19      https://spellcheck-ko.googlecode.com/files/ko-aff-dic-0.5.6.zip
20      http://tajlingvo.tj/project/TajikHunSpellDictionary/tg_TG.zip
21      https://tr-spell.googlecode.com/files/firefox-tr-dict-v0.3.2.xpi
22      http://wiki.services.openoffice.org/wiki/Dictionaries
23      http://wordlist.sourceforge.net/
24      http://www.broffice.org/
25      http://www.dicollecte.org/
26      http://www.justlocal.com.au/
27 License: MPL 1.1/GPL 2.0/LGPL 2.1
28 Security Critical: no
29 Version: unknown
30
31 This folder contains the following:
32
33 .dic files
34 .aff files
35 .bdic files
36 .dic_delta files
37 README_<language>_<region>.txt files
38
39 The .bdic files are binary files, generated from the corresponding .dic and .aff
40 files, using convert_dict (chrome\tools\convert_dict). These binary files are
41 used by the spellchecker. The .dic_delta files are used to add words which are
42 not there in the .dic files. Irrespective of the encoding of the corresponding
43 .dic file, the .dic_delta files are encoded as UTF-8.
44
45 The final binary file, .bdic, is generated with words from the .dic and
46 additional words from the .dic_delta file. In order to get the current-most bdic
47 file versions, it is a good idea to rebuild them using convert_dict from the
48 .dic, .aff and .dic_delta files in this folder. convert_dict takes care of
49 duplicate entries present both in .dic and .dic_delta files.
50
51 The README_<language>_<region>.txt files contain information about the
52 individual dictionaries, including copyright information.
53
54 The .bdic files are versioned to force clients to download new versions when
55 necessary. Use the same version for all the dictionaries that you add at the
56 same time. Increment the major version number (5) if you're updating either dic
57 or aff files. Increment the minor version number (0) if you're updating only
58 dic_delta files. If you add or update dictionaries, make sure to update the
59 constants in chrome\common\spellcheck_common.cc.
60
61 Note: the encodings for these files are usually only UTF-8 for English
62 dictionaries. Otherwise, they could be anything. This will lead to
63 errors when trying to upload so in general, you'll just have to upload
64 your change and cross your fingers.
65
66 The following 39 dictionaries have been appended with or without additional
67 words using the .dic_delta files (as of December 14th 2012), and are covered
68 under the existing GPL/LGPL/MPL tri-license in COPYING:
69
70 af_ZA:  No changes
71
72 bg_BG:  No changes
73
74 ca_ES:  Added words
75         Added NOSUGGEST flag = ! to .aff file
76         Added two words to .dic file with the ! flag to mark them forbidden/nosuggest.
77
78 cs_CZ:  Added words
79
80 da_DK:  Added words
81         Changed "øvrigt/mk" to "øvrigt/" in da_DK.dic to make convert_dict work.
82
83 de_DE_neu:  Added words
84         Removed "Information" from dic_delta in favor of "Information/P" to fix
85             the spelling of "Informationen"
86
87 en_AU:  Added words
88
89 en_CA:  Added words
90
91 en_GB:  Added words
92
93 en_US:  Added words
94
95 es_ES:  Added words
96
97 et_EE:  No changes
98
99 fo_FO:  No changes
100
101 fr_FR:  Added words to 4.8 (modern) downloaded from 
102         http://www.dicollecte.org/download.php?prj=fr
103
104 he_IL:  Added words
105
106 hi_IN:  Added words
107
108 hr_HR:  Added words
109
110 hu-HU:  Added words
111
112 id_ID:  Added words
113
114 it_IT:  Added words
115         Added NOSUGGEST flag = % to .aff file
116         Added three words to .dic file with the ! flag to mark them forbidden/nosuggest.
117
118 ko:     Removed a line from dic that was longer than 128 characters
119
120 lt_LT:  Added words.
121         Added NOSUGGEST flag = ! to .aff file
122         Added some words to .dic file with the ! flag to mark them forbidden/nosuggest.
123
124 lv_LV:  Added words
125
126 nb_NO:  Added words
127
128 nl_NL:  Added words
129
130 pl_PL:  Added words
131
132 pt_BR:  Added words
133
134 pt_PT:  Added words
135
136 ro_RO:  Added words
137
138 sh:     No changes
139
140 sk_SK:  Added words
141
142 sl_SI:  Added words
143         Added NOSUGGEST flag = ! to .aff file
144         Added five words to .dic file with the ! flag to mark them forbidden/nosuggest.
145         Changed "Ÿvrklji/N" to "Ÿvrklji/" in sl_SI.dic to make convert_dict work.
146
147 sq:     No changes
148
149 sr:     Added a word
150
151 sv_SE:  Added words
152         Changed "ω/r" to "ω/" in sv_SE.dic to make convert_dict work.
153
154 ta_IN:  Removed the word "சர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர்ர" to make convert_dict work.
155
156 tr_TR:  No changes
157
158 uk_UA:  No changes
159
160 vi_VN:  Added words
161
162 The following dictionary has a BSD-like license in README_ru_RU.txt:
163
164 ru_RU:  Added words
165
166 The following dictionary has an Apache license in COPYING.Apache:
167
168 tg_TG:  No changes
169
170 On Jan 20, 2011, en_US.dic_delta was copied to en_AU.dic_delta and
171 en_GB.dic_delta so these locales would get the same additional words.
172
173 On Dec 26, 2012, we reran convert_dict on all dictionaries to add MD5 checksum
174 to the .bdic files, added sq, ta, and ko dictionaries, and bumped the versions
175 up to 3-0.
176
177 On Jan 8, 2013, we added back et_EE and tr_TR .dic and .aff files to add MD5
178 checksums to their .bdic files. We used version 3-0 again, because these files
179 were not updated with the rest of the dictionaries on Dec 26, 2012.
180
181 On Jan 9, 2013, we changed the download location of tr_TR from a Firefox website
182 to a Google code website. The only difference between the two locations is that
183 the tr_TR affix file from the Google code website includes a "FLAG num"
184 directive, which prevents Chrome's heapcheck tests from crashing. Given that aff
185 file changed, we used version 4-0.
186
187 On Mar 4, 2014, we added tg_TG dictionaries for Tajik language. We used 5-0
188 version to denote a new batch of dictionaries.