Add punct.py
authorPeng Huang <shawn.p.huang@gmail.com>
Sun, 16 May 2010 03:45:58 +0000 (11:45 +0800)
committerPeng Huang <shawn.p.huang@gmail.com>
Sun, 16 May 2010 03:48:53 +0000 (11:48 +0800)
scripts/punct.py [new file with mode: 0644]

diff --git a/scripts/punct.py b/scripts/punct.py
new file mode 100644 (file)
index 0000000..a40805b
--- /dev/null
@@ -0,0 +1,100 @@
+# vim:set et sts=4:
+# -*- coding: utf-8 -*-
+
+punct_map = (
+    (u'', (u',', u'。', u'「', u'」', u'、', u':', u';', u'?', u'!',)),
+    (u'!', (u'!', u'﹗', u'‼', u'⁉',)),
+    (u'"', (u'“', u'”', u'"',)),
+    (u'#', (u'#', u'﹟', u'♯',)),
+    (u'$', (u'$', u'€', u'﹩', u'¢', u'£', u'¥',)),
+    (u'%', (u'%', u'﹪', u'‰', u'‱', u'㏙', u'㏗',)),
+    (u'&', (u'&', u'﹠',)),
+    (u'(', (u'(', u'︵', u'﹙',)),
+    (u')', (u')', u'︶', u'﹚',)),
+    (u'*', (u'*', u'×', u'※', u'╳', u'﹡', u'⁎', u'⁑', u'⁂', u'⌘',)),
+    (u'+', (u'+', u'±', u'﹢',)),
+    (u',', (u',', u'、', u'﹐', u'﹑',)),
+    (u'-', (u'…', u'—', u'-', u'¯', u'﹉', u' ̄', u'﹊', u'ˍ', u'–', u'‥',)),
+    (u'.', (u'。', u'·', u'‧', u'﹒', u'.',)),
+    (u'/', (u'/', u'÷', u'↗', u'↙', u'∕',)),
+    (u'0', (u'0',)),
+    (u'1', (u'1',)),
+    (u'2', (u'2',)),
+    (u'3', (u'3',)),
+    (u'4', (u'4',)),
+    (u'5', (u'5',)),
+    (u'6', (u'6',)),
+    (u'7', (u'7',)),
+    (u'8', (u'8',)),
+    (u'9', (u'9',)),
+    (u':', (u':', u'︰', u'﹕',)),
+    (u';', (u';', u'﹔',)),
+    (u'<', (u'<', u'〈', u'《', u'︽', u'︿', u'﹤',)),
+    (u'=', (u'=', u'≒', u'≠', u'≡', u'≦', u'≧', u'﹦',)),
+    (u'>', (u'>', u'〉', u'》', u'︾', u'﹀', u'﹥',)),
+    (u'?', (u'?', u'﹖', u'⁇', u'⁈',)),
+    (u'@', (u'@', u'⊕', u'⊙', u'㊣', u'﹫', u'◉', u'◎',)),
+    (u'A', (u'A',)),
+    (u'B', (u'B',)),
+    (u'C', (u'C',)),
+    (u'D', (u'D',)),
+    (u'E', (u'E',)),
+    (u'F', (u'F',)),
+    (u'G', (u'G',)),
+    (u'H', (u'H',)),
+    (u'I', (u'I',)),
+    (u'J', (u'J',)),
+    (u'K', (u'K',)),
+    (u'L', (u'L',)),
+    (u'M', (u'M',)),
+    (u'N', (u'N',)),
+    (u'O', (u'O',)),
+    (u'P', (u'P',)),
+    (u'Q', (u'Q',)),
+    (u'R', (u'R',)),
+    (u'S', (u'S',)),
+    (u'T', (u'T',)),
+    (u'U', (u'U',)),
+    (u'V', (u'V',)),
+    (u'W', (u'W',)),
+    (u'X', (u'X',)),
+    (u'Y', (u'Y',)),
+    (u'Z', (u'Z',)),
+    (u'[', (u'「', u'[', u'『', u'【', u'「', u'︻', u'﹁', u'﹃',)),
+    (u'\'', (u'、', u'‘', u'’',)),
+    (u'\\', (u'\', u'↖', u'↘', u'﹨',)),
+    (u']', (u'」', u']', u'』', u'】', u'」', u'︼', u'﹂', u'﹄',)),
+    (u'^', (u'︿', u'〈', u'《', u'︽', u'﹤', u'<',)),
+    (u'_', (u'_', u'╴', u'←', u'→',)),
+    (u'`', (u'‵', u'′',)),
+    (u'a', (u'a',)),
+    (u'b', (u'b',)),
+    (u'c', (u'c',)),
+    (u'd', (u'd',)),
+    (u'e', (u'e',)),
+    (u'f', (u'f',)),
+    (u'g', (u'g',)),
+    (u'h', (u'h',)),
+    (u'i', (u'i',)),
+    (u'j', (u'j',)),
+    (u'k', (u'k',)),
+    (u'l', (u'l',)),
+    (u'm', (u'm',)),
+    (u'n', (u'n',)),
+    (u'o', (u'o',)),
+    (u'p', (u'p',)),
+    (u'q', (u'q',)),
+    (u'r', (u'r',)),
+    (u's', (u's',)),
+    (u't', (u't',)),
+    (u'u', (u'u',)),
+    (u'v', (u'v',)),
+    (u'w', (u'w',)),
+    (u'x', (u'x',)),
+    (u'y', (u'y',)),
+    (u'z', (u'z',)),
+    (u'{', (u'{', u'︷', u'﹛', u'〔', u'﹝', u'︹',)),
+    (u'|', (u'|', u'↑', u'↓', u'∣', u'∥', u'︱', u'︳', u'︴', u'¦',)),
+    (u'}', (u'}', u'︸', u'﹜', u'〕', u'﹞', u'︺',)),
+    (u'~', (u'~', u'﹋', u'﹌',)),
+)