- 更新拼音库
- 载入拼音库时,改为载入其副本。防止内置的拼音库被破坏
- 修复
胜败乃兵家常事的音标问题
新增参数
errors用来控制如何处理没有拼音的字符:'default': 保留原始字符'ignore': 忽略该字符'replace': 替换为去掉\u的 unicode 编码字符串(u'\u90aa'=>u'90aa')
只处理
[^a-zA-Z0-9_]字符。
使用新的单字拼音库内容和格式
新的格式:{0x963F: u"ā,ē"}旧的格式:{u'啊': u"ā,ē"}
- 清理命令行命令的输出结果,去除无关信息
- 修复“ImportError: No module named runner”
- 修复命令行工具在 Python 3 下的兼容性问题
- 去除拼音风格前的
STYLE_前缀(兼容包含STYLE_前缀的拼音风格) - 增加命令行工具,具体用法请见:
pypinyin -h
- 支持自定义拼音库,方便用户修正程序结果
- 将
jieba模块改为可选安装,用户可以选择使用自己喜爱的分词模块对汉字进行分词处理 - 支持 Python 3
增加
lazy_pinyin>>> lazy_pinyin(u'中心') ['zhong', 'xin']
- 修复首字母风格无法正确处理只有韵母的汉字
- 新增三个拼音风格:
pypinyin.STYLE_FINALS: 韵母风格1,只返回各个拼音的韵母部分,不带声调。如:ong uopypinyin.STYLE_FINALS_TONE: 韵母风格2,带声调,声调在韵母第一个字母上。如:ōng uópypinyin.STYLE_FINALS_TONE2: 韵母风格2,带声调,声调在各个拼音之后,用数字 [0-4] 进行表示。如:o1ng uo2
完善对中英文混合字符串的支持:
>> pypinyin.pinyin(u'你好abc') [[u'n\u01d0'], [u'h\u01ceo'], [u'abc']]
- Initial Release