全拼转小鹤双拼Python脚本+Rime词库脚本
最近使用gboard的时候,想整理自己的双拼词库,打算分为私人词库和常用公共词库,私人词库可以通过自己使用习惯导出,然而通过网络上找到的公共词库都是全拼词库,所以打算转换成小鹤双拼可以使用的词库。这是一个非常简单的小脚本,但是竟然在网上没看到对小鹤双拼进行支持的词库,可能还是双拼用户比较少的缘故。
当然这个脚本不止支持小鹤双拼,你可以通过修改initials和finals对照表重新运行,得到符合你输入习惯的词库;也可以通过定制输出的line格式,定制符合其他输入法词库格式的dictionary文件。
搜狗标准词库.scel
:搜狗网上下载的标准词库。dictionary.txt
:深蓝词库转换上述词库得到的文件。finals1.txt
:常规韵母对照表。finals2.txt
:没声母的那些字韵母对照表。initials.txt
:声母对照表。dictionary_new.txt
:新生成的gboard词库文件(半成品)。todouble.py
:主要完成生成词典的脚本。dictionary_rime.txt
:添加支持生成Rime的词库啦。torime.py
:生成rime词库的小脚本。
安装好Python环境后,只需要部署好pypinyin
即可:
python -m pip install pypinyin
然后到此文件夹运行:
cd \path\to\this\folder
python .\todouble.py
最后生成的dictionary_new.txt
要用notepad++
转换一下格式:
编辑 > 文档格式转换 > 转换为UNIX(LF)
添加Rime词库支持了~
cd \path\to\this\fold
python .\torime.py
生成的dictionary_rime.txt
可以直接使用:
右键单击Rime图标 > 用户词典管理 > 点击<luna_pinyin> > 点击<导入文本码表>
不太熟悉Python,所以基本都是一些Python基本语法。
- pypinyin
- pypinyin api
- python 字符串连接函数
- python for loop
- python readline
- python openfile
- python open preferred method
- python while loop
- python write append mode
- encoding error
- python line text split
- python function syntax
- python case syntax
- python if syntax
- python dictionary
- pypi pypinyin
- text to dict
- conda create python env
- pypinyin CSDN
- flypy声母韵母对照 补充了个ve,否则报错。
- notepad++转换格式
- 最后我把自己生成的gboard可以直接导入使用的压缩包放release,第一版,可能会有错误。
- 补充Rime支持,词库文件放release里,标签打第二版吧。
- rime的词库没有必要,因为rime的双拼与全拼的词库通用,只需要常见词汇的汉字列表即可;
- rime太强了!附一个链接,rime添加扩展词库;
- gboard则不同,gboard手机版中的方式是通过“按键组合-汉字输出”的映射方式实现的,需要特定的双拼组合,所以todouble.py这个脚本还是有点用处的。