Skip to content

Latest commit

 

History

History
22 lines (18 loc) · 886 Bytes

README_zhcn.md

File metadata and controls

22 lines (18 loc) · 886 Bytes

汉字转油库里语音工具


这是一个把汉字转化为片假名的工具,方便生成油库里语音。 感谢cnfurikana项目,此项目使用了它的数据,并进行了修正使其生成的语音更正宗(确信)。

数据

kana_ascii.json是使用转义序列的文件,kana_utf8.json是utf8格式的转换表。

原理/步骤

分词

使用jieba,一个轻量的中文分词库。分词是因为多音字分完后转化为拼音会更准确。

转换为拼音

使用pypinyin,一个轻量的Python模块。

转换为片假名

打表的其实,反正是读音,一一对应的嘛。

这能干啥

生成油库里语音用,正宗的幻想乡口音(雾)

使用

kanalize.py (源码里面大量的转义字符是因为我不愿意用ascii以外的字符写源码,问题不大)