问答媒体

 找回密码
 立即注册
快捷导航
搜索
热搜: 活动 交友 discuz
查看: 113|回复: 3

Rime输入法词库扩充(搜狗词库,QQ拼音词库,清华词库 ...

[复制链接]

2

主题

6

帖子

11

积分

新手上路

Rank: 1

积分
11
发表于 2022-11-27 09:35:26 | 显示全部楼层 |阅读模式
​Rime输入法作为一款高度自定义的本地输入法,词库的配置尤为重要。
1.Rime输入法词库格式

Rime输入法的词库在用户配置文件夹下,是以.dict.yaml结尾的文件。
2.Rime输入法词库如何调用

Rime可以扩充很多词库,为了防止卡顿,词库在使用时通过递归调用的方法,首先我们定义一个总的词库,总词库的名称格式也为*.dict.yaml(名称根据自己定义,此处假设为myDict.dict.yaml),文件内容如下:
假设已下载了扩充词库A.dict.yaml,B.dict.yaml,C.dict.yaml,D.dict.yaml,E.dict.yaml
  ---
name: myDict                 #必须与文件名相同,此处不加文件后缀
version: "2014.10.28"
sort: by_weight
use_preset_vocabulary: true ​
import_tables:              #导入词库
  - A                       #将所有词库以这种方式写入
   - B                       #注意,不需要写扩展名
   - C
   - D
   #- E                      #此处加入#相当于屏蔽了词库E,后期需要使用去掉#即可
...
注:Rime调用总的词库,总的词库再调用各个词库,各个词库之间也不互相影响
  


完成以上设置相当于将词库ABCDE导入到了词库myDict词库中,此时设置Rime调用myDict即可,调用词库的设置如下:
用户文件夹找到文件你输入方案.custom.yaml(此处以小鹤双拼为例,打开double_pinyin_flypy.custom.yaml)加入以下语句:
    'translator/dictionary': myDict
只需将冒号后面内容修改为总词库词库名称即可。
3.搜狗词库下载


  • 搜狗词库这里推荐下载搜狗标准词库与搜狗网络词库;其他词库按需下载。
  • 词库下载后不能够直接用与Rime输入法,需要用深蓝词库转换软件转换,转换完成后是txt文件,下文词库配置会用到该文件。
  • 本人整理的词库


深蓝词库转换教程:
①软件下载可能出现无法访问的问题,这是自己下载的软件
链接:imewlconverter_Windows.zip - 蓝奏云
链接:https://pan.baidu.com/s/1K04UKRrfR6Z5_1BJbwizRA
提取码:xlit
复制这段内容后打开百度网盘手机App,操作更方便哦
②选择需要转换的文件,转出格式选择Rime
  


4.词库配置

①词库配置还是需要在用户文件夹新建*.dict.yaml(名称设置为英文任意名称)文件,首先在该文件中加入以下代码
  ---
name: dict_sougou_standard  #自定义的词库的名字,不加后缀
version: "2016.10.29"
sort: by_weight
use_preset_vocabulary: true ...②接着在该文件的下方粘贴深蓝转换软件转换后的文本,如下图示


③将这个文件的名字加入到总词库文件myDict.dict.yaml中,并重新部署即可。
  ---
name: myDict                 #必须与文件名相同,此处不加文件后缀
version: "2014.10.28"
sort: by_weight
use_preset_vocabulary: true ​
import_tables:              #导入词库
   - A                       #将所有词库以这种方式写入
   - B                       #注意,不需要写扩展名
   - C
   - D
   #- E                      #此处加入#相当于屏蔽了词库E,后期需要使用去掉#即可
   - dict_sougou_standard
...④效果验证
以搜狗标准词库中的词条“阿并洛古乡”为例


导入搜狗标准词库前


导入搜狗标准词库后


5.词条去重
在将多个词库整合为一个词库时,难免会出现重复词条,去重方法如下:
①将txt文件另存为ANSI格式,用excel打开
②选中单元格列——数据——删除重复项
6.简繁转换

下载简繁转换工具简繁转换
自用分享:opencc-0.4.2-win32.zip - 蓝奏云
链接:https://pan.baidu.com/s/1sYu1ge74iDwkXfYJbuNVkw 提取码:xlit


7.拆字词库

下载拆字词库,根据相应输入法下载相应的拆字词库,此处以小鹤双拼拆字词库为例。
输入u然后打入拆分的字即可,如鑫:全拼ujinjinjin;小鹤双拼ujbjbjb


8.其他词库

除了以上两个主要词库,你还可以在搜狗网站下载其他词库,方法同上
QQ拼音词库下载地址
wiki词库
rime增强词库
THUOCL清华词库
以上配置使用到的文件及合集请公众号领取(惜洛IT)。
以上就是今天的内容,这篇文章能帮到你是我写作的意义所在,有任何问题可以评论或私信。当然,您的点赞与关注也是对我最大的支持与肯定,也是我继续写作的动力源泉。
了解更多教程可关注公众号惜洛IT

回复

使用道具 举报

0

主题

2

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-11-27 09:35:48 | 显示全部楼层
学到了,非常感谢[爱]
回复

使用道具 举报

0

主题

4

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-11-27 09:36:47 | 显示全部楼层
请教一下,如果几个词库中有相同的词,rime会如何处理?对载入的多个词库,rime是顺序处理还是并行搜索?
回复

使用道具 举报

1

主题

6

帖子

11

积分

新手上路

Rank: 1

积分
11
发表于 2022-11-27 09:36:58 | 显示全部楼层
这个具体不清楚,可以看看官方有没有说明,应该是和配置词库的顺序有关
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver| 手机版| 小黑屋| 问答媒体

GMT+8, 2025-3-16 07:13 , Processed in 0.451001 second(s), 62 queries .

Powered by Discuz! X3.4

Copyright © 2020, LianLian.

快速回复 返回顶部 返回列表