Rime输入法引擎,小狼毫输入法方案 白霜拼音简介!
ahcoder 2025-06-03 19:46 3 浏览
白霜拼音:基于雾凇拼音优化的输入法方案
蒹葭苍苍,白露为霜。白霜拼音由此得名。其原始配置和词库源自雾凇拼音的 af2480b commit 版本,并在此基础上进行了深度优化。
优化缘由
雾凇词库虽内容较为丰富,但仍存在一些不足。字频和词频设置不够精准,同时废词较多。为提升输入体验,我们决定重新打造白霜拼音。
优化措施
- 精简词库:对雾凇词库进行全面梳理,删除不健康词汇,去除大量冷僻词(频率为 1 且分词器难以识别的词),并对类似 “的吧”“的了” 这类非标准词汇进行删除或调整,完成第一步的减法操作。
- 优化字频与词频:借助 745396750 字的高质量语料,进行细致的分词处理,重新精确统计字频和词频,并加以归一化,以此实现更出色的输入效果。白霜拼音同时支持全拼和双拼输入。
使用方法
白霜拼音的使用方法与雾凇拼音基本一致,但在部分触发指令上做了微调,并增添了 lua 辅助码支持。辅助码为可选项,按下 ` 键即可开启,且不会干扰正常打字。
- 符号输入:输入 /fh,更多符号详情可查阅 https://github.com/gaboolic/rime-frost/blob/master/symbols_v.yaml。
- 带调韵母输入:直接输入 /a /e /u 等。
- 日期与时间输入:通过 rq(日期)、sj(时间)、xq(星期)、dt(当前日期)、ts(当前时间)等指令。
- 辅助码功能:按下 键开启墨奇辅助码,支持部件拆字反查(uU)、unicode 字符输入(U)、数字金额大写转换(R)、农历查询(N)以及计算器功能(V`)。
安装指南
手动下载安装
Windows:
下载本仓库压缩包(点击 Code - Download ZIP,或下载 releases 最新的 source-code.zip),解压后将文件放置于 %APPDATA%\Rime 路径(可在右下角小狼毫输入法右键菜单中选择打开用户文件夹)。完成复制后,在输入法设定里选择白霜拼音,然后执行重新部署操作。
Mac:
鼠须管路径为 ~/Library/Rime。
fcitx5 - Mac 版路径为
~/.local/share/fcitx5/rime。
Linux:
fcitx5 - rime 路径为
~/.local/share/fcitx5/rime。
fcitx5 flatpak 版的路径为
~/.var/app/org.fcitx.Fcitx5/data/fcitx5/rime。
ibus - rime 路径为 ~/.config/ibus/rime。
Android:
fcitx5 - 安卓版路径为
/Android/data/org.fcitx.fcitx5.android/files/data/rime。
同文路径为 /rime。
雨燕输入法已内置白霜词库词频,直接安装即可使用。
iOS:
仓输入法目前已内置白霜拼音,也可通过【输入方案设置 - 右上角加号 - 方案下载 - 覆盖并部署】来更新白霜拼音。
通过 Git 安装
首次安装:依据所使用的系统及安装软件,先通过 cd 命令进入对应的配置文件父级目录(如 Windows 为 %APPDATA%,mac 鼠须管为 ~/Library/),然后执行以下命令:git clone --depth 1
https://github.com/gaboolic/rime-frost Rime。
后续更新:在 Rime 文件夹内执行 git pull 命令即可完成更新。 Mac:cd ~/Library/Rime && git pull Windows:cd "$env:APPDATA\Rime" && git pull 其他系统操作方式以此类推。
通过东风破安装
选择配方(others/recipes/*.recipe.yaml)来进行安装或更新:
执行 bash rime - install gaboolic/rime - frost:others/recipes/full 可安装或更新全部文件。
未来规划
- [x] 整理分词后词频较高但词库未收录的词汇,将其添加进词库。
- [ ] 实现错字错音提醒的 lua 功能。
- [ ] 编写自动化脚本,将句子转换为拼音,再通过拼音调用 rime_api 生成句子,比对正确率并进行迭代优化。
- [ ] 增添墨奇码首末字形反查功能,例如输入 amq 引导符后,再输入 mu cun 可打出 “村 櫉 梼 树” 等字。
- [x] 成功加入 lua 引导辅助码功能。
- [ ] 针对 2 字词中动词 + 名词结构,在中间加入 “了”“完”,结尾加入 “没” 自动派生词汇。例如:“拔牙” 可派生 “拔了牙,拔完牙,拔牙没,没拔牙,拔没拔牙”;针对形容词,在中间加 “不”,如 “厉害” 变为 “厉不厉害”。
- [ ] 增添类似 “第四 四列 = 第四列” 这类词汇。
- [ ] 统计中文语料中的英文词频。
- [ ] 训练一个智能语言模型。
鸣谢
- 雾凇词库 https://github.com/iDvel/rime-ice:白霜词库的初始词库及绝大部分配置皆源于此。
- 结巴中文分词 https://github.com/fxsjy/jieba
- 汉字转拼音 (pypinyin) https://github.com/mozillazg/python-pinyin
- MNBVC 超大规模中文语料集 https://github.com/esbatmop/MNBVC 目前已有 33TB 数据量
- kenlm https://github.com/kpu/kenlm 官网 https://kheafield.com/code/kenlm/
- kenlm 教程、python 调用 https://github.com/mattzheng/py-kenlm-model
友情链接
使用白霜词库的方案:
墨奇音形
https://github.com/gaboolic/rime-shuangpin-fuzhuma
墨奇五笔整句
https://github.com/gaboolic/rime-wubi-sentence
薄荷拼音
https://github.com/Mintimate/oh-my-rime
雨燕输入法:
https://github.com/gurecn/YuyanIme 一款开箱即用的安卓输入法,内置白霜词库。
相关推荐
- 当 Linux 根分区 (/) 已满时如何释放空间?
-
根分区(/)是Linux文件系统的核心,包含操作系统核心文件、配置文件、日志文件、缓存和用户数据等。当根分区满载时,系统可能出现无法写入新文件、应用程序崩溃甚至无法启动的情况。常见原因包括:「日志文件...
- linux系统监控工具小神器:btop(linux网络监控工具)
-
top是大家常用的实时系统监控工具,今天给大家介绍一款非常酷炫的实时系统监控工具btop,用了之后你一定会爱上它!btop是一个高级的实时系统监控工具,它是传统top命令的现代替代品,提供了丰富...
- 又一全新恶意软件曝光!专门针对Windows、Linux 和 macOS 用户
-
近日,网络安全研究人员发现了一个利用“CheanaStealer”恶意软件的复杂网络钓鱼活动,该恶意软件是通过一个VPN钓鱼网站传播的。这次攻击的主要目标是各种操作系统的用户,包括Wind...
- Java程序员必备的Linux命令全解析
-
Java程序员必备的Linux命令全解析作为一名Java开发者,除了精通Java语法和框架外,掌握一些基础的Linux命令也是十分必要的。这不仅能提高你的工作效率,还能让你更好地管理和部署Java应用...
- Linux基础知识之shell实现用户管理功能
-
[root@k8s-mastershell]#moreusermanager.sh#!/bin/bashRED='\033[0;31m'GREEN='\033[...
- 惊艳!Linux 中迷人的 Shell 脚本工具
-
如果您是Linux操作系统爱好者或正在将自己定义为一个爱好者,那么与shell脚本交叉的路径是完全不可避免的。根据定义,shell脚本是设计用于在Unix/Linuxshell环境中执...
- 【shell编程】你的第一个sh脚本(shell脚本编程教程)
-
vimhello.sh#!/bin/bash#注释echo-e"HelloWorld!\a\n"exit0第一行#!/bin/bash,作用是宣告这个文件内的语...
- linux之bash、sh和dash(linux里bash命令)
-
linux系统里有sh、bash、dash等多种shell的解释器命令,其中sh是shll的缩写,是linux系统默认的shell解释器,bash则是sh命令的增强版,dash则是从netbsd派生而...
- 14、linux命令-du(linux命令-s)
-
14、linux命令-du常用命令du-sh/*#显示指定目录下每个文件或目录的容量大小,并且以易读方式显示(常用)。du命令概述du命令作用是估计文件系统的磁盘已使用量,常用于查看文件或目录...
- Manjaro Linux:属于我的Linux体验
-
从Debiantesting切换回Manjarotesting前端使用好久的Manjarotesting切换到了Debiantesting,就是因为有一些包只有deb版本,适配了Debia...
- 小狼毫 0.17.0 更新,解锁输入新姿势!
-
0.17.0版本(2025年5月17日发布)这次更新可不少东西呢!先把librime升级到1.13.1版本啦,也不知道这升级之后会带来啥新变化,用用就知道咯。之前老是出问题的托...
- Kali Linux 初始配置(kali linux2019默认用户名和密码)
-
1.更新源&升级系统sudoaptupdate&&sudoaptupgrade-ysudoaptdist-upgrade-y作用:确保所有工具和系统补丁为最新,避免...
- 怎样利用锤子手机和讯飞手机输入法,让电脑动起来
-
在大家看来,老罗的发布会捧红了科大讯飞。小编当时就被老罗洗脑了,立刻下载了讯飞输入法体验了一番。后来小编突发奇想,我经常使用向日葵远程控制电脑,如果远程控制电脑时使用讯飞,能否在电脑上完成语音输入?或...
- 装好KALI之后,急需做的两个事情,更新源和添加输入法
-
每次当我们装完系统之后,突然发现很茫然,为什么要装这个系统?也就是说我们压根儿就不知道装这个系统是为了做什么。而且刚装好的系统体验起来,好像也并没有网上说的那么好。之前想做的种种操作现在也就不了了之了...
- Linux 依赖问题“硬核”解决方案 | 技术
-
编者按:本文介绍了一些另类的暴力破解RPM和DEB软件包依赖关系的方法,对陷入依赖陷阱而不可自拔的人来说,有时候这也是一种绝地求生之路。至于说这样做是否合适,那就是一件见仁见智的事情了,不过这...
- 一周热门
- 最近发表
- 标签列表
-
- linux 远程 (37)
- u盘 linux (32)
- linux 登录 (34)
- linux 路径 (33)
- linux 文件命令 (35)
- linux 是什么 (35)
- linux 界面 (34)
- 查看文件 linux (35)
- linux 语言 (33)
- linux代码 (32)
- linux 查看命令 (33)
- 关闭linux (34)
- root linux (33)
- 删除文件 linux (35)
- linux 主机 (34)
- linux与 (33)
- linux 函数 (35)
- linux .ssh (35)
- cpu linux (35)
- 查看linux 系统 (32)
- linux 防火墙 (33)
- linux 手机 (32)
- linux 镜像 (34)
- linux ip地址 (34)
- linux 用户查看 (33)