rime输入法初识-----algo算法目录分析（三）

最新推荐文章于 2025-12-16 17:06:35 发布

原创最新推荐文章于 2025-12-16 17:06:35 发布 · 500 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#linux #windows #c++

本文介绍了rime输入法中encoder.h和encoder.cc文件的短语编码功能，详细阐述了如何根据仓颉五代规则进行编码配置，包括最大输入字长、最小词频设定以及不同长度词的编码公式。通过exclude_patterns和rules，实现特定字词的排除和编码逻辑。

部署运行你感兴趣的模型镜像

2021SC@SDUSC

encoder.h和encoder.cc是定义关于短语编码的功能，先看.h文件

这里定义了一个短语收集类，它定义了一个功能返回给定单词的可选代码列表。

然后就是一些基于规则和音节的短语编码定义。再看看.cc文件

这里是按照仓颉五代的配置来进行编码的。max_phrase_length配合use_preset_vocabulary来限制最大输入字长min_phrase_weight配合use_preset_vocabulary来设定输入最小词频，根据仓颉五代规则 encoder:
exclude_patterns:
- '^x.*$'
- '^z.*$'
rules:
- length_equal: 2//对于2字词
formula: "AaAzBaBbBz"//取第一字首尾码、第二字首次尾码
- length_equal: 3//对于三字词
formula: "AaAzBaBzCz"//取第一字首尾码、第二字首尾码、第三字尾码
- length_in_range: [4, 10]//对于4-10字词
formula: "AaBzCaYzZz"//取第一字首码、第二字尾码、第三字首码、倒数第二字和末字尾码
tail_anchor: "'"

根据上述规则进行字典匹配

您可能感兴趣的与本文相关的镜像

Seed-Coder-8B-Base

文本生成

Seed-Coder

Seed-Coder是一个功能强大、透明、参数高效的 8B 级开源代码模型系列，包括基础变体、指导变体和推理变体，由字节团队开源

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Dr.Caesar

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

超全超详细Rime中州韵输入法配置指南

惜洛-Jankin的博客

02-01

2万+

1.为什么选择RIME 市面上具有众多的输入法，无论搜狗还是QQ输入法基本都大同小异，但RIME是众多输入法中一个特殊的存在。之所以特殊，原因在于，绝大部份输入法工具，长什么样、能实现什么功能，出厂即定型，唯有一些自定义选项，也是出厂即以划定的框框。然而RIME则不同，它是一款本地输入法（没有云端），可以高度自定义，实现众多功能，包括候选框的大小与皮肤，词库与短语等，通过修改本地配置文件，并最终把它打磨成一款完全符合你输入习惯的输入法。比如，经过自定义，你可以通过拼音输入学校，出现你学校的名称；

山东大学软件工程应用与实践——RIME输入法配置文件分析

.zhen.

10-10

1550

2021SC@SDUSC 一.配置文件格式 .yaml文件是配置文件,是我们主要修改的一块.例如(default.yaml 是输入法配置文件夹, luna_pinyin.schema.yaml,是luna(明月)输入方案的配置文件) .custom.yaml是用户用来自定义配置的内容. .bin文件是rime输入法自动生成的, 不需要去动. .table.bin 是生成的词库文件(在重新部属的时候会自动生成需要导入词库的.table.bin文件.) 二.配置原理在输入法重新部属的时候, 会所需要的设置

参与评论您还未登录，请先登录后发表或查看评论

笔记-Rime中州韵输入法配置记录

T_good的博客

12-29

2635

rime输入法配置记录

小狼毫 Rime 输入法任务导向式常用参数修改指南

emca的专栏

03-12

8865

【深山红叶整理 v20200226】本修改指南的每个修改条目尽量以多个关键词作为条目标题，你可以使用简短的关键词进行文本搜索，比如“候选”、“F4”、“顶屏”、“快捷键”等，即可快速定位到要修改的具体方法内容。可多次搜索以找到尽可能全面的内容。配置小狼毫时，请随时注意系统TEMP目录中的警告和错误信息（用记事本打开以 rime.weasel 字符串开头的文...

rime输入法源码新手尝试研究----代码总体架构

Dr_Caesar的博客

10-19

2247

2021SC@SDUSC 项目源代码总体结构这次主要分析rime输入法的内核librime，从github下载解包后先来看看总体架构其中包括了下面文件夹 cmake：统筹整个输入法的架构，对文件进行统一编译 data：里面有两个文件夹minimal和test，前者是自带的基础拼写法的配置文件，仓颉五笔，luna拼音，还有生僻字使用频率之类的，后者则是一些组件的测试 Plugins：各种插件和基础的配置文件，因为刚下载，没有其他额外的插件，用户可以根据...

rime输入法初识------algo算法目录分析（一）

Dr_Caesar的博客

11-28

997

2021SC@SDUSC 今天我们来聊聊一款输入法最核心的算法部分，这里是我整一个rime项目了解的一个大头，所以会讲的比较细致一点，用的篇幅也可能会比较长，一个个文件来讲。第一个文件是algebra.h和algebra.cc，先看看头文件首先rime中定义了calculation（计算），schema（模式），script（字母表），projection（投影），首先script中定义了增加音节的bool函数，实现音节合并功能的空函数，丢弃函数，而投影类中有装载和应用方法，具体实现我们看..

rime输入法初识------algo算法目录分析（二）

Dr_Caesar的博客

11-28

628

2021SC@SDUSC 来说说第二个文件calculus.h和calculus.cc（微积分）从名字来看的话应该是讲如何来通过拼音输入来和字典库中的文字匹配，我们来大致看看。首先他定义了很多rime的api，音译、擦除、转换、派生、模糊音、缩写等，代码我就只截取了一小部分，就不在此一一展示了，接下来进入正题.cc文件首先是对各种api的注册和常量的设计，常量主要是缩写和模糊音处罚（？？？这里我不是很懂，可能是出现概率？）首先是音译的功能。音译，指用发音近似的汉字将外来语翻译过.

rime输入法初识-----algo算法目录分析（四）

Dr_Caesar的博客

11-29

609

2021SC@SDUSC syllabifier.h和syllabifier.cc音节发生器文件，这个文件就是之前提到的音节到汉字的映射、模糊音输入等功能的具体算法实现这里定义了多种拼写属性，半角，全角，全拼等还有两个api 创建音节图和校正。因为算法篇幅较长，就不将头文件展开解析了。直接进入正题。它首先是对输入队列的n叉树记录对顶点的访问，然后记录对顶点的访问首选拼写类型优先。当graph->vertices[current_pos] =std::min(vertex.sec...

rime输入法初识---data目录输入法配置（三）

Dr_Caesar的博客

11-23

943

2021SC@SDUSC 这是default.yaml文件，使用了python语言编写了它的中英字符切换和快捷键的设置接下来说说小狼毫自带的另一款输入法，明月拼音（luna_pinyin）这是他的字典，明月拼音是繁体字中文输入法，但他支持用户自己通过呢opencc来进行修改他的模块其实和仓颉输入大同小异，但他多是繁体用户词，或者简繁糅杂的用户词而且明月拼音年久失修，在词库拓展上有一定困难，如果想要自由拓展自己的库，可以用opencc-python来自己写脚本，最后放进...

rime输入法初识----sample目录样本与插件分析（一）

Dr_Caesar的博客

11-23

447

2021SC@SDUSC 首先我们要知道sample目录是进行样例和插件管理的，他可以让你的小狼毫输入法进行个性化设计的代码基础。他最简单地存储着一些杂项文件和测试案例。 src下文件 RimeTraits::modules 中指定的模块。模块也可以使用 C++ API rime::LoadModules() 按需加载。加载模块时，运行 rime_sample_initialize() 函数，该函数注册一个组件 trivial_translator。该组件现在可用于 Rime 模式中的处方。

RIME 必知必会

何亮5083的博客

12-17

2804

RimeWithSchemata 方案定义要让Rime实现某种具体输入法的功能，就需要一些数据来描述这种输入法以何种形式工作。即，定义该输入法的【个性】。如「汉语拼音」、「注音」、「仓颉码」、「五笔字型」，这些方法可凭借Rime提供的通用设施、给定不同的工作参数来实际操作。以本文介绍的规格写成一套套的配方，就是 Rime 输入方案。 Rime with Text Files 文本为王。Rime的配置文件、输入方案定义及词典文件，均为特定格式的文本文档。因此，一款够专业的文本编辑器，是设计Rime输入方

Rime输入法使用说明

L_Ferris的博客

09-30

6494

1.从rime官网[https://rime.io]下载安装包，先进入官网，长这样： .画圈的两个地方，随便点进去,进入下载界面： ·如果是在官网主页点的下面的小狼毫标志，那么是自动下载的。如果是点的上面的下载标志，才会进入自己选择安装包的这个界面。 1.安装傻瓜式安装，记住最重要的一点，一点要闭着眼一路“确定”点下去！ 2.安装完毕，切换到刚刚安装成功的小狼毫输入法，就可以使用自带的输入法打字了默认效果：竖排，候选字个数5，有一个默认皮肤，shift切换中英文输入，大写键..

先立后破：Linux 下“新建管理员 → 验证 → 禁用 root 远程 SSH”的零翻车笔记

weixin_45626288的博客

12-12

552

本文提供了一套零风险的Linux服务器安全加固流程，重点解决等保2.0要求的"禁用root远程SSH"需求。通过"先立后破"原则，先创建并验证新管理员账号的sudo权限，再禁用root远程登录，全程保持root会话不断开作为应急通道。关键步骤包括：创建新管理员账号、配置sudo权限、严格测试新账号功能、安全修改sshd配置、保留本地root登录权限等。文章特别强调验证环节的重要性，并提供了快速回滚方案，确保运维人员不会因配置失误导致服务器失联。这套方法适用于Kylin

Linux字符串处理

最新发布

HZero

12-16

255

在Linux内核中，字符串处理函数与用户空间的C标准库类似，但为适应内核环境做了优化和调整。

linux 系统中 Shutting Down, Restarting, Halting 有什么区别？

xiaochong0302的博客

12-12

362

Linux 提供了各种命令来执行不同类型的系统关闭。然而，用于指代这些关闭类型的术语可能会让人困惑，尤其是对 Linux 新用户来说。在本文中，我们将讨论关闭、重启和停止之间的区别，以及何时使用这些命令。

深度解析：Linux ISO引导配置与安装模式设计

tianyuanwo的专栏

12-15

809

Linux安装介质采用双引导体系，通过isolinux/isolinux.cfg（Legacy BIOS）和EFI/BOOT/grub.cfg（UEFI）两个配置文件实现兼容性引导。isolinux.cfg使用SYSLINUX加载程序，包含内核参数和安装选项；grub.cfg则采用GRUB2规范，支持UEFI特有命令如linuxefi。两者通过不同方式加载内核和initrd，最终启动安装程序。用户可扩展安装选项，如添加调试参数或自定义安装模式，并通过QEMU验证引导流程。完整的引导过程涉及固件初始化、引导加

linux: gdb调试器

加油！

12-12

587

本文介绍了Linux命令行调试工具GDB的基本使用方法。首先说明了GDB在纯命令行环境中的重要性，并解释了core文件的作用及其配置方法。通过一个存在除零错误的示例代码，详细演示了GDB调试流程：包括编译时添加-g选项、设置断点、运行程序、单步执行（step/next）、查看变量（print/watch）、处理库函数跳转（finish）等核心操作。文章还对比了逐语句(s)和逐过程(n)的区别，并提供了常用调试命令速查表，如查看断点(infob)、删除断点(delete)、查看调用栈(bt)等。最后指出GDB

从ext4文件系统到Linux文件树

weixin_28673511的博客

12-12

742

Linux一切皆文件，Linux文件系统架构非常复杂，希望本文能够帮助你进一步了解Linux文件。

Linux下Mamba-YOLO复现

weixin_45755222的博客

12-15

301

本文提供了在Linux+CUDA12.4环境下复现Mamba-YOLO项目的详细指南。关键步骤包括：克隆项目代码、创建Python3.11的Conda环境、安装PyTorch2.3.0(CUDA12.1版本)、安装依赖包、编译selective_scan模块(需注意解决torch模块缺失问题)以及最终安装项目。文章还分享了常见报错解决方案，如RuntimeError和ModuleNotFoundError等。整个过程经过作者一周的实践验证，可帮助开发者避免重复踩坑。

RIME-CNN-GRU-Attention算法提升多变量时间序列预测性能

资源摘要信息:"RIME-CNN-GRU-Attention霜冰算法优化多变量时间序列预测" 在深度学习领域，时间序列预测是机器学习应用中的一个重要分支。本资源提供了一个使用Matlab实现的RIME-CNN-GRU-Attention霜冰算法的优化...