Qwerty Learner 词库格式详解:JSON结构与字段说明
Qwerty Learner 作为一款为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件,其核心功能依赖于结构化的词库文件。本文将详细解析词库的JSON格式规范,帮助用户理解文件结构、字段含义及扩展方法,轻松打造个性化词库。
词库文件基础信息
Qwerty Learner 的词库文件统一存储在项目的 public/dicts 目录下,采用 UTF-8 编码的 JSON 格式。所有词库文件均以 .json 为扩展名,命名遵循 词汇类型+难度/来源 的规则,例如:
- CET4_T.json:大学英语四级词汇
- 4000_Essential_English_Words-sentence.json:4000核心英语单词(带例句版)
- Python-builtin.json:Python内置函数词汇
词库文件总量超过150个,涵盖英语、日语等多语种,覆盖从小学到雅思、托福等各阶段学习需求,以及编程术语等专业领域词汇。
核心JSON结构
词库文件采用JSON数组作为顶层结构,数组中的每个元素代表一个词汇条目,标准结构如下:
[
{
"name": "单词/术语",
"trans": ["释义1", "释义2"],
"usphone": "美式音标",
"ukphone": "英式音标"
},
// 更多词汇条目...
]
字段详细说明
| 字段名 | 数据类型 | 描述 | 必要性 | 示例值 |
|---|---|---|---|---|
| name | 字符串 | 词汇主体(英文/术语) | 必需 | "abandon" |
| trans | 字符串数组 | 中文释义(支持多释义) | 必需 | ["放弃", "遗弃"] |
| usphone | 字符串 | 美式发音音标(KK音标) | 可选 | "ə'bændən" |
| ukphone | 字符串 | 英式发音音标(DJ音标) | 可选 | "ə'bændən" |
扩展字段
部分词库根据功能需求扩展了字段:
- 例句版词库(如
4000_Essential_English_Words-sentence.json):trans字段存储英文例句{ "name": "abandon", "trans": ["The crew abandoned the sinking ship."], "usphone": "ə'bændən" } - 专业术语库(如
python-builtin.json):可能包含category字段标注术语分类
多类型词库对比分析
1. 标准词汇库(以CET4_T.json为例)
这类词库专注于基础词汇学习,包含完整的发音信息和多释义支持,适合单词记忆训练:
{
"name": "abundant",
"trans": ["丰富的", "充裕的"],
"usphone": "ə'bʌndənt",
"ukphone": "ə'bʌndənt"
}
2. 例句版词库(以4000_Essential_English_Words-sentence.json为例)
通过在 trans 字段中存储英文例句,强化语境记忆,适合中高级学习者:
{
"name": "abandon",
"trans": ["The sailors abandoned the burning ship."],
"usphone": "ə'bændən",
"ukphone": "ə'bændən"
}
3. 专业术语库(以SQL_statement_upper-case.json为例)
针对编程等专业领域,优化了术语拼写规范,部分词库会省略发音字段:
{
"name": "SELECT",
"trans": ["查询语句", "选择"]
}
词库验证与错误处理
为确保词库文件能被Qwerty Learner正确解析,需遵循以下验证规则:
- 结构验证:必须是合法的JSON数组,不允许出现注释
- 字段约束:
name字段不允许为空或包含特殊字符(除连字符和下划线)trans数组至少包含一个释义字符串- 音标字段需使用国际音标符号,不允许包含HTML标签或Markdown格式
推荐使用 JSONLint 脚本检查词库完整性。
自定义词库制作指南
基础步骤
- 创建文件:在
public/dicts目录下新建my-vocab.json - 编写结构:按标准格式添加词汇条目
[ { "name": "QWERTY", "trans": ["标准键盘布局", "英语打字练习基础"], "usphone": "ˈkwɜrti" } ] - 导入使用:在软件的"词库选择"界面即可看到自定义词库
高级技巧
- 批量转换:使用Excel整理词汇表,通过 Online JSON Converter 批量生成JSON
- 发音优化:可从 Forvo 获取准确音标
- 例句添加:参考 4000_Essential_English_Words-sentence.json 格式添加场景化例句
词库应用场景
1. 单词记忆训练
软件会读取 name 和 trans 字段,在打字练习过程中同步显示单词与释义,配合 usphone/ukphone 字段实现发音矫正,形成"听-说-写"三维一体的记忆效果。
2. 肌肉记忆培养
针对编程术语词库(如 python-builtin.json),软件通过高频重复训练,帮助用户形成键盘输入的肌肉记忆,提升编码效率。
3. 多语种学习
日语词库(如 JapVocabList.N3.json)采用相同JSON结构,只需将 trans 字段替换为日语释义,即可扩展多语种学习功能。
词库维护与更新
Qwerty Learner 社区持续维护官方词库,用户可通过以下方式获取更新:
- 关注项目 README.md 的更新日志
- 参与 docs/CONTRIBUTING.md 中的词库贡献计划
- 定期同步官方仓库的
public/dicts目录
建议每季度更新一次词库文件,以获取最新的词汇表和功能支持。
常见问题解答
Q: 词库文件过大导致加载缓慢怎么办?
A: 可按主题拆分词库,例如将 "CET4_T.json" 拆分为 "CET4_T_1.json"(A-G)、"CET4_T_2.json"(H-O)等小文件,软件支持多词库并行加载。
Q: 如何添加自定义发音音频?
A: 当前版本暂不支持音频文件,但可通过 usphone 字段的音标,配合软件内置的TTS引擎实现发音功能。
Q: 能否导入Anki的.apkg词库?
A: 需通过第三方工具(如 Anki to JSON converter)转换格式,提取字段映射到Qwerty Learner的JSON结构。
通过本文的解析,您已掌握Qwerty Learner词库的核心规范。无论是定制专业术语库,还是优化学习内容,结构化的JSON格式都能满足您的需求。立即动手创建专属词库,让单词记忆效率倍增!
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



