Qwerty Learner 词库格式详解：JSON结构与字段说明-优快云博客

Qwerty Learner 词库格式详解：JSON结构与字段说明

【免费下载链接】qwerty-learner 为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件 / Words learning and English muscle memory training software designed for keyboard workers 项目地址: https://gitcode.com/RealKai42/qwerty-learner

Qwerty Learner 作为一款为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件，其核心功能依赖于结构化的词库文件。本文将详细解析词库的JSON格式规范，帮助用户理解文件结构、字段含义及扩展方法，轻松打造个性化词库。

词库文件基础信息

Qwerty Learner 的词库文件统一存储在项目的 public/dicts 目录下，采用 UTF-8 编码的 JSON 格式。所有词库文件均以 .json 为扩展名，命名遵循 词汇类型+难度/来源 的规则，例如：

CET4_T.json：大学英语四级词汇
4000_Essential_English_Words-sentence.json：4000核心英语单词（带例句版）
Python-builtin.json：Python内置函数词汇

词库文件总量超过150个，涵盖英语、日语等多语种，覆盖从小学到雅思、托福等各阶段学习需求，以及编程术语等专业领域词汇。

核心JSON结构

词库文件采用JSON数组作为顶层结构，数组中的每个元素代表一个词汇条目，标准结构如下：

[
  {
    "name": "单词/术语",
    "trans": ["释义1", "释义2"],
    "usphone": "美式音标",
    "ukphone": "英式音标"
  },
  // 更多词汇条目...
]

字段详细说明

字段名	数据类型	描述	必要性	示例值
name	字符串	词汇主体（英文/术语）	必需	"abandon"
trans	字符串数组	中文释义（支持多释义）	必需	["放弃", "遗弃"]
usphone	字符串	美式发音音标（KK音标）	可选	"ə'bændən"
ukphone	字符串	英式发音音标（DJ音标）	可选	"ə'bændən"

扩展字段

部分词库根据功能需求扩展了字段：

例句版词库（如 4000_Essential_English_Words-sentence.json）：trans 字段存储英文例句

{
  "name": "abandon",
  "trans": ["The crew abandoned the sinking ship."],
  "usphone": "ə'bændən"
}

专业术语库（如 python-builtin.json）：可能包含 category 字段标注术语分类

多类型词库对比分析

1. 标准词汇库（以CET4_T.json为例）

这类词库专注于基础词汇学习，包含完整的发音信息和多释义支持，适合单词记忆训练：

{
  "name": "abundant",
  "trans": ["丰富的", "充裕的"],
  "usphone": "ə'bʌndənt",
  "ukphone": "ə'bʌndənt"
}

2. 例句版词库（以4000_Essential_English_Words-sentence.json为例）

通过在 trans 字段中存储英文例句，强化语境记忆，适合中高级学习者：

{
  "name": "abandon",
  "trans": ["The sailors abandoned the burning ship."],
  "usphone": "ə'bændən",
  "ukphone": "ə'bændən"
}

3. 专业术语库（以SQL_statement_upper-case.json为例）

针对编程等专业领域，优化了术语拼写规范，部分词库会省略发音字段：

{
  "name": "SELECT",
  "trans": ["查询语句", "选择"]
}

词库验证与错误处理

为确保词库文件能被Qwerty Learner正确解析，需遵循以下验证规则：

结构验证：必须是合法的JSON数组，不允许出现注释
字段约束：
- name 字段不允许为空或包含特殊字符（除连字符和下划线）
- trans 数组至少包含一个释义字符串
- 音标字段需使用国际音标符号，不允许包含HTML标签或Markdown格式

推荐使用 JSONLint 脚本检查词库完整性。

自定义词库制作指南

基础步骤

创建文件：在 public/dicts 目录下新建 my-vocab.json

编写结构：按标准格式添加词汇条目

[
  {
    "name": "QWERTY",
    "trans": ["标准键盘布局", "英语打字练习基础"],
    "usphone": "ˈkwɜrti"
  }
]

导入使用：在软件的"词库选择"界面即可看到自定义词库

高级技巧

批量转换：使用Excel整理词汇表，通过 Online JSON Converter 批量生成JSON
发音优化：可从 Forvo 获取准确音标
例句添加：参考 4000_Essential_English_Words-sentence.json 格式添加场景化例句

词库应用场景

1. 单词记忆训练

软件会读取 name 和 trans 字段，在打字练习过程中同步显示单词与释义，配合 usphone/ukphone 字段实现发音矫正，形成"听-说-写"三维一体的记忆效果。

2. 肌肉记忆培养

针对编程术语词库（如 python-builtin.json），软件通过高频重复训练，帮助用户形成键盘输入的肌肉记忆，提升编码效率。

3. 多语种学习

日语词库（如 JapVocabList.N3.json）采用相同JSON结构，只需将 trans 字段替换为日语释义，即可扩展多语种学习功能。

词库维护与更新

Qwerty Learner 社区持续维护官方词库，用户可通过以下方式获取更新：

关注项目 README.md 的更新日志
参与 docs/CONTRIBUTING.md 中的词库贡献计划
定期同步官方仓库的 public/dicts 目录

建议每季度更新一次词库文件，以获取最新的词汇表和功能支持。

常见问题解答

Q: 词库文件过大导致加载缓慢怎么办？
A: 可按主题拆分词库，例如将 "CET4_T.json" 拆分为 "CET4_T_1.json"（A-G）、"CET4_T_2.json"（H-O）等小文件，软件支持多词库并行加载。

Q: 如何添加自定义发音音频？
A: 当前版本暂不支持音频文件，但可通过 usphone 字段的音标，配合软件内置的TTS引擎实现发音功能。

Q: 能否导入Anki的.apkg词库？
A: 需通过第三方工具（如 Anki to JSON converter）转换格式，提取字段映射到Qwerty Learner的JSON结构。

通过本文的解析，您已掌握Qwerty Learner词库的核心规范。无论是定制专业术语库，还是优化学习内容，结构化的JSON格式都能满足您的需求。立即动手创建专属词库，让单词记忆效率倍增！

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考