印尼浅词干提取器与知识产权在线教育系统
1. 印尼浅词干提取器实验结果
在实验中,对有无字典的情况进行了对比,以评估印尼浅词干提取器的性能。以下是第二次实验的结果:
| 情况 | 正确比例 | 平均候选词数量 |
| ---- | ---- | ---- |
| 无字典 | 100% (500) | 1.5 (759 个候选词) |
| 有字典 | 95.0% (475) | 1.1 (525 个候选词) |
这里,“有字典”代表所使用的算法,“无字典”作为对比的基线系统。从正确答案比例来看,系统得分略低于基线系统,但差距不大。而在平均候选词数量方面,系统表现约好 1.5 倍。这表明系统能为大多数基础词生成正确结果,并且使用字典可以减少候选词数量。
2. 文本阅读支持系统流程
文本阅读支持系统由客户端和服务器端组成。客户端作为用户界面,服务器端可将各种信息附加到原文上。具体流程如下:
graph LR
A[学习者输入或粘贴文本] --> B[通过 CGI 发送到 WWW 服务器主程序]
B --> C[主程序过滤文本]
C --> D[印尼浅词干提取器分解文本为单词组件]
D --> E[学习者阅读带有信息的文本]
在当前版本中,当学习者将鼠标光标放在文本中的单词上时,单词下方会弹出一个显示信息的小窗口。系统使用印尼基础字典 CICC 作为词根信息来源,特别是其中的印尼主字典(IMD),它包含约 17,000 个词条,每个词条有头概念、对应词
印尼词干提取与知识产权教育系统
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



