印尼浅词干提取器与知识产权在线教育系统
1. 印尼浅词干提取器实验结果
在对印尼浅词干提取器的研究中,进行了相关实验以评估其性能。以下是第二次实验的结果:
| 情况 | 正确比例 | 平均候选词数量 |
| — | — | — |
| 无词典 | 100% (500) | 1.5 (759 个候选词) |
| 有词典 | 95.0% (475) | 1.1 (525 个候选词) |
这里,“有词典”代表所采用的算法,“无词典”作为对比的基线系统。从实验结果来看,系统平均每个词产生 1.1 个候选词,并且能对 95.0% 的词进行正确的词干提取。在正确答案比例方面,系统比基线系统略低,但差距不大;而在平均候选词数量上,系统的表现约好 1.5 倍。这表明系统能够为大多数基础词产生正确结果,并且使用词典可以减少候选词的数量。
2. 文本阅读理解支持系统
文本阅读系统由客户端和服务器端两部分组成。客户端作为用户的界面,服务器端则可以为原始文本附加各种信息。其工作流程如下:
1. 学习者输入或粘贴想要阅读和理解的文本。
2. 文本通过 CGI 发送到 WWW 服务器上的主程序。
3. 主程序对输入文本进行过滤,去除句子中不必要的空格和字符,并合并句子片段。
4. 过滤后的文本由印尼浅词干提取器分解成单词组件,以便后续流程提取信息并附加。
5. 学习者可以阅读带有附加信息的文本,从而更方便地理解单词。
在当前版本中,如果学习者将鼠标光标放在文本中的某个单词上,该单词下方会弹出一个显示信息的小窗口。系统使用印尼基础词典 CICC 作为词根信息的来源,该词典分为
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



