55、基于隐马尔可夫模型的孔卡尼语词性标注及体育文章生成研究

基于隐马尔可夫模型的孔卡尼语词性标注及体育文章生成研究

基于隐马尔可夫模型的孔卡尼语词性标注

词性标注(PoS tagging),即给句子中的每个单词标注词性,也被称为词类消歧或语法标注。词性标注的方法有很多,包括隐马尔可夫模型(HMM)、支持向量机(SVM)、决策树、最大熵、条件随机场(CRF)和深度学习等。

在孔卡尼语词性标注方面,此前已有不少研究。例如,有使用NLTK工具包和50,000个孔卡尼语句子语料库的HMM词性标注器,其准确率为73.82%;还有使用不同领域句子构建的词性标注器,在不同测试集上展现出不同的准确率。

为了对孔卡尼语词性标注实验进行评估,我们先了解下其他印度语言使用HMM进行词性标注的情况,如下表所示:
| 序号 | 语言 | 数据集大小(单词) | 性能指标准确率(%) |
| ---- | ---- | ---- | ---- |
| 1 | 孟加拉语 | 100,000 | 89.00 |
| 2 | 阿萨姆语 | 271,890 | 89.21 |
| 3 | 僧伽罗语 | 90,551 | 90.00 |
| 4 | 旁遮普语 | 26,479 | 90.11 |
| 5 | 马拉雅拉姆语 | 15,245 | 90.50 |
| 6 | 泰卢固语 | 211,357 | 91.23 |
| 7 | 曼尼普尔语 | 2000 | 92.00 |
| 8 | 古吉拉特语 | 351 | 92.87 |
| 9 | 印地语 | 15,562 | 93.45 |
| 10 | 马拉地语 | 25,744 | 93.82 |

源码来自:https://pan.quark.cn/s/fdd21a41d74f 正方教务管理系统成绩推送 简介 使用本项目前: 早晨睡醒看一遍教务系统、上厕所看一遍教务系统、刷牙看一遍教务系统、洗脸看一遍教务系统、吃早餐看一遍教务系统、吃午饭看一遍教务系统、睡午觉前看一遍教务系统、午觉醒来看一遍教务系统、出门前看一遍教务系统、吃晚饭看一遍教务系统、洗澡看一遍教务系统、睡觉之前看一遍教务系统 使用本项目后: 成绩更新后自动发通知到微信 以节省您宝贵的时间 测试环境 正方教务管理系统 版本 V8.0、V9.0 如果你的教务系统页面与下图所示的页面完全一致或几乎一致,则代表你可以使用本项目。 目前支持的功能 主要功能 每隔 30 分钟自动检测一次成绩是否有更新,若有更新,将通过微信推送及时通知用户。 相较于教务系统增加了哪些功能? 显示成绩提交时间,即成绩何时被录入教务系统。 显示成绩提交人姓名,即成绩由谁录入进教务系统。 成绩信息按时间降序排序,确保最新的成绩始终在最上方,提升用户查阅效率。 计算 计算百分制 对于没有分数仅有级别的成绩,例如”及格、良好、优秀“,可以强制显示数字分数。 显示未公布成绩的课程,即已选课但尚未出成绩的课程。 使用方法 Fork 本仓库 → 开启 工作流读写权限 → → → → → 添加 Secrets → → → → → → Name = Name,Secret = 例子 程序会自动填充 尾部的 ,因此你无需重复添加 对于部分教务系统,可能需要在 中添加 路径,如: 开启 Actions → → → 运行 程序 → → 若你的程序正常运行且未报错,那么在此之后,程序将会每隔 30 分钟自动检测一次成绩是否有更新 若你看不懂上述使用...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值