NLPCC数据集:2014年:http://tcci.ccf.org.cn/conference/2014/pages/page04_dg.html
1.中文微博文本中的情感分析
2.情感分类与深度学习
3.中文实体链接
4.跨语言知识链接
5.大规模英语问答
6.大规模中文新闻分类
2015年:http://tcci.ccf.org.cn/conference/2015/pages/page05_evadata.html
1.微博文本的中文分词与词性标注
2.开放域问答
3.中文搜索查询中的实体识别与链接
4.面向微博的中文新闻摘要

这篇博客详细列举了NLPCC从2014年至2019年的数据集,涵盖了中文文本情感分析、分词、词性标注、开放域问答、实体识别与链接等多个自然语言处理任务。每年的数据集重点不同,例如2014年涉及情感分类与深度学习,而2019年则包括跨域依赖解析和开放域语义分析等挑战。
最低0.47元/天 解锁文章
898

被折叠的 条评论
为什么被折叠?



