
论文阅读笔记
文章平均质量分 93
好记性不如烂笔头
qq_45877696
这个作者很懒,什么都没留下…
展开
-
论文阅读笔记:基于 TWC_CNN 的藏文文本分类技术研究【2022】
藏文的基本单位是基本构件,基本构件组合成字丁,字丁组成藏文的字。藏文的文本从小到大依次是基本构件级、字丁级、字级、词级、短语级、句级。原创 2023-11-06 17:38:10 · 347 阅读 · 1 评论 -
论文阅读笔记:基于预训练模型和图神经网络的藏文文本分类研究【2023】
本文提出一种真对藏文长文本分类的方法CINO-GCN,通过微调与训练语言模型CINO作为嵌入层,获得藏文文档和音节的特征表示,然后根据整个数据集的音节共现关系和文档间的TF-IDF值对藏文文本图进行建模,与CINO生成的结点特征输入到图卷积神经网络(GCN)做进一步的特征提取,最后通过softmax得到分类结果。原创 2023-10-30 17:09:29 · 666 阅读 · 0 评论 -
论文阅读笔记:End-to-End Neural Text Classification for Tibetan【2017】
提出一个藏文文本分类模型,代码及其数据均是公开的。首次不使用任何外部NLP工具,利用端到端的神经网络模型对藏文本本实现分类任务;公开了数据集和代码【难得】原创 2023-10-24 15:44:48 · 180 阅读 · 0 评论