
nlp
文章平均质量分 66
qq_652530495
这个作者很懒,什么都没留下…
展开
-
classification_report指标详解
sklearn的classification_report详解precision、recall 、f1-score这三个基本就不介绍了,主要介绍平均的一些指标micro avg、macro avg、weighted avg、samples avg、accuracy单分类accuracy:正确率,分类正确样本数/总样本数macro avg:用每一个类别对应的precision、recall、f1-score直接平均weighted avg:用每一类别个数的权重乘对应类别指标例子from skle原创 2022-05-18 08:58:10 · 3351 阅读 · 0 评论 -
transformers结构图
processon图片地址原创 2022-04-05 10:03:03 · 386 阅读 · 0 评论 -
kmeans算法python实现(iris数据集)
首先从sklearn里面载入iris数据集如下所示Sepal_Length Sepal_Width Petal_Length Petal_Width Species0 5.1 3.5 1.4 0.2 01 4.9 3.0 1.4 0.2 02 4.7 3.2...原创 2022-03-21 14:09:04 · 4740 阅读 · 0 评论 -
预训练模型mlm阅读理解任务
bert、roberta、ernie在中文mlm任务上效果查看# -*- coding: utf-8 -*-import torchfrom transformers import BertTokenizer, BertForMaskedLMdef get_mlm_model(list_): ret = [] for path in list_: tokenizer = BertTokenizer.from_pretrained(path) m原创 2022-03-17 14:56:48 · 1426 阅读 · 0 评论 -
大学知识图谱问答
大学知识图谱问答,目前非常简单, 以后可能会更新数据来源于百度百科及一些其他网页搜索内容复制,scrapy爬虫目录在scripts/univer/目录下然后将数据存储到neo4j中 对问题进行解析通过actree得到实体,关键字得到问题类型,给出答案目前neo4j结构1.1 知识图谱实体关系类型实体类型实体数量举例大学2735清华大学,北京大学大学简称3128北大,兰大城市481河北省,北京市主管单位84陕西省教育厅层次3211原创 2022-03-10 16:48:34 · 4671 阅读 · 0 评论