- 博客(6)
- 收藏
- 关注
原创 domain-specific kg
domain-specific KG construction for semantic analysis 论文笔记论文地址abstract目前的大规模通用KG如wikipedia之类并不完整,无法正常获取数据的语义信息,尤其在特定领域,因为训练数据的缺乏、语义歧义及缺乏代表性的本体等,自动化构建大规模通用KG的方法常常失效。本文以文化遗产领域为例,尝试解决构建领域本体,自动化构建知识图谱。在文化遗产领域构建KG的过程中,主要的挑战在于:通用的NER方法在识别该领域的实体时常常失效;艺术品的t
2021-04-20 10:20:41
133
原创 stanfordsegment添加自定义词典
stanford添加自定义词典下载 stanford-segmenter-2018-10-16命令行 运行java -mx1g -cp stanford-segmenter-3.9.2.jar edu.stanford.nlp.ie.crf.CRFClassifier -sighanCorporaDict data -loadClassifier data/ctb.gz -testFile preprocess-$1.txt -inputEncoding UTF-8 -sighanPostProces
2020-11-13 13:22:36
289
原创 deepdive抽取实体
deepdive抽取1 修改db.url路径 改为自己的数据库名2 deepdive load articles input/hm.tsv 导入数据文件3 deepdive do (app.ddlog中定义的函数)如articles、sentences,每一步后可在数据库中查看是否成功4 若需要先清空表中数据 postgres命令 truncate table articles; 否则 重复deepdive导入会增加数据,不会擦除之前的导入nlp工具后,sbt/sbt stage生效,
2020-11-13 13:20:38
274
1
原创 知识表示|knowledge Representation learning:A Review
知识表示基本概念表示学习的目标是通过机器学习将研究对象的语义信息表示为稠密低维实值向量。更简单的数据表示one-hot,缺点是在one-hot表示空间中,所有对象向量都是相互正交的,语义相似度均为0.不符合实际。表示学习的理论基础表示学习得到的低维向量表示是一种分布式表示。孤立地看向量中的每一维,都没有明确含义,而综合各维形成一个向量,则能表示对象的语义信息。这些实体是离散的、有明显的界限(人脑神经元激活和抑制存储这些对象),并存在层次结构(一个由更小的对象组成)分布式表示
2020-07-25 21:45:02
1217
原创 论文笔记| Deflecting Adversarial Attacks with Pixel Deflection 对抗样本 防御方法
# pixel deflection 笔记## 1.方法概要随机提取图像中的像素点,以r边心距来替换像素点周围的像素。发现在干净的原图上,原始正确分类并未受到影响,而对于带有对抗样本的图,打乱像素能够使得分类重回正确。大多数攻击都是在整个图像中搜索扰动,不考虑图像内容的位置,而分类器在存在对象的区域中激活率更高。 lou等使用了对象坐标掩饰背景区来防御。针对luo的方法局限性(一是需要坐标作为ground-truth;二是背景全部隐去有损分类效果,分类器对特征物和背景同时出现的依赖),解决方法:采.
2020-05-18 22:32:23
1174
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人