
knowledge
文章平均质量分 57
YJII
这个作者很懒,什么都没留下…
展开
-
高引论文汇总
123456910。原创 2022-11-04 20:39:38 · 514 阅读 · 0 评论 -
依存句法分析整理续
依存语法理论认为词与词之间存在主从关系,这是一种二元不等价的关系。在句子中,如果一个词修饰另一个词,则称修饰词为。。语义依存分析:分析句子各个语言单位之间的语义关联,并将语义关联以依存结构呈现。使用语义依存刻画句子语义,好处在于丌需要去抽象词汇本身,而是通过词汇所承受的语义框架来描述该词汇,而论元的数目相对词汇来说数量总是少了很多的。语义依存分析目标是跨越句子表层句法结构的束缚,直接获取深层的语义信息。原创 2022-10-26 20:51:11 · 1165 阅读 · 0 评论 -
句法树结构+hinge loss_相似度论文调研-2
我理解的句法依存树主要分析的是句子成分之间的依赖关系,比如“主谓关系”,“定中关系”等等,根据的是词与词之间的依赖关系结构,得到树。需要注意的是,不同论文中可能定义的转移方法是不同的,可能最一开始的栈是空的,或者是存放了虚根的,具体要根据论文而定。我理解的短语依存树更多地是依靠:“句法规则”,比如名词+名词==名词短语这种语法规则,解析形成的树状结构。非常 非常 A AD _ 3 advmod _ _长 长 V VA _ 3 conj _ _是 是 V VC _ 7 conj _ _原创 2022-10-23 10:49:09 · 462 阅读 · 0 评论 -
博士论文——相似度
参考国内外已有的知识库系统,构建B化结构的肝炎疾病知识库系统遵选本体构建方法,探讨肝炎疾病本体构建过程和关键步躁,利用常用的本体构建工具,实现肝炙本体构建本文提出了基于肝炎本体的扩展查询方案,通过同义词扩展、上/下位词扩展、近似词扩展方法进行语义相似度分析,从而提高了肝炎信息检索的准确率。在肝义本体的基础上,针对疾病诊断名称短文本进行语义分析,探讨语义分析算法,为临床ICD-10编码业务提供新的解决方法。原创 2022-10-19 16:59:07 · 409 阅读 · 0 评论 -
csdn文件打印下载
进入控制台,输入如下,打印即可。原创 2022-10-18 21:36:04 · 180 阅读 · 0 评论 -
字符编码的常见形式
原文链接:https://blog.youkuaiyun.com/qq_43192819/article/details/108981008。版权声明:本文为优快云博主「柠 檬没我萌」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。Python3的str 默认不是bytes,所以不能decode,只能先encode转为bytes,再decode。所以str.decode 本质是bytes类型的str的decode。解码decode,就是吧一堆机器认识的,解释为人能读懂的。原创 2022-10-12 09:13:14 · 310 阅读 · 0 评论 -
大规模数据聚类算法
二是采用其他占用内存较小的变量来代替原数据集中的多个样本,这样就有可能把所有数据样本的替代变量放入内存中,如文献【7】、【8】采用向量或者矩阵来替代原始数据,但是因为仅通过替代变量不能区分其所替代的样本,因而在某些情况将影响到聚类的效果。它能增量的,动态的对输入的多维度数据在给定有限的内存和时间条件的情况下进行高质量 的聚类。区别就在于:常见的聚类一般是假设任何对象之间都是连接的,只是距离(或者相似度)不同,比如划分、层次、密度聚类等,如果看作是一张图,那就是完全联通图,当然图聚类除外。原创 2022-10-10 11:37:24 · 4665 阅读 · 0 评论 -
知识问答之初步入门-2
传统方式是基于语义规则的方法,深度学习方法是query和question的相似度计算。负样本构建手段——需要一些高质量的负样本(一般就是和原有问题答案相似度较高的)对于问答——我觉得重点还是不应该放在这里,主要是传统和深度学习方法的结合。原创 2022-09-19 16:05:03 · 161 阅读 · 0 评论 -
知识问答之信息检索-1
Sparse Retriever使用经典的IR方法来搜索相关文档,例如TF-IDF和BM25等,这些传统检索方法使用稀疏表示来衡量术语匹配,因此将其称为Sparse Retriever。版权声明:本文为优快云博主「北在哪」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.youkuaiyun.com/qq_43183860/article/details/121381192。原创 2022-09-19 14:52:53 · 448 阅读 · 0 评论 -
KNN分类算法
是机器学习算法的一种。在分类时,选择距离预测点最近的前K个点,作为判断预测点类别的依据。距离的计算:可以采用等等。举个例子。1、有下面的图片中的数据推测《唐人街探案》属于那种电影类型。movie_data = {“宝贝当家”: [45, 2, 9, “喜剧片”],“美人鱼”: [21, 17, 5, “喜剧片”],“澳门风云3”: [54, 9, 11, “喜剧片”],“功夫熊猫3”: [39, 0, 31, “喜剧片”],“谍影重重”: [5, 2, 57, “动作片”],...原创 2022-08-18 20:09:41 · 605 阅读 · 0 评论 -
NER实体识别工具(中文)
怎么谈?感觉这些NER工具都是面向的是通用领域,训练语料质量残差不齐,不要抱太大希望可以直接用在specific field。我实验的这几个中,感觉是spacy还算是好用一些的,剩下的一般吧。总结下的话,质量真不咋地。。。试验文件在github存放。...原创 2022-06-22 19:45:50 · 479 阅读 · 0 评论 -
肝炎数据集分析
数据集地址github地址:githttps://archive.ics.uci.edu/ml/datasets/Hepatitis原创 2022-06-20 09:32:39 · 866 阅读 · 0 评论 -
科技信息检索
H 指数越高,说明作者发表了很多有影响力的文献H5指数是按照期刊来出版的Hiscite中的四个指数中的两个:LCS在该领域内引用的比较多,(从被引出发,指数越高,说明文献在该领域内有影响力)LCR:可能文章是比较新的,但是,我创作的时候引用了很多的参考文献,LCR说明的是研究领域的相似度(从参考文献出发,说明领域的相似度,指数越高,研究领域越相近)...原创 2022-03-28 13:56:23 · 355 阅读 · 0 评论 -
DAC(2)
Fault: Open-Source EDA’s Missing DFT Toolchain测试模式生成,其目的是找到一组能够检测故障电路的输入序列。测试模式生成是一个复杂的过程,需要优化两个主要方面:1)测试应用的成本(与测试时间成比例)和2)测试的质量(覆盖率)。本质上,自动测试模式生成(ATPG)软件是旨在最大限度地减少生成的测试向量(TV)的数量(从而减少测试花费的时间),同时最大限度地增加覆盖的故障点的数量,以确保在测试中覆盖尽可能多的缺陷。商业可测试性设计(DFT)工具链可用,但开源DFT工具原创 2022-02-11 15:29:43 · 285 阅读 · 0 评论 -
DAC会议2021
Analog IC Aging-induced Degradation Estimation via Heterogeneous Graph Convolutional Networks基于异质图卷积网络的模拟集成电路老化退化估计随着规模的不断扩大,热载流子注入和偏置温度不稳定导致的晶体管老化导致纳米级集成电路(IC)逐渐失效。为了描述多类型设备和连接端口,本文采用了一种异构有向多重图来有效地表示模拟IC后布局网表。我们研究了一种异构图卷积网络(H-GCN)来快速准确地估计老化引起的晶体管退化。在所提出原创 2022-02-06 14:55:35 · 3448 阅读 · 0 评论 -
【无标题】
《科学事件知识图谱构建研究》定义科学事件、科学元事件的定义目标:从知网摘要中抽取(主谓宾)作为三元组,存储到NEO4j数据库中。定义一个“元事件”是由三部分组成:Subject(加菲尔德)———Action(提出)———Object(引文索引概念)在构建知识图谱之前,首先要需要进行知识建模,即根据数据构建知识图谱的元数据模型。 《自然灾害应急知识图谱构建方法研究》围绕自然灾害事件、灾害应急任务、灾害数据、模型方法4个要素,自顶向下构建模式层,通过本体建模形成知识图谱的概念框架;自底向上构建数据层原创 2022-01-15 10:17:06 · 701 阅读 · 0 评论 -
机器学习笔记1_J
神经网络模型训练笔记在李宏毅老师的课程中,笔记如下:训练模型会出现梯度不在下降的问题,但多有可能不是最低值引起的,而是critical point ,包括鞍点和最低点,;另外,在梯度左右晃动时,可能是出现在了峡谷里,而且learning rate设置不太妥当,导致。overfitting一般是由于模型弹性较大,而数据较少引起的,观察的方式比较train data的loss和test data的loss,如果trainloss下降而testloss上升,则说明是overfitting了,可以采取增加数据原创 2022-01-11 22:11:02 · 188 阅读 · 0 评论