
相似度
文章平均质量分 76
YJII
这个作者很懒,什么都没留下…
展开
-
条件语义相似度-CSTS
不同方面去做相似度的评价,语料库的收集上是有一定技巧的,并不是完全从头开始。损失函数构造上的思路,不是很理解,为什么没有设置为多任务形式而是将两个(high&low)的损失值放在一个损失函数里。相似度也是评价角度之一,涉及到评价的,应该将结果单一值转向结果云的形式,其中论文中的条件,就是结果呈现的不同角度。原创 2023-08-08 10:10:31 · 440 阅读 · 0 评论 -
论文复现-1:Perturbation CheckLists for Evaluating NLG Evaluation Metrics
以data2text任务为例,探讨generation metric矩阵对于一些句子扰动是否敏感,在多个维度上的敏感性如何?原创 2022-12-26 10:39:13 · 553 阅读 · 0 评论 -
MoverScore: Text Generation Evaluating with Contextualized Embeddings and Earth Mover Distance
一个欧式距离,一个余弦距离;一个one2one,一个n-gram2one;原创 2022-12-22 17:07:35 · 716 阅读 · 0 评论 -
相似度衡量:苏剑林博客-3
本文主要是对苏剑林老师之前的博客中,对相似度相关的内容稍作整理。原创 2022-12-08 19:30:07 · 1483 阅读 · 0 评论 -
相似度衡量(需复现):苏剑林博客2:Unsupervised Opinion Summarization Using Approximate Geodesics
我觉的这篇论文可以细细研读,针对比较关心的几个问题,给了解决方案,在各向异性,在语义表示上,都提出了一些改进。我觉得可以。可以作为复现论文之一。论文围绕两个问题:1 如何获得较好的语义表示向量?(传统预训练语言模型具有各向异性)2 如何测算语义表示向量之间的相对距离?(基于统计的方法和基于语义的方法)opinion summary:自动化的生成准备的summary从线上用户的评论中。一般是基于无监督的方法。(无标注数据的原因)大致分为两种,一种是general summary,即选择最佳的能够表示s原创 2022-12-07 20:39:16 · 623 阅读 · 1 评论 -
相似度衡量: 苏剑林博客-1
测地线距离(Geodesic Distance):地表上两点之间的最短路径的距离。如下图所示,在二维空间中,两个黑点之间的欧式距离是虚线的长度,测地线距离时d12+d23+d34+d45的距离之和。 在三维空间中,距离是三维空间表面上的两点之间的距离。 相似度论文:Unsupervised Opinion Summarization Using Approximate Geodesics 在计算相似度时,尤其是在文本领域,一般是将语句转为嵌入后,通过距离函数计算两点之间的相似度分值。其中,d()表示距离函数原创 2022-12-07 20:08:02 · 472 阅读 · 0 评论 -
孙海波:重新发现“同案”:构建案件相似性的判断标准
原文链接:http://www.procedurallaw.cn/info/1005/1007.htm为贯彻“各级法院在审理类似案件时应参照指导性案例”的司法原则,推进法官在办案过程中援用具有指导性的先决类案,最高人民法院2020年7月31日发布了《关于统一法律适用加强类案检索的指导意见(试行)》(以下简称《指导意见》),进一步以规范性法律文件的方式将“同案同判”的要求加以制度化,明确在四类特殊情形下承办案件的法官应当检索类案并制作检索报告。不过,该意见只是概括性地提出了判断案件类似性的宏观比较点,比如案件原创 2022-12-07 18:34:52 · 434 阅读 · 0 评论 -
相似度论文再回顾2:数据集相关知识
一般相似度问题出现在:摘要生成任务、对话任务、问答任务中。摘要生成任务即在给定一段原始文本的基础上,生成预设摘要的过程。对话任务即给定对话背景和对话上文的基础上,生成对话下文的过程。问答任务即给定问题的基础上,生成预设答案的过程。在相似度测评中,以摘要生成任务为例。评估一篇摘要的质量,是将机器生成的摘要和预设摘要进行比较的过程,这是一件比较困难的任务。对于一篇摘要而言,很难说有标准答案。不同于很多拥有客观评判标准的任务,摘要的评判一定程度上依赖主观判断。即使在摘要任务中,有关于语法正确性、语言流畅性原创 2022-12-05 10:38:58 · 764 阅读 · 0 评论 -
D2T数据集 —Dialogue (饭店+旅馆restaurants and hotels)
工人们被逐一展示每个对话,并被要求用自然英语输入与每个系统DA对应的适当的系统反应。对于每个领域,我们从大约1,000个随机抽样的对话中收集了大约5,000个系统话语。每个分类值都被一个代表其槽的标记所取代,在一个DA中多次出现的槽被合并为一个。在对每个语料根据其去词汇化的DA进行处理和分组后,我们在餐厅中得到248个不同的DAs和酒店领域的164个。Bastien等人,2012)实现,并通过将每个收集到的语料库按3:1:1的比例划分为训练、验证和测试集进行训练。为了形成每个领域的训练语料库,原创 2022-12-01 14:55:07 · 476 阅读 · 0 评论 -
相似度论文再回顾
人工标注的数据:TO verfify the proposed evaluator is qualifited, we need to calculated correlations with human scores in each benchamark.实验验证:对比model有BLEU、METHOR、ROUGE、Bertscore....多个维度出发评价生成文本的质量,如一致性、流畅度等等。任务形式:summary和dialogue。dataset: wnt 18和wnt 19。原创 2022-12-01 11:34:19 · 452 阅读 · 0 评论 -
大篇幅文件计算相似度
模糊匹配的算法也分为两大类: 方法1:求两个文本 相似度 ,大于某个阈值时,则认为这两个文本一致。方法2:对每个文本按照一定比率 (模糊度)进行信息抽取压缩,生成一串模糊代码 (matchCode),模糊代码近似代表原始文本,模糊代码之间进行 精确匹配 即可。汉明距离是用于测量两个序列之间的编辑距离的几个字符串度量之一。它以美国数学家理查德·海明命名。定义:两个等长的符号串之间的汉明距离是对应符号不同的位置个数。汉明距离(Hamming distance)模糊匹配算法和相似度算法是类似的。原创 2022-11-21 08:36:01 · 272 阅读 · 0 评论 -
相似度系列9: unify USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation
模型特点:multiple model variants。原创 2022-11-15 20:45:52 · 217 阅读 · 0 评论 -
相似度系列8:unify-BARTSCORE: Evaluating Generated Text as Text Generation
在introduction中,介绍背景和research community jobs之后,转到现在的问题上,however …This lead to potential under-utilization of the pretrain model.然后,新的一段,介绍自己的工作.In this paper we ....新的一段,介绍result。第一张图片是在不同top-k的机器翻译系统下,不同metric的性能变化趋势。可以发现,当k增加的时候,BA下降趋势是较为平稳的。原创 2022-11-15 20:36:02 · 891 阅读 · 0 评论 -
相似度系列-7:单维度:Evaluating the Factual Consistency of Abstractive Text Summarization
事实一致性检查。原创 2022-11-15 19:49:08 · 526 阅读 · 0 评论 -
相似度系列-6:单维度方法:Evaluating Coherence in Dialogue Systems using Entailment
摘要部分,写的ok .背景:Evaluating open-domain dialogue systems is difficult to the diversity of possible correct answers.原创 2022-11-15 19:06:08 · 467 阅读 · 0 评论 -
相似度系列-5:语义方法:BERTSCORE: EVALUATING TEXT GENERATION WITH BERT
我觉得这个方法也没有考虑到语序这个因素。在计算时,拆分的会不会有点太散了。token-to-token的相似度加权得到最终相似度。整个chunk的相似度似乎并没有得到很好的利用。word的本身语义信息在利用时,会不会在变换为token后改变了?本文核心:计算reference和candidate中每个token之间的语义相似度(cosine similarity),选择对应的最大的相似度分值,加权得到最终的相似度值。原创 2022-11-14 22:32:39 · 1156 阅读 · 0 评论 -
相似度系列-3:传统方法ROUGE ROUGE: A Package for Automatic Evaluation of Summaries
这两篇文章都是先从“指标项”开始的,比如translation更关注什么指标?summary关注什么指标?一致性、流畅性等等。上一篇是bi-grams这一篇是:P/R/F,longest common sequence有一个核心假设,比如,相同的公共子序列越长,则效果越佳。原创 2022-11-14 21:59:10 · 595 阅读 · 0 评论 -
相似度系列—2传统方法BLEU:BLEU: a Method for Automatic Evaluation of Machine Translation
BLEU还是有一些不足的,虽然考虑了n_grams的匹配数量,但是在句法、单词顺序、同义词方面,考虑的不是很多。后面的改进,而且,他算是单一维度的评价指标吧。虽然在开头提到需要考虑四个维度:连贯性、完整性(一元gram相同的越多时)、流畅度(最长的n_gram越长的时候)…,但在计算中,这四个维度,体现的还不是太好。原创 2022-11-14 20:58:04 · 446 阅读 · 0 评论 -
相似度论文系列-1:入门方法Towards a Unified Multi-Dimensional Evaluator for Text Generation
引出背景:multi-dimensional evaluation is a dominant paradigm for human evaluation in NLG.原创 2022-11-14 20:06:23 · 472 阅读 · 0 评论 -
依存句法分析整理续
依存语法理论认为词与词之间存在主从关系,这是一种二元不等价的关系。在句子中,如果一个词修饰另一个词,则称修饰词为。。语义依存分析:分析句子各个语言单位之间的语义关联,并将语义关联以依存结构呈现。使用语义依存刻画句子语义,好处在于丌需要去抽象词汇本身,而是通过词汇所承受的语义框架来描述该词汇,而论元的数目相对词汇来说数量总是少了很多的。语义依存分析目标是跨越句子表层句法结构的束缚,直接获取深层的语义信息。原创 2022-10-26 20:51:11 · 1165 阅读 · 0 评论 -
相似度:多边视角:2017:Bilateral Multi-Perspective Matching for Natural Language Sentences
以前的方法要么是从单一方向匹配句子,要么只应用单一的粒度(逐字或逐句)匹配。在这项工作中,我们提出了一个。给定两个句子P和Q,我们的模型首先用BiLSTM编码器对它们进行编码。接下来,我们在两个方向上对这两个编码的句子进行匹配,即。在每个匹配方向上,原创 2022-10-23 21:39:21 · 475 阅读 · 0 评论 -
相似度:医学领域:Exploiting Sentence Embedding for Medical Question Answering
MACSE 是一篇针对医学文本的句向量表征工作,虽然其主要关注的是 QA 任务,但他的句向量表征方式在文本相似度任务中同样适用。医学文本区别于通用文本的一大特征就是包含复杂的多尺度信息,如下:论文的核心是如何学习得到融合多尺度信息的网络模型?;论文引入监督学习模块CAMSE将语义编码为嵌入张量,然后提出两种完整的评分策略:语义匹配评分(SMS)和语义关联评分(SAS),以挖掘给定问题与相应证据文档之间的语义相似性和关联性。。原创 2022-10-23 21:26:42 · 879 阅读 · 0 评论 -
相似度_对抗学习:SimCSE: Simple Contrastive Learning of Sentence Embeddings
这篇论文,我觉得有意思。在创造对抗学习的正负例时,正例直接使用它本身。将同一个句子传递给预先训练好的编码器两次:通过应用两次dropout,我们可以得到两个不同的嵌入作为。然后,我们把同一小批中的其他句子作为。我们首先描述了一种无监督的方法,它采用输入句子并在对比性目标中预测自己,只用dropout 的size大小作为噪音。原创 2022-10-23 20:57:28 · 479 阅读 · 0 评论 -
相似度_基于Bert_2019:Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
对预训练的BERT网络进行修改,使用连体和三连体网络结构,得出有语义的句子嵌入,可以使用余弦相似度进行比较。原创 2022-10-23 20:23:02 · 378 阅读 · 0 评论 -
相似度-AAAI16-Siamese Recurrent Architectures for Learning Sentence Similarity
我们向LSTM提供了补充有同义词信息的词嵌入向量,LSTM使用一个固定大小的向量来编码一个句子中所表达的基本含义(不管特定的措辞/语法)。通过限制后续操作以依赖简单的曼哈顿度量,我们迫使我们的模型学到的句子表征形成一个高度结构化的空间,其几何形状反映了复杂的语义关系。在introduction中,论文提到:一个好的模型不应受到用于表达同一观点的不同措辞/语法的影响。原创 2022-10-23 20:08:22 · 706 阅读 · 0 评论 -
相似度论文-Tree_LSTM:Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networ
是使用LSTM表征句法结构树,他的出发点是对序列形式的句法表征的改进,是希望使用LSTM表示句法结构树下的句子表征。(句法结构树不同短语依存树)h_L表示句子对中的左边句子,h_R表示句子对中的右边句子。模型结构在句子相似度评测和情感分类中被测试。更上层的LSTM能够捕捉更长的句法依赖。在句子对的相似度评价任务中,,计算方法。正序下的LSTM和倒序下的LSTM。注意是,hj的计算方法变了。原创 2022-10-23 19:53:25 · 252 阅读 · 0 评论 -
相似度论文-2015-Multi-Perspective Sentence Similarity Modeling with Convolutional Neural Networks
这算是特征工程的一项吧。是对CNN在句子表征中的多个实验。除了注意力没有考虑到,差不多全了。原创 2022-10-23 19:39:55 · 208 阅读 · 0 评论