
模型评估度量
bensonrachel
这个作者很懒,什么都没留下…
展开
-
python—Rouge(Recall-Oriented Understudy for Gisting Evaluation)
匹配文本评估方法。python实现准确率,召回率X表示模型生成的结果,Y表示运营编辑的结果即reference。多reference的情况,取对应每个reference中最大的rouge-l值作为单个测试数据的结果。LCS 表示最长公共子串。# coding:utf-8''''''import math#输入的两个字符串长度不应为0;def Recall_lcs_G...原创 2018-11-02 21:20:54 · 1391 阅读 · 0 评论 -
python-Rouge_N-评估模型的实现
引用:Rouge(Recall-Oriented Understudy for Gisting Evaluation),是评估自动文摘以及机器翻译的一组指标。它通过将自动生成的摘要或翻译与一组参考摘要(通常是人工生成的)进行比较计算,得出相应的分值,以衡量自动生成的摘要或翻译与参考摘要之间的“相似度”。ROUGE准则由一系列的评价方法组成,包括ROUGE-N(N=1、2、3、4,分别代表基于1...原创 2018-11-07 21:31:32 · 5168 阅读 · 1 评论