caption和translation重要评价指标:(BLEU,METEOR,ROUGE,CIDEr)
BLEU:最开始是用于机器翻译中,思想很是naive,对于一个给定的句子,有标准S1,还有一个神经网络翻译的句子S2。BLEU的思想就是对于机器翻译S2的所有短语,看有多少出现在S1中,BLEU就是其比率。首先根据n-gram划分一个短语包含单词的数量,有BLEU-1,BLEU-2,BLEU-3,BLEU-4.分别就是把文章划分为长度为1个单词的短语,长度为2个的短语。。。然后统计它们出现在标准译文中的个数,再分贝除以划分总数,就是对应的BLEU-1分数,BLEU-2分数。。。其实就是准确率。看这些划分中
原创
2021-03-11 22:40:20 ·
1306 阅读 ·
0 评论