25、基于LDA和LSA的语义相似度度量实验及MDL模型的音译生成研究

Alpha

于 2025-07-13 09:22:36 发布

阅读量35

点赞数

CC 4.0 BY-SA版权

分类专栏：解读《SLSP 2013》：统计语言与语音处理的新视角文章标签： LDA LSA 语义相似度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/alpha/article/details/149645913

解读《SLSP 2013》：统计语言与语音处理的新视角专栏收录该内容

37 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

基于LDA和LSA的语义相似度度量实验及MDL模型的音译生成研究

在自然语言处理领域，语义相似度度量和机器音译是两个重要的研究方向。本文将为大家介绍基于LDA（Latent Dirichlet Allocation）和LSA（Latent Semantic Analysis）的语义相似度度量实验，以及基于最小描述长度原则（MDL）的音译生成模型。

基于LDA和LSA的语义相似度度量实验

实验结果 ：通过对ULPC和MSRP测试数据的实验，对比了不同主题数量（T=100和T=300）下基于LDA的多种方法和基于LSA的方法。结果表明，最佳的基于LDA的方法可与基于LSA的方法相媲美。具体数据如下表所示：
| Method | Accuracy/Kappa/F-measure (T=300) (ULPC) | Accuracy/Kappa/F-measure (T=100) (ULPC) | Accuracy/Kappa/F-measure (T=300) (MSRP) | Accuracy/Kappa/F-measure (T=100) (MSRP) |
| — | — | — | — | — |
| LDA-IR | 71.17/16.17/81.94 | 68.24/3.09/80.92 | 67.47/4.52/79.87 | 67.01/3.15/79.98 |
| LDA-Hellinger | 71.32/18.85/81.75 | 68.24/2.46/80.99 | 67.36/4.39/79.73 | 67.18/3.50/80.04 |
| LDA-Manhattan | 71.0

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。