23、类型III隐喻检测与印地语句子情感多类分类研究

类型III隐喻检测与印地语句子情感多类分类研究

类型III隐喻检测

在类型III隐喻检测的研究中,选取了五种不同的技术,分别为线性支持向量机(LSVM)、径向支持向量机(RSVM)、逻辑回归(LR)、随机森林(RF)和单层神经网络(NN)。

数据集

目前有两个公开可用的类型III隐喻数据集,分别由Tsvetkov等人和Guitiérrez等人提供,具体信息如下表所示:
| 数据集 | #形容词 | 隐喻 | 字面义 | 总数 |
| — | — | — | — | — |
| Tsvetkov等人 | 405 | 884 + 100 | 884 + 100 | 1768 + 200 |
| Guitiérrez等人 | 23 | 4601 | 3991 | 8592 |
| Dataset3 | 409 | 5485 + 100 | 4875 + 100 | 10360 + 200 |

Tsvetkov等人的数据集有1768个训练实例和200个测试实例,包含405个不同的形容词;Guitiérrez等人的数据集虽只有23个不同形容词,但有8592个样本,能为每个<形容词, 名词>对提供足够的建模案例。还将这两个数据集合并创建了Dataset3,用于测试不同模型的效果。

模型实现与评估

使用Python v2.7和Scikit库实现类型III隐喻检测的分类器。对于LSVM、RSVM、LR和RF,使用默认的调优参数;对于神经网络,采用Bizzoni等人提出的第一种架构,并使用TensorFlow和Keras实现。特征集由解析后的(形容词,名词)对的预训练3

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值