15、声音匹配:捕捉语言原始元素中的复用

声音匹配:捕捉语言原始元素中的复用

1. 计算声音特征空间中的相对距离

在评估文学作品之间的影响时,距离的测量是一种定量评估的有效方式。若两位作家在声音特征空间中的距离较小,那么可以认为他们具有一些共同特征;反之,若距离较大,则表明他们之间几乎不存在语音关系。

以Cowper的《The Task》第六卷和Wordsworth的《The Prelude》第二卷为例,这两本书在词汇和语义上有一定的共性,因此推测它们在语音上也存在关联。为了计算二者在多维空间中的距离,需要先得到特征向量。

以下是计算Cowper的《The Task》第六卷特征向量的代码:

source("functionalNgramGenerator.R")
cowper.6 <- readLines("../data/cowper/cowper.task.part.6")
bigrams <- functionalNgramGenerator(cowper.6, 2, 5)
cat(bigrams,sep="\n")
## 1123 th 0.496683
## 950 he 0.483953
## 682 an 0.261203
## 591 in 0.270604
## 529 re 0.305780
cowper.6.v <- c(0.496683, 0.483953, 0.261203, 0.270604, 0.305780)

在多维向量空间中,常用欧几里得距离来衡量两点之间的距离。其公式为:
[d(p,q) = d(q, p) = \sqrt{\sum_{i=1}^{n

01、数据简介 规模以上工业企业,是指年主营业务收入达到一定规模的工业法人单位。这一标准由国家统计局制定,旨在通过统一口径筛选出对工业经济具有显著贡献的“核心企业”,为政策制定、经济监测和学术研究提供精准数据支撑。 数据名称:地级市-规模以上工业企业相关数据 数据年份:2000-2024年 02、相关数据 原始数据:年份 省份 城市 省份代码 城市代码 规模以上工业企业单位数(个) 规模以上工业增加值增速(%) 规模以上工业企业单位数_内资企业(个) 规模以上工业企业单位数_港澳台商投资企业(个) 规模以上工业企业单位数_外商投资企业(个) 规模以上工业亏损企业单位数(个) 插值:年份 省份 城市 省份代码 城市代码 规模以上工业企业单位数(个) 规模以上工业企业单位数(个)_线性插值 规模以上工业企业单位数(个)_回归填补 规模以上工业增加值增速(%) 规模以上工业增加值增速(%)_线性插值 规模以上工业增加值增速(%)_回归填补 规模以上工业企业单位数_内资企业(个) 规模以上工业企业单位数_内资企业(个)_线性插值 规模以上工业企业单位数_内资企业(个)_回归填补 规模以上工业企业单位数_港澳台商投资企业(个) 规模以上工业企业单位数_港澳台商投资企业(个)_线性插值 规模以上工业企业单位数_港澳台商投资企业(个)_回归填补 规模以上工业企业单位数_外商投资企业(个) 规模以上工业企业单位数_外商投资企业(个)_线性插值 规模以上工业企业单位数_外商投资企业(个)_回归填补 规模以上工业亏损企业单位数(个) 规模以上工业亏损企业单位数(个)_线性插值 规模以上工业亏损企业单位数(个)_回归填补
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值