python矩阵最优化_用numpy计算成对互信息的最优方法

这篇博客探讨了如何优化计算大型矩阵中所有列对的互信息过程。目前使用嵌套for循环结合numpy的histogram2d和histogram函数,但寻求更快的方法。文章还包含了calc_MI函数的实现,并询问了映射函数到矩阵列的可能性以及是否存在更好的互信息计算实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

对于m x n矩阵,计算所有列对的互信息的最佳(最快)方法是什么(nxn)?I(X, Y) = H(X) + H(Y) - H(X,Y)

其中,H(X)是指X的香农熵。

目前我使用np.histogram2d和np.histogram计算关节(X,Y)和个体(X或Y)计数。对于给定的矩阵A(例如250000x 1000个浮点矩阵),我正在做一个嵌套的for循环n = A.shape[1]

for ix = arange(n)

for jx = arange(ix+1,n):

matMI[ix,jx]= calc_MI(A[:,ix],A[:,jx])

当然,必须有更好/更快的方法来做到这一点?

另外,我也在数组的列(按列或按行操作)上寻找映射函数,但还没有找到一个好的通用答案。

下面是我的完整实现,遵循the Wiki page中的约定:import numpy as np

def calc_MI(X,Y,bins):

c_XY = np.histogram2d(X,Y,bins)[0]

c_X = np.histogram(X,bins)[0]

c_Y = np.histogram(Y,bins)[0]

H_X = shan_entropy(c_X)

H_Y = shan_entropy(c_Y)

H_XY = shan_entropy(c_XY)

MI = H_X + H_Y - H_XY

return MI

def shan_entropy(c):

c_normalized = c / float(np.sum(c))

c_normalized = c_normalized[np.nonzero(c_normalized)]

H = -sum(c_normalized* np.log2(c_normalized))

return H

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值