避坑：np.logical_and()不报错，但是结果全0

一只菜得不行的鸟

已于 2023-01-05 23:17:29 修改

阅读量728

点赞数 2

分类专栏：机器学习 python 文章标签： python numpy

于 2022-10-12 17:17:13 首次发布

本文链接：https://blog.youkuaiyun.com/qq_40967086/article/details/127285748

版权

python 同时被 2 个专栏收录

35 篇文章

订阅专栏

机器学习

11 篇文章

订阅专栏

阅读前请看一下：我是一个热衷于记录的人，每次写博客会反复研读，尽量不断提升博客质量。文章设置为仅粉丝可见，是因为写博客确实花了不少精力。希望互相进步谢谢！！

文章目录

阅读前请看一下：我是一个热衷于记录的人，每次写博客会反复研读，尽量不断提升博客质量。文章设置为仅粉丝可见，是因为写博客确实花了不少精力。希望互相进步谢谢！！
问题描述
原因分析
解决方案1
解决方案2
总结：

问题描述

function：np.logical_and()函数

bug：机器学习时算混淆矩阵TP、FP、FN、TN时，想对传入的连个array里面先分布进行每个元素值的判断，再进行and操作，不报错但结果分别为0

code：

import numpy as np
train_set_y     = [0,1,0,1,1,1,0]                #训练集样本标注
train_predict_y = [0,1,0,1,1,1,1]                #训练集预测标注

TP = np.sum(np.logical_and(train_set_y==1, train_predict_y_class==1))    
FP = np.sum(np.logical_and(train_set_y==0, train_predict_y_class==1))
FN = np.sum(np.logical_and(train_set_y==1, train_predict_y_class==0))
TN = np.sum(np.logical_and(train_set_y==0, train_predict_y_class==0))
print(f'TP = {TP}, FP = {FP}, TN = {TN}, FN = {FN}')

output：

TP = 0, FP = 0, TN = 0, FN = 0

很明显结果不对，这里明显结果应该为：

TP = 4, FP = 1, TN = 2, FN = 0

原因分析

打印调试后：

import numpy as np
train_set_y     = [0,1,0,1,1,1,0]                #训练集样本标注
train_predict_y = [0,1,0,1,1,1,1]                #训练集预测标注

TP = np.sum(np.logical_and(train_set_y==1, train_predict_y==1))
print(np.logical_and(train_set_y==1, train_predict_y==1))  

FP = np.sum(np.logical_and(train_set_y==0, train_predict_y==1))
print(np.logical_and(train_set_y==0, train_predict_y==1))  

FN = np.sum(np.logical_and(train_set_y==1, train_predict_y==0))
print(np.logical_and(train_set_y==1, train_predict_y==0))  

TN = np.sum(np.logical_and(train_set_y==0, train_predict_y==0))
print(np.logical_and(train_set_y==0, train_predict_y==0))  
print(f'TP = {TP}, FP = {FP}, TN = {TN}, FN = {FN}')

output：

False
False
False
False
TP = 0, FP = 0, TN = 0, FN = 0

分析：

这里每次np.logical_and（）执行后竟然只有一个False；问题就在这里：
因为train_set_y、train_predict_y类型都是list，自然没法==1。
盲猜是因为list != int

解决方案1

官网文档：
在这里插入图片描述

可以看到里面除了传list以外，还可以传ndarray

关于list 和 ndarray 分不清的，可以看之前我的另一篇：《Numpy及list与array对比》

解决办法：

不传list，传ndarray

故代码如下：

import numpy as np
train_set_y     = np.array([0,1,0,1,1,1,0])                #训练集样本标注
train_predict_y = np.array([0,1,0,1,1,1,1])                #训练集预测标注

TP = np.sum(np.logical_and(train_set_y==1, train_predict_y==1))
print(np.logical_and(train_set_y==1, train_predict_y==1))  

FP = np.sum(np.logical_and(train_set_y==0, train_predict_y==1))
print(np.logical_and(train_set_y==0, train_predict_y==1))  

FN = np.sum(np.logical_and(train_set_y==1, train_predict_y==0))
print(np.logical_and(train_set_y==1, train_predict_y==0))  

TN = np.sum(np.logical_and(train_set_y==0, train_predict_y==0))
print(np.logical_and(train_set_y==0, train_predict_y==0))  
print(f'TP = {TP}, FP = {FP}, TN = {TN}, FN = {FN}')

output：

[False  True False  True  True  True False]
[False False False False False False  True]
[False False False False False False False]
[ True False  True False False False False]
TP = 4, FP = 1, TN = 2, FN = 0

可见结果争取了。那为何传ndarray就可以了呢？

还记得numpy的广播操作吗。盲猜这里一定是把==1中的1 广播成具有相同维度的ndarray，从而实现每个元素是否==1的判断

解决方案2

那非要传入list怎么办呢，那就不用numpy的函数，直接暴力for循环呗：

import numpy as np
train_set_y     = [0,1,0,1,1,1,0]                #训练集样本标注
train_predict_y = [0,1,0,1,1,1,1]                #训练集预测标注

TP = 0
FP = 0
FN = 0
TN = 0
for i,j in zip(train_set_y, train_predict_y):    #这里传入的是list，当然传入ndarray也可以
    if i==1 and j==1:
        TP += 1
    elif i==0 and j==1:
        FP += 1
    elif i==1 and j==0:
        FN += 1
    elif i==0 and j==0:
        TN += 1

print(f'TP = {TP}, FP = {FP}, TN = {TN}, FN = {FN}')