《机器学习算法原理与编程实践》第一章 机器学习基础 代码 错误ValueError: Masked arrays must be 1-D

本文介绍在使用NumPy和Matplotlib进行数据可视化时,遇到的MaskedArray必须为一维的错误,并提供了解决方案,即将MaskedArray转换为列表。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

《机器学习算法原理与编程实践》第一章 机器学习基础 代码错误ValueError: Masked arrays must be 1-D

mytest1.py源代码如下

// An highlighted block
#coding:utf-8
#Filename:mytest1.py

import numpy as np      #导入NumPy库
from numpy import *  #导入NumPy库
import matplotlib.pyplot as plt

#测试数据集————二维list
dataSet = [[1,2],[3,4],[5,6],[7,8],[9,10]]

dataMat = mat(dataSet).T    #将数据集转换为NumPy矩阵,并转秩
plt.scatter(dataMat[0],dataMat[1],c = 'red',marker = 'o') #绘制数据散点图

#绘制直线图形
X = np.linspace(-2,2,100)      #产生直线数据
#建立线性方程
Y = 2.8*X+9

plt.plot(X,Y)                   #绘制直线图
plt.show()                      #显示绘制效果

运行错误提示:
Traceback (most recent call last):
File “test.py”, line 12, in
plt.scatter(dataMat[0],dataMat[1],c = ‘red’,marker = ‘o’) #绘制数据散点图
File “C:\Python27\lib\site-packages\matplotlib\pyplot.py”, line 3258, in scatter
edgecolors=edgecolors, data=data, **kwargs)
File “C:\Python27\lib\site-packages\matplotlib_init_.py”, line 1819, in inner
return func(ax, *args, **kwargs)
File “C:\Python27\lib\site-packages\matplotlib\axes_axes.py”, line 3838, in scatter
x, y, s, c = cbook.delete_masked_points(x, y, s, c)
File “C:\Python27\lib\site-packages\matplotlib\cbook.py”, line 1857, in delete_masked_points
raise ValueError(“Masked arrays must be 1-D”)
ValueError: Masked arrays must be 1-D

解决办法:
将 plt.scatter(dataMat[0],dataMat[1],c = ‘red’,marker = ‘o’)
改为plt.scatter(dataMat[0].tolist(),dataMat[1].tolist(),c = ‘red’,marker = ‘o’)

运行效果:
运行效果

在文件 `100.docx` 中,代码通过生成多个字典并将其转换为 CSV 文件来创建数据集。出现 `ValueError: All arrays must be of the same length` 错误的原因是某些字典中的数组长度不一致。 具体来说,每个字典中的所有键对应的值列表必须具有相同的长度。如果某个字典中的某个键的值列表长度其他键的值列表长度不同,则会导致上述错误。 以下是一些可能导致该错误的情况: 1. **初始数据长度不一致**:例如,在 `accounts_data` 字典中,某些键的初始值列表长度可能不一致。 2. **动态添加数据时出现问题**:在 `add_data` 函数中,某些条件判断可能导致某些键没有正确地添加相同数量的数据。 ### 解决方法 1. **检查初始数据**: 确保每个字典中的初始值列表长度一致。例如: ```python accounts_data = { 'email': ['user1@example.com', 'user2@example.com'], 'password': ['password1', 'password2'], 'primary_ip_addr': ['192.168.1.1', '192.168.1.2'], 'plan_id': [1, 2], 'year': [2023, 2023], 'month': [10, 10], 'day': [1, 2], 'duration': [30, 60], 'p_location': ['New York', 'Los Angeles'] } ``` 2. **调试 `add_data` 函数**: 在 `add_data` 函数中,确保每次循环中每个键都添加了相同数量的数据。可以使用断言或打印语句来检查每一步的长度是否一致。例如: ```python def add_data(data, num=100): for i in range(num): if 'email' in data: data['email'].append(f'user{i+3}@example.com') if 'username' in data: data['username'].append(f'user{i+3}') # 其他字段... # 检查所有字段长度是否一致 lengths = set(len(v) for v in data.values()) assert len(lengths) == 1, f"Lengths are inconsistent: {lengths}" ``` 3. **验证最终数据**: 在将字典转换为 DataFrame 之前,再次检查所有字段的长度是否一致: ```python def check_lengths(data): lengths = set(len(v) for v in data.values()) assert len(lengths) == 1, f"Lengths are inconsistent: {lengths}" check_lengths(accounts_data) check_lengths(login_log_data) check_lengths(users_data) # 其他字典... # 保存为CSV文件 pd.DataFrame(accounts_data).to_csv('accounts.csv', index=False) pd.DataFrame(login_log_data).to_csv('login_log.csv', index=False) pd.DataFrame(users_data).to_csv('users.csv', index=False) # 其他CSV文件... ``` 通过以上步骤,可以确保所有字典中的数组长度一致,从而避免 `ValueError: All arrays must be of the same length` 错误
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值