python预测第一步-了解数据集

本文展示了如何使用Pandas库在Python中分析数据集,包括使用`info()`函数获取数据属性,`columns`查看列名,以及`value_counts()`统计属性值分布,用于初步的数据探索和预处理阶段。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、查看数据集的特征信息:info( )

#导入所需库
import pandas as pd
import numpy as np

#导入数据
data = pd.read_csv('Salary Data.csv')
print(data.info())

先导入数据,用info()函数查看数据属性的具体信息:数据集行数、属性列编号、属性名、非空列数、数据类型。导入工资预测数据集(https://www.datacastle.cn/dataset_description.html?type=dataset&id=2519),运行结果如下:

RangeIndex: 375 entries, 0 to 374
Data columns (total 6 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   Age                  373 non-null    float64
 1   Gender               373 non-null    object 
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值