利用python进行数据分析
文章平均质量分 79
cccchhh5018
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
第九章——绘图和可视化(1)
急着学plt,第8章之后学本章主要学习matplotlib和seaborn。本章用jupyter notebook。原创 2025-03-26 17:18:08 · 1295 阅读 · 0 评论 -
第七章——数据清洗和准备(2)
不必了解太多因为Pd的底层基于np,所以处理某些数值数据的缺失值时,(整数和布尔值),功能并不完备。当此类数据类型导入缺失值时,pd将数据类型转换成float64并使用np.nan来表示空值。最近pd创建了扩展类型。也可以用Int64替代pd.Int64Dtype(),即dtype='Int64'原创 2025-03-26 10:10:09 · 416 阅读 · 0 评论 -
第七章——数据清洗和准备(1)
用NaN表示缺失数据Python 内置的None值也可以作为NA(not available)原创 2025-03-23 15:11:22 · 1500 阅读 · 0 评论 -
第六章——数据加载、存储与 文件格式(1)
学了数据分析之后再看ML小项目确实清晰了一些。数据加载:读取数据并使数据可访问。解析:描述加载文本数据并将其解释为表格和不同的数据类型。原创 2025-03-21 14:53:49 · 365 阅读 · 0 评论 -
第五章——pandas入门(2)
逃避做组会PPT学一会儿。原创 2025-03-20 13:53:07 · 338 阅读 · 0 评论 -
第四章——NumPy基础:数组和向量化计算(2)
1.根据cond中的值选取xarr和yarr的值,True时选xarr,False时选yarr。使用numpy.random模块,用于从多种概率分布中,有效地生成整个样本值数组。一元func:numpy.sqrt()开方;u func是一种对ndarray中的数据执行元素级运算的函数,arr.sort(axis = 0)对每一列进行排序(1是对行)二元func:接受两个数组,并返回1个数组做结果。1——计算行上的数据;在上述方法中,布尔值会强行转为1,0。例:标准正态分布样本数组。sum可以计算1的个数。原创 2025-03-16 18:32:22 · 1621 阅读 · 0 评论 -
第五章——pandas入门(1)
主要两个Series和DataFrame。原创 2025-03-17 21:40:13 · 596 阅读 · 0 评论 -
第四章——NumPy基础:数组和向量化计算(1)
data2是列表的列表,所以NumPy数组arr2有两个维度,可以用arr2.ndim和arr.shape确定数组的维度(2)和形状(2,4)与reshape相反的过程称为扁平化或者散花,用.ravel()不生成副本和.flatten()生成副本实现。array函数接收任意序列型的对象,然后生成新的包含传入数据的NumPy数组。要从3个名字中选取两个来组合多个布尔条件,使用运算符&(与)和 |(或)shape:表示各维度大小的元组——data.shape。要选取布尔值以外的数据,可以使用!原创 2025-03-14 23:08:38 · 357 阅读 · 0 评论
分享