pandas的基本使用方法

最新推荐文章于 2025-06-22 22:54:52 发布

原创

最新推荐文章于 2025-06-22 22:54:52 发布 · 1.3k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

这篇博客主要介绍了pandas模块的基础使用，包括数据读取、数据清洗和数据分析等核心功能。通过学习，读者可以掌握pandas在数据分析中的基本应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文用于学习pandas模块的基本使用方法！！！

from pandas import *
#import pandas as pd
import numpy as np


#读取csv、xlsx文件,获得DataFrame数据结构
#data = pd.read_csv('filename.csv',header=None)
#data = pd.read_excel('filename.xlsx')

#将DataFrame数据结构保存为csv文件
#data.to_csv('filename.csv',header=None,index=False)

'''
数据结构:Series
Series:由numpy数据类型和与之对应的索引组成
'''
#创建Series数据结构
obj = Series([3,2,1])
print(obj)

#获得Series数据结构对象的数据和索引
print(obj.values)
print(obj.index)

#获得唯一值组成的数组
print(obj.unique())

#获得各值出现的频率
print(obj.value_counts())

#判断缺失数据 True表示缺失
obj = Series([1,np.nan,2,np.nan,3,np.nan])

print(obj.isnull())
print(isnull(obj))
print(notnull(obj))
print(obj.notnull())

#删除缺失值
print(obj.dropna())
print(obj[obj.notnull()])

#对数据标记索引
obj = Series([1,2,3,4],index=['a','b','c','d'])
#通过索引的方式获取值
print(obj['a'])

#根据新索引重排，如果索引值不存在，引入Nan
print( obj.reindex(['e','d','c','b','a']) )

#设置缺失值为0
print( obj.reindex(['e','d','c','

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄7年

57
原创

244
点赞

1547
收藏

185
粉丝

关注

私信

分类专栏

C++ 5篇
OpenCV 3篇
迁移学习 8篇
Python 4篇
数据结构 7篇
随记 4篇
机器学习 10篇
计算机视觉 14篇
笔试&面试 2篇

展开全部收起

上一篇：: python中各种格式的文件读取和保存(csv, txt, xlsx, 图片)

下一篇：: matplotlib的基本使用方法(点线图、散点图、柱状图、多窗口)

最新评论

源领域和目标领域过程相似性分析
zhndsb: 我想请问一下，如果我有多个与目标域相似的源域，那么去度量不同源域与目标域之间的相似性从而选取源域，这一问题是否有价值
神经网络算法(基于Tensorflow、基于Python实现BP)
飞飞鱼_: 数据集在哪里呢？
计算不规则四边形(多边形)的面积
hfliu96: 你好，海伦公式部分有错，本人修正如下[code=python]# 基于海伦公式计算不规则四边形的面积 def helen_formula(coord): coord = np.array(coord).reshape((4, 2)) # 计算各边的欧式距离 dis_01 = cal_distance(coord[0], coord[1]) dis_12 = cal_distance(coord[1], coord[2]) dis_23 = cal_distance(coord[2], coord[3]) dis_30 = cal_distance(coord[3], coord[0]) dis_13 = cal_distance(coord[1], coord[3]) p1 = (dis_01 + dis_13 + dis_30) * 0.5 p2 = (dis_12 + dis_23 + dis_13) * 0.5 # 计算两个三角形的面积 area1 = np.sqrt(p1 * (p1 - dis_01) * (p1 - dis_13) * (p1 - dis_30)) area2 = np.sqrt(p2 * (p2 - dis_12) * (p2 - dis_23) * (p2 - dis_13)) return area1 + area2 [/code]
C++结构体的各种用法
WiserX: p point =&stu1;这句我的编译器报错
AdaBoost.M1算法
dreamfly844: 更新权重这里貌似应该更新正确分类的权重

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。