pandas的数据读取

最新推荐文章于 2024-06-12 21:37:01 发布

原创最新推荐文章于 2024-06-12 21:37:01 发布 · 452 阅读

2 ·

CC 4.0 BY-SA版权

大数据专栏收录该内容

10 篇文章

订阅专栏

本文介绍在Anaconda的notebook环境中，如何使用Pandas进行CSV数据的读取及处理，包括数据类型查看、数据筛选、列操作等实用技巧。

部署运行你感兴趣的模型镜像

在anaconda里面的notebook里，可以通过执行不同的cell来进行调试。

下面的cell如果要调用上面的cell变量，需要先执行上面cell的语句，通过shift+回车来实现。

我们经常需要使用处理类似csv格式的数据，利用pandas可以方便的读取该数据，常用的命令如下：

例如读取这样的csv文件：

food	price
egg	1
orange	2
rice	3
meat	4

import pandas
data = pandas.read_csv("food.csv")
print(type(data))
print(data.dtypes)       %生成每列元素的类型
print(data.head(1))      %取出头部1排
print(data.tail(2))      %取出尾部2排
print(data.columns)      %取出列名
print(data.shape)        %打印数据的行列
print(data.loc[1])       %打印index=1的数据
print(data.loc[[0,1,3]]) %打印index=0,1,3的数据
print(data["price"])     %打印列的名称为price的该列所有数据
print(data[["food","price"]])  


columns_name = data.columns.tolist()
gend_data = []
for i in columns_name:
    if i.endwith("g"):
        gend_data.append(i)
print(gend_data.head(3))

print(data["price"]/1000)   %打印所有price列除以1000
price_qy = data["price"]/1000  %处理完后添加进原数组中
data["price_qy"] = price_qy
print(data.shape)

您可能感兴趣的与本文相关的镜像