在anaconda里面的notebook里,可以通过执行不同的cell来进行调试。
下面的cell如果要调用上面的cell变量,需要先执行上面cell的语句,通过shift+回车来实现。
我们经常需要使用处理类似csv格式的数据,利用pandas可以方便的读取该数据,常用的命令如下:
例如读取这样的csv文件:
| food | price |
| egg | 1 |
| orange | 2 |
| rice | 3 |
| meat | 4 |
import pandas
data = pandas.read_csv("food.csv")
print(type(data))
print(data.dtypes) %生成每列元素的类型
print(data.head(1)) %取出头部1排
print(data.tail(2)) %取出尾部2排
print(data.columns) %取出列名
print(data.shape) %打印数据的行列
print(data.loc[1]) %打印index=1的数据
print(data.loc[[0,1,3]]) %打印index=0,1,3的数据
print(data["price"]) %打印列的名称为price的该列所有数据
print(data[["food","price"]])
columns_name = data.columns.tolist()
gend_data = []
for i in columns_name:
if i.endwith("g"):
gend_data.append(i)
print(gend_data.head(3))
print(data["price"]/1000) %打印所有price列除以1000
price_qy = data["price"]/1000 %处理完后添加进原数组中
data["price_qy"] = price_qy
print(data.shape)
本文介绍在Anaconda的notebook环境中,如何使用Pandas进行CSV数据的读取及处理,包括数据类型查看、数据筛选、列操作等实用技巧。
443

被折叠的 条评论
为什么被折叠?



